本文已参与「新人创作礼」活动,一起开启掘金创作之路
在Haskell中,Monad可以说是最常用的语法。在Haskell中,第一次接触Monad基本上是IO操作。通过打包IO操作,我们可以轻松地与现实世界交换数据。但事实上,Monad不仅仅是这样。Monad还可以讨论一系列操作的序列化,这在正常编程中是非常必要的。在Haskell中,类似的事情是通过递归完成序列化工作。但事实上,Haskell还有一种顺序运算的方法,那就是do-语法。Haskell编程者往往是永远在用do,但永远记不得do作为一个语法糖,对应的真实语法是什么。因此,写一篇博文记一下。
首先理解一下Monad的概念。Monad的定义是这样的:
class Monad m where
return :: a -> m a
fail :: String -> m a
(>>=) :: m a -> (a -> m b) -> m b
(>>) :: m a -> m b -> m b
return标志着一次成功的计算,即是讲将一个函数执行的action包裹成Monad类型,对应一次computation(一次计算,代表一次顺利的操作。
fail代表一个失败的操作,输入的字符串是这次失败的提示信息,返回类型同样是包裹成计算的action,但其本质是失败的,除了错误信息,不包含任何内容。
(>>=),即bind,取两个参数,第一个是之前的操作m a,第二个是一个能将action变成新的action(而且是用Monad包裹的)的函数,这其实就是将操作序列化。
(>>),即combine,取两个参数,第一个是之前的操作m a,我们忽略这个操作的输出,然后直接执行一个新的操作m b,并将这个操作返回。
然后我们来看一下标准的do-语法与Haskell里的正规语法的对应:
-- | ----------------------------------------------------
-- | (1) do { m1 } ==> m1
-- | (2) do { m1; m2 } ==> m1 >> do { m2 }
-- | (3) do { let s1; m1 s1 } ==> let s1 in do { m1 s1 }
-- | (3’) do { let s1; m1 s1 } ==> do { m1 s1 } where s1
-- | (4) do { x <- m1; m2 x } ==> m1 >>= (\x -> do { m2 x } )
-- | (5) do { x <- m1; let s = f x; m2 s } ==> do { s <- f <$> m1; m2 s }
-- | (6) do { x <- m1; y <- m2; let s = f x y; m3 s } ==> do { s <- f <$> m1 <*> m2; m3 s }
-- | (7) let s1; let s2 ==> let (s1; s2)
-- | (8) (\x -> f x) ==> f
-- | ----------------------------------------------------
其中的前六条就是do-语法糖的标准定义,在这里就是记下来备忘的。简单来说,有三种情况:
- 单独的表达式,可以理解成执行相应内容,但不保留结果。
<-表达式,可以理解成把套Monad的值赋给箭头左边的名字,但此名字在使用时可以视为纯值。let表达式,可以理解为正常的let-in表达式。- 最后:最后一行是返回值,决定了返回的是谁,类型是什么。
另外,如果用大括号控制do的范围,记得在每句话后加分号。而如果用缩进来控制,let有时会出现一些玄学问题,这是Haskell在实现时,多字母关键字(比如let,where等)面临的一个通病。建议少用let而多用let-in或其他方式。如果用let的话,下一行及之后的缩进要比let还深。