【Haskell】Do-notation的正经定义本文已参与「新人创作礼」活动，一起开启掘金创作之路在Haskell中

本文已参与「新人创作礼」活动，一起开启掘金创作之路

在Haskell中，Monad可以说是最常用的语法。在Haskell中，第一次接触Monad基本上是IO操作。通过打包IO操作，我们可以轻松地与现实世界交换数据。但事实上，Monad不仅仅是这样。Monad还可以讨论一系列操作的序列化，这在正常编程中是非常必要的。在Haskell中，类似的事情是通过递归完成序列化工作。但事实上，Haskell还有一种顺序运算的方法，那就是do-语法。Haskell编程者往往是永远在用do，但永远记不得do作为一个语法糖，对应的真实语法是什么。因此，写一篇博文记一下。

首先理解一下Monad的概念。Monad的定义是这样的：

class Monad m where
    return :: a -> m a
    fail :: String -> m a
    (>>=) :: m a -> (a -> m b) -> m b
    (>>) :: m a -> m b -> m b

return标志着一次成功的计算，即是讲将一个函数执行的action包裹成Monad类型，对应一次computation（一次计算，代表一次顺利的操作。

fail代表一个失败的操作，输入的字符串是这次失败的提示信息，返回类型同样是包裹成计算的action，但其本质是失败的，除了错误信息，不包含任何内容。

(>>=)，即bind，取两个参数，第一个是之前的操作m a，第二个是一个能将action变成新的action（而且是用Monad包裹的）的函数，这其实就是将操作序列化。

(>>)，即combine，取两个参数，第一个是之前的操作m a，我们忽略这个操作的输出，然后直接执行一个新的操作m b，并将这个操作返回。

然后我们来看一下标准的do-语法与Haskell里的正规语法的对应：

-- | ----------------------------------------------------
-- | (1) do { m1 } ==> m1
-- | (2) do { m1; m2 } ==> m1 >> do { m2 }
-- | (3) do { let s1; m1 s1 } ==> let s1 in do { m1 s1 }
-- | (3’) do { let s1; m1 s1 } ==> do { m1 s1 } where s1
-- | (4) do { x <- m1; m2 x } ==> m1 >>= (\x -> do { m2 x } )
-- | (5) do { x <- m1; let s = f x; m2 s } ==> do { s <- f <$> m1; m2 s }
-- | (6) do { x <- m1; y <- m2; let s = f x y; m3 s } ==> do { s <- f <$> m1 <*> m2; m3 s }
-- | (7) let s1; let s2 ==> let (s1; s2)
-- | (8) (\x -> f x) ==> f
-- | ----------------------------------------------------

其中的前六条就是do-语法糖的标准定义，在这里就是记下来备忘的。简单来说，有三种情况：

单独的表达式，可以理解成执行相应内容，但不保留结果。
<-表达式，可以理解成把套Monad的值赋给箭头左边的名字，但此名字在使用时可以视为纯值。
let表达式，可以理解为正常的let-in表达式。
最后：最后一行是返回值，决定了返回的是谁，类型是什么。

另外，如果用大括号控制do的范围，记得在每句话后加分号。而如果用缩进来控制，let有时会出现一些玄学问题，这是Haskell在实现时，多字母关键字（比如let，where等）面临的一个通病。建议少用let而多用let-in或其他方式。如果用let的话，下一行及之后的缩进要比let还深。