【Haskell】Do-notation的正经定义

758 阅读3分钟

本文已参与「新人创作礼」活动,一起开启掘金创作之路

在Haskell中,Monad可以说是最常用的语法。在Haskell中,第一次接触Monad基本上是IO操作。通过打包IO操作,我们可以轻松地与现实世界交换数据。但事实上,Monad不仅仅是这样。Monad还可以讨论一系列操作的序列化,这在正常编程中是非常必要的。在Haskell中,类似的事情是通过递归完成序列化工作。但事实上,Haskell还有一种顺序运算的方法,那就是do-语法。Haskell编程者往往是永远在用do,但永远记不得do作为一个语法糖,对应的真实语法是什么。因此,写一篇博文记一下。

首先理解一下Monad的概念。Monad的定义是这样的:

class Monad m where
    return :: a -> m a
    fail :: String -> m a
    (>>=) :: m a -> (a -> m b) -> m b
    (>>) :: m a -> m b -> m b

return标志着一次成功的计算,即是讲将一个函数执行的action包裹成Monad类型,对应一次computation(一次计算,代表一次顺利的操作。

fail代表一个失败的操作,输入的字符串是这次失败的提示信息,返回类型同样是包裹成计算的action,但其本质是失败的,除了错误信息,不包含任何内容。

(>>=),即bind,取两个参数,第一个是之前的操作m a,第二个是一个能将action变成新的action(而且是用Monad包裹的)的函数,这其实就是将操作序列化。

(>>),即combine,取两个参数,第一个是之前的操作m a,我们忽略这个操作的输出,然后直接执行一个新的操作m b,并将这个操作返回。

然后我们来看一下标准的do-语法与Haskell里的正规语法的对应:

-- | ----------------------------------------------------
-- | (1) do { m1 } ==> m1
-- | (2) do { m1; m2 } ==> m1 >> do { m2 }
-- | (3) do { let s1; m1 s1 } ==> let s1 in do { m1 s1 }
-- | (3’) do { let s1; m1 s1 } ==> do { m1 s1 } where s1
-- | (4) do { x <- m1; m2 x } ==> m1 >>= (\x -> do { m2 x } )
-- | (5) do { x <- m1; let s = f x; m2 s } ==> do { s <- f <$> m1; m2 s }
-- | (6) do { x <- m1; y <- m2; let s = f x y; m3 s } ==> do { s <- f <$> m1 <*> m2; m3 s }
-- | (7) let s1; let s2 ==> let (s1; s2)
-- | (8) (\x -> f x) ==> f
-- | ----------------------------------------------------

其中的前六条就是do-语法糖的标准定义,在这里就是记下来备忘的。简单来说,有三种情况:

  • 单独的表达式,可以理解成执行相应内容,但不保留结果。
  • <-表达式,可以理解成把套Monad的值赋给箭头左边的名字,但此名字在使用时可以视为纯值。
  • let表达式,可以理解为正常的let-in表达式。
  • 最后:最后一行是返回值,决定了返回的是谁,类型是什么。

另外,如果用大括号控制do的范围,记得在每句话后加分号。而如果用缩进来控制,let有时会出现一些玄学问题,这是Haskell在实现时,多字母关键字(比如let,where等)面临的一个通病。建议少用let而多用let-in或其他方式。如果用let的话,下一行及之后的缩进要比let还深。