因果关系是一个非常有趣的研究主题,但是直到最近人们才开始使用数学的方法来进行研究,目前仍然有许多概念性的问题处于激烈的讨论中。
这本书总结了作者花费十年时间研究因果关系的成果,当然也有其他人在此领域研究的时间比作者更长,并且已经也出版了一些关于因果关系的书籍,例如Pearl,Spirtes,以及Imbens和Rubin 等人的著作。作者希望这本书能够在两个方面补充现有的工作。
首先,这本书阐述了可能被认为是最基本和最不现实的因果关系子问题,也就是所分析的系统仅包含两个观察对象。在过去的十年中,作者已经对这个问题进行了详细的研究。这本分将阐述他们所做的大部分工作,另外作者希望尝试将其纳入更大的,获得对因果关系问题深刻理解的背景之下。尽管按照这本书的章节顺序,先看看双变量案例可能会更有启发性,但其实我们也可以直接开始阅读多元变量的章节。
另外,作者受到了机器学习和计算统计学领域的激励和影响。他们对其中可以帮助推断因果结构的方法,甚至因果关系推理可以如何指导我们研究机器学习这两方面都非常感兴趣。而且,作者感觉到一些最深刻的机器学习开放问题是最好的理解并不是利用概率分布下的随机实验作为出发点,而是基于分布背后的因果结构。
作者试图对这一主题进行系统性的介绍,以便于熟悉概率论和统计学或机器基础知识的读者。
为了使这本书便于阅读,并侧重于概念问题,作者被迫只能用很小的篇幅来阐述因果关系中的一些重要问题,而是把重点放在对特定设置以及各种具有实际重要性的方法的理论见解上。
另外,作者说他们的书有许多缺点。 其中一些是从领域继承的,例如理论结果往往被限制在有无限数量的数据的情况下。 虽然有算法是针对有限数据的情况,但作者并没有讨论这些方法的统计特性。 此外,在某些地方,作者忽略了测量理论问题,通常是通过假设密度的存在。 虽然作者认为这些问题都是相关的并且有趣,但他们为了保持书的简短,并考虑到观众的广泛性,不得不做此选择。
作者认为计算因果关系方法还处于起步阶段,特别是,从数据中学习因果结构只有在相当有限的情况下才能做到。作者试图尽可能包括具体的算法,但是他们也意识到,因果推理的许多问题比典型的机器学习问题更难解决,因此,作者并没有承诺这些算法是否会对我们遇到的实际问题起作用。
好吧,大家都希望一本书或者一篇文章能直接告诉我们遇到问题时应该如何解决。但是当遇到复杂的问题,现实却往往是,作者们也不知道该怎么办,他们只能提供自己探索和研究的思路,所以,这本书作者说请不要气馁,这是一个迷人的学科。