《Machine Learning for Humans》第一章:为什么机器学习至关重要

386 阅读12分钟
作者:Vishal Maini 编译:Bot

目录

第一章 为什么机器学习至关重要。 本章描绘了人工智能和机器学习的发展全貌——从过去到现在,再到未来。

第二章 监督学习(一)。 本章通过例题介绍了线性回归、损失函数、过拟合和梯度下降。

第三章 监督学习(二)。 本章介绍了两种分类方法:逻辑回归和SVM。

第四章 监督学习(三)。 本章介绍了非参数方法:k近邻估计、决策树、随机森林。以及交叉验证、超参数调整和集成模型的相关知识。

第五章 无监督学习。 本章介绍了聚类:K-means、层次聚类;降维:主成分分析(PCA)、奇异值分解(SVD)。

第六章 神经网络与深度学习。 本章介绍了深度学习的工作原理、应用领域和实现方法,并回顾了神经网络是如何从人类大脑中汲取灵感的。此外,本章还涉及卷积神经网络(CNN)、递归神经网络(DNN)以及神经网络应用案例等内容。

第七章 强化学习。 本章介绍了强化学习的Exploration和Exploitation(探索-利用),包括马尔可夫决策过程、Q-learning、策略学习和深度强化学习。

附录: 最佳机器学习资源。 一份用于学习机器学习的资源清单。

前言

Machine Learning for Humans是国外机器学习爱好者之间流传甚广的一本电子书,它最先是Medium上的连载文章,后因文章质量出众、阅读价值高,作者在建议下把文章整理成电子书,供读者免费阅读。本书的作者Vishal Maini是耶鲁大学的文学学士,目前已入职DeepMind;另一名作者Samer Sabri同样毕业于耶鲁大学,目前正在加州大学圣迭戈分校的计算机学院攻读硕士学位。

哪些人应该读一读?

  • 希望快速跟上机器学习发展潮流的开发者;

  • 希望掌握机器学习入门知识并参与技术开发的普通读者;

  • 所有对机器学习感兴趣的读者。

本书向所有人免费开放阅读。书中虽然会涉及概率论、统计学、程序设计、线性代数和微积分等基础知识,但没有数学基础的读者也能从中获得启发。

本书旨在帮助读者在2—3个小时内迅速掌握机器学习高级概念,如果您想得到更多关于线上课程、重要书籍、相关项目等方面的内容,请参考附录中的建议。

第一章 为什么机器学习至关重要

比起本世纪的其他创新,人工智能将在塑造人类未来中发挥更大的作用。现在,如果你还不了解人工智能,你可能就正在逐渐落后于时代,身处这样一个充满AI的世界,有时我们也会心生疑惑——这是技术?亦或是魔幻?

人工智能的加速发展势头是令人震惊的。在过去的四十年中,它经历了数次寒冬,也曾给人们带来虚假的希望。但这一次,伴随着近年来数据存储和计算机处理能力的飞速提升,情况发生了戏剧性的改变。

2015年,Google训练了一个会话智能体(AI),它不仅能充当咨询服务台,通过自然真实的语言交流为顾客提供技术服务,还能和人谈论道德、表达观点,并回答一些基于事实的一般问题。

A Neural Conversational Model

同年,DeepMind开发了一个强化学习智能体,它只需把像素图像和游戏得分作为输入,就能在49款雅达利游戏中超越人类玩家的表现。不久后,就在2016年,DeepMind发布了一种名为A3C的全新深度强化学习方法,又一次刷新了自己创下的记录。

与此同时,AlphaGo将围棋顶尖高手斩于马下,这是继二十年前超级计算机首次击败国际象棋世界冠军后,人类在棋类领域取得的又一个非凡成就。许多大师到现在都无法理解,一台机器是如何掌握这个中国传统战争策略游戏的完整细节和复杂性的,要知道围棋的变化约有10170种,比宇宙中的原子总数1080还要高出几十个数量级。

落败的韩国顶级围棋选手李世石

2017年3月,OpenAI训练的智能体自己开发了一种新语言,并在合作中更高效地达成了目标。之后,Facebook的智能体甚至还学会了谈判和撒谎……而就在本书开始撰写(2017年8月)的几天前,OpenAI的智能体又在多人在线战术竞技游戏Dota2中击败了世界顶级选手,称得上是又一里程碑。

Dendi(人类)与OpenAI(bot)对线

事实上,人工智能也正在改变我们的日常生活。当你下次去台湾旅行时,记得把手机摄像头对准中文菜单,Google的翻译App能实时把繁体汉字转成英语。

Google Translate用卷积神经网络实时翻译文字

人工智能也可以被应用到医学领域,为癌症患者设计循证治疗方法,或是帮助临床医生分析医学检测结果,甚至直接参与药物研发。

AI公司BenevolentAI的大胆宣言

机器正在接手一些传统意义上的人类职务。当你下次呼叫酒店服务让他们为你送点牙膏过来时,如果开门看到的不是人而是服务机器人,千万不要大惊失色。

本书将探讨这些技术背后的核心机器学习概念。阅读完毕后,我们希望你能自己描述这些技术的实现方式,并已具备初级的构建类似应用程序的能力。

语义树:人工智能和机器学习

一点小建议:当你新接触一种知识时,你可以先把它看成一棵语义树——你得先掌握它的基础理念,就像树干和粗壮的树枝,之后再慢慢深入树叶(细节),看看那上面有没有其他东西。——Elon Musk

机器学习是人工智能诸多子领域中的一个

人工智能是一项围绕智能体的研究,它们感知周围环境、制定策略并做出决定以实现自己的目标。它涉及数学、逻辑学、哲学、概率学、语言学、神经科学、决策论等多个领域,许多技术都属于人工智能范畴,如计算机视觉、机器人学、机器学习和自然语言处理。

机器学习只是人工智能的一个子领域。它的目标是让计算机学会自己学习。机器学习算法并不需要明确的预编程规则和模型,它们从数据中识别、观察模式,并以此建立解释任务的模型。

人工智能效应:真正符合“人工智能”概念的东西到底是什么?

目前有关“人工智能”技术的标准定义还很模糊,它会随时变化。AI这个标签适用于代替人类从事传统作业的机器,有趣的是,一旦计算机学会如何工作,人们反而倾向于否定它拥有智能。这种现象被称为“人工智能效应”。

例如,当IBM的深蓝在1997年击败国际象棋世界冠军Garry Kasparov时,人们批评它用的是暴力搜索,而称不上是“真正”的智能。对此,McCorduck曾写道:“每当有人尝试用计算机来完成一些新任务,比如玩跳棋、解决简单而非正式的问题时,这其实都是人工智能领域发展的一部分——但总有批评家喜欢跳出来指着说:‘这才不是思想’……”

也许世间会存在一种表达,能让所有人都认同它是对“人工智能”最靠谱的解释,比如:

“AI是尚未完成的任何事情。”——Douglas Hofstadter

那么,一台什么样的计算机才能被称为AI呢?让我们来举个例子:自动驾驶汽车是不是AI?把它放到今天,是;放到未来,也许不是。那么一个可以流畅对话的聊天机器人呢?当然是,必须是。

强大的人工智能即将改变世界,而掌握机器学习会是一个良好开端

如果说上文介绍的是弱人工智能(ANI),它只适用于一些特定任务,那么现在我们正大步向通用人工智能(AGI)迈进,也就是强人工智能。AGI指的是能在所有智力任务中达到人类水平的人工智能,它包括在不确定的情况下学习、规划和决策,包括用自然语言沟通、讲笑话、引导人、买卖股票……甚至把自己重新编程一遍。

最后一项是个大问题。如果我们创建了一个可以自我提升的AI,那它会不会从此步入一个不断改进自我的循环,并在几十年后,或者是某一天内出现“智能爆炸”

让我们将超级智能机器定义为一种能够远远超过任何人的所有智力活动的机器。如果说设计机器是这些智力活动的一种,那么超级智能机器肯定能够设计出更加优良的机器;毫无疑问,随后必将出现一场“智能爆炸”,人类的智能会被远远抛在后面。因此,第一台超级智能机器是人类需要完成的最后一项发明,前提是这台机器足够听话,会告诉我们如何控制它。——统计学家I.J. Good(来源:维基百科)

你可能听说过这个概念:技术奇点。它脱胎于黑洞中心附近的引力奇点,后者是一个密度无限大的一维点,在那里,所有人类可理解的物理定律都开始崩坏。

我们对黑洞内发生的事一无所知,因为连光都逃脱不了它的引力。同样的,在我们为AI开启了不断自我提升的循环后,我们也预见不到将来会发生什么

人类未来研究所最近发布了一份关于AI研究人员眼中AGI出现时间的论文,他们发现,大多数研究人员都认为在未来45年内,AI将有50%的概率能在所有任务中超越人类。我们私下也和一些科学家交流过,其中比较理性的一方认为AGI距离我们还很远(上限是“永远不会”),但也有不少人认为它的发展速度会快得惊人——也许只有几年。

2005年Kurzweil的作品“Singularity Is Near”。现在是2017年,墙上的海报又得撕下不少

在这种情况下,超人工智能(ASI)的出现可能是人类这个物种做出的最好或最差的事情之一。它带来了一个挑战,即如果要让AI和人类保持友好关系,它们会想要什么?

虽然这些猜想不能说明未来的发展,但有一点是可以肯定的:现在是开始理解机器思维方式的好时机。如果我们想比坐在轮椅上思考抽象概念的哲学家走得更远,想更智能地制定人类关于人工智能的发展规划和策略,我们必须详细了解机器看待世界的方式——它们想要什么、它们潜在的偏见和失败定义、它们的气质怪癖——就像研究人类如何学习、决策、行动和感受的心理学和神经科学一样。

今后几年中我们要高度关注一些复杂的、高风险的AI问题。

如我们该如何处理现有数据集中包含的进一步强化的各种偏见?世界上最顶级的研究人员尚且对AI潜在的风险和益处有所争论,那我们该如何看待这些分歧?在没有工作的世界里,人类的目标又会发生什么变化?

机器学习是我们走向人工智能的重中之重,同时它也将改变每个行业,对我们的日常生活产生巨大影响。至少从概念层面说,这是我们为什么觉得机器学习至关重要的主要原因——也是我们把本章作为本书第一章的原因。

关于阅读本书的建议

阅读本书时,读者并不需要从头到尾逐篇阅读,以下是三点建议,具体取决于您有多少时间和多大的兴趣。

  • T型阅读法。仔细阅读每一章节的内容,并在每部分内容结束后进行概括,既讲求广博通达,又追求专深透彻。读完全书后能深入自己感兴趣的领域进一步探究,我们在附录中提供的资源可以帮助这部分读者;

  • 筛读法。直接跳到您感兴趣的章节,然后全身心阅读学习;

  • 80/20法。概览全书并对感兴趣的重点概念做一些笔记,在夜深人静的时候回忆这些重要内容。

下期预告:第二章 监督学习(一)。

原书地址:www.dropbox.com/s/e38nil1dnl7481q/machine_learning.pdf?dl=0#pageContainer16