Essential Math for AI(机翻)-第一章

82 阅读24分钟

第1章 为什么学习AI的数学?

直到有人说:“这是智能的,”我才停止寻找,并开始关注。 —H.

人工智能,简称AI,已经来到我们身边。它已经渗透到我们生活的方方面面,并越来越多地参与到重要决策的制定中。很快,它将在我们社会的每个领域得到应用,支持我们大部分的日常操作。这项技术正在迅速发展,投资也在飞速增长。与此同时,我们似乎正身处一个AI狂潮之中。每天我们都会听到关于AI新的成就:AI在围棋比赛中击败了最优秀的人类选手;AI在分类任务中表现超过了人类视觉;AI制作了深度伪造;AI生成了高能物理数据;AI解决了模拟自然现象的世界中的困难偏微分方程。自动驾驶汽车已经上路,送货无人机已经在世界某些地区盘旋。

在这场狂潮中,现实、猜测、夸张、愿景和纯粹的虚构之间的界限变得模糊,我们首先需要至少在本书的背景下定义AI。然后我们将讨论它的一些局限性,它的发展方向,并为当今AI中使用的数学概念搭建舞台。我希望当你了解了这些数学知识后,能够从一个相对深入的角度看待这个主题,使得虚构、现实以及二者之间的模糊界限变得更加清晰。你还将学习到AI中最先进数学背后的主要思想,为你使用、改进甚至创建全新的AI系统提供必要的信心。

什么是AI?

至今,我还没有遇到一个统一的AI定义。如果我们问两位AI专家,我们会听到两个不同的答案。甚至如果我们在两个不同的日子问同一个专家,他们可能会给出两个不同的定义。这种不一致性和看似无法定义AI的原因是,直到现在,智能的定义还不清楚。智能是什么?是什么让我们成为独一无二的人类?是什么让我们意识到自己的存在?我们大脑中的神经元是如何聚集微小的电脉冲并将它们转化为图像、声音、感觉和思想的?这些广泛的话题吸引了哲学家、人类学家和神经科学家数个世纪。在这本书中,我不会试图深入探讨这些问题。然而,我会从AI代理的角度来讨论人工智能,并列出以下用于本书的定义原则。在2022年,一个AI代理可以包括以下一个或多个方面:

  1. AI代理可以是纯软件,也可以有一个物理机器人身体。
  2. AI代理可以针对特定任务,也可以作为一个灵活的代理,探索和操纵其环境,有目标或无目标地建立知识。
  3. AI代理通过经验学习,即随着对某项任务的实践越多,它在执行任务的能力会变得越来越好。
  4. AI代理感知其环境,然后为这个环境构建、更新和/或演变模型。
  5. AI代理感知、建模、分析并作出有助于实现其目标的决策。这个目标可以是预先定义的、固定的,也可以是随着输入的增加而变化的。
  6. AI代理理解因果关系,能够区分模式和原因。

每当一个AI的数学模型受到我们大脑工作方式的启发时,我会指出类比,从而在不必定义它们的情况下,保持AI和人类智能的比较。尽管如今的AI与人类智能相去甚远,除了特定任务如图像分类、AlphaGo等,但近年来许多人类大脑已汇聚到AI领域,这个领域注定会在未来几年取得增长和突破。

同样重要的是要注意,有些人将人工智能、机器学习和数据科学这三个术语互相替换使用。这三个领域存在重叠,但它们并不相同。第四个非常重要但稍微不那么被炒作的领域是机器人学,其中物理部件和运动技能必须融入学习和推理过程,将机械工程、电气工程、生物工程与信息和计算机工程相结合。关于这些领域的互联性的一个快速思考方式是:数据推动机器学习算法,而这些算法反过来为许多热门的AI和/或机器人系统提供动力。本书中的数学知识对这四个领域都有用,只是使用比例不同。

简而言之,AI的定义仍然是一个有争议的话题,因为智能的定义尚不明确。在这本书中,我们通过描述AI代理的特性来探讨人工智能。AI代理可以是软件或具有物理机器人身体,可以专注于特定任务或灵活探索环境,通过经验学习,感知并建模环境,并作出有助于实现其目标的决策。人工智能、机器学习、数据科学和机器人学是相互关联但不完全相同的领域,本书中的数学知识在不同程度上对这些领域都有帮助。

为什么现在AI如此受欢迎?

在过去的十年里,AI因成功结合以下几个因素而引起了全球关注:

  1. 大量数据的产生和数字化 这可能包括文本数据、图像、视频、健康记录、电子商务、网络和传感器数据。社交媒体和物联网在这方面发挥了非常重要的作用,它们不断传输大量的数据。
  2. 计算能力的进步 通过并行和分布式计算以及硬件创新,实现了大量复杂结构化和非结构化数据的高效且相对便宜的处理。
  3. 神经网络在处理大数据方面的最近成功 AI在某些任务上已经超越了人类的表现,如图像识别和围棋游戏。2012年,AlexNet赢得了ImageNet大规模视觉识别挑战赛,这激发了卷积神经网络(由图形处理单元支持)的大量活动;2015年,PReLU-Net(ResNet)首次在图像分类上超越了人类。

当我们研究这些因素时,我们意识到今天的AI与科幻小说中的AI并不相同。今天的AI以大数据(各种类型的数据)、机器学习算法为核心,主要针对执行单一任务的极致优化,而不是根据周围环境发展和适应不同的智能类型和目标。

AI能做什么?

AI可以成功应用的领域和行业比AI专家能够满足的需求还要多。人类一直在努力实现流程自动化,而AI正好有望在大规模层面上实现这一目标。大大小小的公司都有大量的原始数据,他们希望分析这些数据并将其转化为利润、最佳策略和资源分配的洞察。医疗行业严重缺乏医生,AI在这里有无数的应用和无限的潜力。全球金融系统、股票市场和银行业一直严重依赖我们做出良好的预测,当这些预测失败时,它们就会遭受巨大的损失。随着我们计算能力的不断提高,科学研究取得了显著的进展,如今我们正处于一个新的黎明,AI的进步使得几十年前被认为是不可能的大规模计算成为可能。从电力网、交通、供应链到森林和野生动物保护、抗击世界饥荒、疾病和气候变化,各个领域都需要高效的系统和运作。甚至在AI本身,人们也在寻求自动化,一个AI系统可以自发地决定最佳的流程、算法和参数,直接为给定任务产生所需的结果,从而完全消除了人类监督的需求。

AI代理的特定任务

在这本书中,在讨论数学时,我将关注AI在特定任务中的热门应用领域。然而,有益的数学思想和技巧可以轻松地跨不同应用领域进行转移。这种看似容易且广泛适用的原因是我们正处于AI实现的时代,这意味着处理某些任务的主要思想已经被开发出来,只需稍作调整,就可以应用于各种行业和领域。我们的AI主题和/或任务包括:

模拟和实际数据 我们的AI代理处理数据,提供洞察力,并根据这些数据(使用数学和算法)做出决策。

大脑新皮质 AI中的神经网络是根据新皮质或新大脑进行建模的。这是我们大脑负责高级功能的部分,如感知、记忆、抽象思维、语言、自愿的身体动作、决策、想象和意识。新皮质有很多层,其中六层可以明显区分。它具有很强的灵活性和学习能力。旧大脑和爬行动物大脑位于新皮质之下,负责情感以及更基本和原始的生存功能,如呼吸、调节心跳、恐惧、侵略、性冲动等。旧大脑记录导致良好或不良感觉的行为和经验,形成我们的情感记忆,影响我们的行为和未来行动。我们的AI代理以非常基本的方式模仿新皮质,有时还模仿旧大脑。

计算机视觉 我们的AI代理通过摄像头、传感器等感知并识别其环境。它可以查看我们的日常图片和视频,到我们的MRI扫描,再到遥远星系的图像。

自然语言处理

我们的AI代理与其环境进行沟通,并自动执行繁琐且耗时的任务,如文本摘要、语言翻译、情感分析、文件分类和排序、为图像添加标题以及与用户聊天。

金融系统

我们的AI代理检测我们日常交易中的欺诈行为,评估贷款风险,并提供关于我们金融习惯的24小时反馈和见解。

网络和图表

我们的AI代理处理网络和图表数据,如动物社交网络、基础设施网络、专业合作网络、经济网络、交通网络、生物网络等等。

社交媒体

我们的AI代理要感谢社交媒体提供了其学习所需的大量数据。作为回报,我们的AI代理试图刻画社交媒体用户,识别他们的模式、行为和活跃网络。

供应链

我们的AI代理是优化专家。它帮助我们预测每个生产链级别的最佳资源需求和分配策略。它还寻找解决世界饥饿问题的方法。

调度和人员配置

我们的AI代理方便我们的日常运作。

天气预报

我们的AI代理解决了用于天气预报和预测的偏微分方程。

气候变化

我们的AI代理试图应对气候变化。

教育 

我们的AI代理提供个性化的学习体验。

道德

我们的AI代理努力做到公平、平等、包容、透明、无偏见,并保护数据安全和隐私

AI的局限性是什么? 

尽管AI取得了令人瞩目的成就,并有很大的潜力改进或彻底改变整个行业,但该领域仍需克服一些真正的局限。一些最紧迫的局限性包括:

智能

当前的AI甚至与我们人类独特的智能相差甚远。尽管AI在无数任务中表现得比人类更好,但它不能自然地切换并适应新任务。例如,一个训练有素的识别图像中的人类的AI系统,在没有重新训练的情况下无法识别猫,或者在不改变其架构和算法的情况下无法生成文本。在关于AI的三种类型的背景下,我们到目前为止只部分实现了狭义人工智能,它具有有限的能力范围。我们既没有实现与人类能力相当的人工通用智能,也没有实现比人类更有能力的人工超级智能。此外,现今的机器无法体验到任何美好的人类情感,如爱情、亲密、幸福、自豪、尊严、关爱、悲伤、失落等等。模仿情感与真正体验和给予情感是有区别的。在这个意义上,机器离取代人类还差得很远。

大量标记数据

大多数热门AI应用需要大量标记的数据,例如,MRI图像可以标记为癌症或非癌症,YouTube视频可以标记为儿童安全或不安全,或者房屋价格可以根据房屋所在区域、卧室数量、家庭收入中位数等特征获得,这种情况下房屋价格就是标签。局限性在于,训练系统所需的数据通常不是现成的,获取、标记、维护或存储数据都不便宜。大量的数据是机密的、无组织的、无结构的、有偏见的、不完整的和未标记的。获取数据、策划数据、预处理数据和标记数据成为了需要大量时间和资源投入的主要障碍。

多种方法和超参数

对于某个AI任务,有时有许多方法或算法可以完成它。每个任务、数据集和/或算法都有参数,称为超参数,在实施过程中可以调整,而这些超参数的最佳值并不总是明确的。解决特定AI任务的多种方法和可用超参数意味着不同的方法可能产生极为不同的结果,而人们需要评估依赖哪些方法的决策。在某些应用中,例如为某个客户推荐的裙子款式,这些差异可能无关紧要。在其他领域,基于AI的决策可能会改变人的生活:告诉患者他们没有某种疾病,而实际上他们确实患有;一个囚犯被错误地标记为极有可能再犯,结果假释被拒绝;或者一个有资格的人贷款被拒。关于如何解决这些问题的研究正在进行中,我将在本书后面的部分详细介绍。

资源限制

人类的能力和潜力受到我们大脑能力、生物体能力以及地球上和宇宙中可供我们操纵的资源的限制。这些再次受到我们大脑的能力和容量的限制。AI系统同样受到支持AI软件的系统的计算能力和硬件能力的限制。最近的研究表明,计算密集型的深度学习正在接近其计算极限,需要新的想法来提高算法和硬件效率,或者发现全新的方法。AI的进步在很大程度上依赖于计算能力的大幅提高。然而,这种能力并非无限,对于处理大量数据集的大型系统而言,成本非常高,而且不能忽视其巨大的碳足迹,例如,运行和冷却数据仓库、个人设备、保持云连接等所需的电力。此外,数据和算法软件并不存在于真空中。计算机、手机、平板电脑、电池以及存储、传输和处理数据和算法所需的仓库和系统都是由地球上实际物质制成的。地球花了数百万年来制造这些材料,而永远支持这些技术所需的无限供应并不存在。

安全成本

安全、隐私和对抗性攻击一直是AI的主要关注点,尤其是在互联系统的出现之际。大量的研究和资源正被用来解决这些重要问题。由于当前大多数AI是软件,大多数数据是数字化的,所以这个领域的军备竞赛永无止境。这意味着AI系统需要不断监控和更新,需要雇佣更昂贵的AI和网络安全专家,可能需要的成本远远超过了最初的自动化规模目的。

更广泛的影响

AI研究和实施行业迄今为止,将自己视为与其先进技术的经济、社会和安全后果略有分离。通常,这些AI工作的道德、社会和安全影响被认为是重要的并且需要关注,但超出了工作本身的范围。随着AI得到广泛部署,其对社会、市场和潜在威胁的结构和性质的影响越来越强烈,整个领域必须更有目的地关注这些至关重要的问题。从这个意义上讲,AI发展社区在分配资源来解决其新技术实施和部署的更广泛影响方面是有限的。总结,虽然AI在许多方面取得了显著的成果,但仍然存在许多局限性。这些局限性包括智能、大量标记数据、多种方法和超参数、资源限制、安全成本和更广泛的影响。AI领域需要努力克服这些限制,以便更好地实现其潜力并推动各行各业的进步。

**
**

当AI系统失败时会发生什么? 

学习AI的一个非常重要的部分是了解其事故和失败。这有助于我们在设计自己的AI并部署到现实世界之前,预见和避免类似的结果。如果AI在部署后失败,后果可能是极其令人不悦、危险,甚至是致命的。

  • 一个名为AI事故数据库的在线知识库收录了超过一千起此类事故。该网站的一些示例包括: 
  • 一辆自动驾驶汽车撞死行人。 
  • 自动驾驶汽车与公司的服务器失去联系长达20分钟,导致所有车辆在旧金山街头同时停滞(2022年6月28日和5月18日)。 
  • 交易算法导致市场闪崩,数十亿美元在各方之间自动转移。 
  • 面部识别系统导致无辜的人被捕。 
  • 微软臭名昭著的聊天机器人Tay在发布仅16小时后就被关闭,因为它迅速学习并发表了攻击性、种族主义和极具煽动性的言论。 

这些糟糕的结果可以减轻,但需要深入了解这些系统如何在生产各个层面上工作,以及了解它们所服务的环境和用户。理解AI背后的数学原理是这一识别过程的关键一步。

AI的未来发展方向是什么? 

为了能回答或推测AI的发展方向,最好回顾一下自诞生以来该领域的原始目标:模拟人类智能。这个领域诞生于20世纪50年代。回顾过去70年的发展历程,可能会告诉我们一些关于其未来方向的信息。此外,研究这个领域的历史和趋势使我们能够从鸟瞰的角度来看待AI,将所有事物都放在一个背景下,提供更好的视角。这也使得学习AI中涉及的数学变得不那么压力重重。下面是一个非常简短、非技术性的概述,介绍了AI的演变及其最终成为焦点的原因,这要归功于最近深度学习取得的令人瞩目的进步。

一开始,AI研究试图通过规则和逻辑来模拟智能。当时的想法是,我们所需要做的就是向机器提供事实和关于这些事实的逻辑推理规则(我们将在第12章看到这种逻辑结构的例子)。这里没有强调学习过程。挑战在于,为了捕捉人类知识,规则和约束太多,对于编码者来说难以处理,这种方法看似不切实际。

在20世纪90年代末和21世纪初,各种机器学习方法开始流行。机器学习不再基于预先编程的规则来编程,也不再基于这些预先编程的规则来得出结论和决策,而是从数据中推断出规则。一个机器学习系统能够处理和处理的数据越多,其性能就越好。数据及其以经济、高效的方式处理和学习大量数据的能力成为主要目标。当时流行的机器学习算法有支持向量机、贝叶斯网络、遗传算法、决策树、随机森林、回归、逻辑回归等。这些算法现在仍然受欢迎。

2010年之后,特别是2012年,神经网络和深度学习在AlexNet的卷积神经网络在图像识别方面取得成功后席卷而来。最近五年里,随着DeepMind的AlphaGo在非常复杂的古老中国围棋游戏中击败世界冠军,强化学习开始受到欢迎。请注意,这段历史的回顾非常粗糙:回归分析可以追溯到19世纪初的勒让德和高斯,而第一个人工神经元和神经网络则出现在20世纪40年代末和50年代初,与之相关的人物有神经生理学家沃伦·麦克卢洛克、数学家沃尔特·皮茨、心理学家唐纳德·赫布和弗兰克·罗森布拉特。图灵测试(最初称为模仿游戏)由计算机科学家、密码分析家、数学家和理论生物学家艾伦·图灵于1950年在他的论文《计算机器与智能》中提出。图灵提议,如果机器的回应与人类无法区分,那么这台机器就具有人工智能。因此,一台机器被认为是智能的,如果它能模仿人类的反应。然而,对于计算机科学领域以外的人来说,图灵测试在定义智能方面听起来有些局限,我不禁想知道,图灵测试是否无意中限制了AI研究的目标或方向。

尽管机器在一些特定任务中已经能够模仿人类智能,但模拟人类智能的最初目标尚未实现,因此可以安全地假设这就是该领域的发展方向,尽管可能涉及重新发现旧观念或发明全新观念。目前该领域的投资水平,加上研究和公众兴趣的爆发,注定会带来新的突破。然而,近期AI取得的突破已经在革新整个行业,这些行业都渴望实现这些技术。这些现代AI进步涉及了许多重要的数学知识,我们将在本书中逐步探讨。

AI领域当前的主要贡献者是谁?

主要的AI竞争一直在美国、欧洲和中国之间进行。科技行业的世界领导者包括美国的谷歌及其母公司Alphabet、亚马逊、Facebook、微软、英伟达和IBM,英国和美国的DeepMind(Alphabet旗下公司),以及中国的百度和腾讯。学术界也有很多重要的贡献者,但这里难以一一列举。如果您是该领域的新手,了解大型参与者的名称、历史和贡献以及他们目前正在追求的目标是很有帮助的。了解他们工作周围的争议(如果有的话)也是非常有价值的。随着您在AI领域不断深入和积累经验,这些通识知识将派上用场。

AI中通常涉及哪些数学内容?

当我说到“数学”这个词时,你脑海中出现的是哪些主题和科目?

无论您是数学专家还是初学者,您想到的回答这个问题的任何数学主题很可能都与AI有关。这里有一个常用的列表,列出了AI实现中最有用的数学科目:微积分、线性代数、优化、概率和统计;然而,在AI领域取得成功并不需要您成为所有这些领域的专家。您确实需要对这些数学科目中选取的某些有用主题有深入的理解。根据您的具体应用领域,您可能需要来自以下领域的特殊主题:随机矩阵理论、图论、博弈论、微分方程和运筹学。

在本书中,我们将遍览这些主题,而不是对每一个主题都进行教科书式的讲解。AI应用和实现是这些多样化且密切相关的数学科目的统一主题。采用这种方法,我可能会因为过分简化许多技术定义或省略整个定理和细微的细节而冒犯一些数学专家,同样,我也可能冒犯AI或专业行业专家,因为省略了涉及某些应用和实现的细节。然而,我们的目标是使本书保持简单易读,同时涵盖大部分对AI应用重要的数学主题。有兴趣的读者希望深入了解数学或AI领域的话,可以阅读更多关于他们想要关注的特定领域的深入书籍。

我希望这本书是一个简洁的总结和全面的概述,因此读者在此之后可以自信地进入他们感兴趣的AI数学领域或AI应用领域。

总结和展望

人类智能在感知、视觉、自然语言交流、推理、决策、合作、同理心、建模和操纵周围环境、跨人群和代际传递技能和知识以及将先天和学习到的技能推广到新的和未知领域等方面体现出来。人工智能渴望复制人类智能的所有方面。在目前的状态下,AI一次只能解决一个或几个方面的智能。即使存在这种局限性,AI也取得了令人印象深刻的成就,如建模蛋白质折叠和预测蛋白质结构,这些结构是生命的基石。这一AI应用(众多应用之一)对理解生命本质和抗击各种疾病的影响是无穷的。

进入AI领域时,重要的是要始终关注您正在开发或使用的智能方面。是感知?视觉?自然语言?导航?控制?推理?然后自然而然地关注哪些数学以及为什么,因为您已经知道自己在AI领域的位置。然后就很容易关注开发AI特定方面的社区所使用的数学方法和工具。本书的方法类似:首先是AI类型和应用,然后是数学。

在本章中,我们讨论了一些一般性问题。什么是AI?AI能做什么?AI的局限性是什么?AI的发展方向是什么?AI是如何工作的?我们还简要介绍了重要的AI应用,企业在试图将整合到系统中时通常遇到的问题,系统实施不当时可能发生的事故,以及AI实施通常需要的数学科目。

在下一章中,我们将深入研究数据,并确认其与AI的密切关系。谈到数据,我们还会谈到数据分布,这将直接引入概率论和统计学。