阅读 1029

2020年必备的8本机器学习书

作为计算机科学的一个分支,机器学习致力于研究如何利用代表某现象的样本数据构建算法。这些数据可能是自然产生的,可能是人工生成的,也可能来自于其他算法的输出。

同时,机器学习也可以定义为一套解决实际问题的流程,具体步骤包括收集数据、利用算法对收集到的数据进行统计建模以及利用构建好的统计模型解决具体问题。

小编整理了几本2020 年必备的8本机器学习书,与您共赏!

 

1、机器学习提升法 理论与算法

[美] 罗伯特·夏皮雷(Robert,E.,Schapire)约夫·弗雷德,[Yoav,Freund] 著,沙灜 译

  1. 本书是提升法的创始人、哥德尔奖得主的代表作;
  2. 将提升法背后的各种理论举重若轻、抽丝剥茧、深入浅出地详加介绍;
  3. 充分考虑入门读者的需求,对所有材料都进行了适当的裁剪,每章后附有练习题;
  4. 书中有大量的应用实例和插图;
  5. 提供书中彩图文件。

提升法(boosting)是一种机器学习方法,其思想是通过组合许多较弱的、不准确的“经验法则”来创建一个高度精确的预测器。围绕提升法已发展出非常丰富的理论,涉及一系列的主题,包括统计学、博弈论、凸优化以及信息几何学。提升法也在生物学、计算机视觉和语音处理等领域获得了成功应用。

本书由提升法的提出者、罗伯特·夏皮雷(Robert. E. Schapire)和约夫·弗雷德(Yoav Freund)亲自执笔,汇集、组织、简化并实质性扩充了关于提升法的研究成果,以不同背景的读者都可以轻松阅读并理解的方式来呈现提升法的理论及其实践,同时也为高级研究人员提供了权威参考。本书充分考虑入门读者的需求,对所有的材料都进行了适当的裁剪,并在每章后都附有练习,因而适合作为相关教材使用。

本书首先对机器学习算法及其分析方法作了概要性介绍;然后探讨了提升法的核心理论,特别是它的泛化能力;考察了有助于理解和解释提升法的许多理论观点;提供了提升法的实用扩展以解决更复杂的学习问题;最后提出了一些高级理论。大量的应用实例和插图贯穿其中。

本书适合任何对机器学习算法、提升法感兴趣的读者,也适合作为高等院校相关课程的教材。

 

2、自然语言处理实战

[美] 霍布森·莱恩,科尔·霍华德,汉纳斯·马克斯·哈普克 著,史亮,鲁骁,唐可欣,王斌 译

  1. 本书是构建能够阅读和解释人类语言的机器的实用指南;
  2. 读者可以使用现有的Python 包来捕获文本的含义并相应地做出响应;
  3. 本书扩展了传统的自然语言处理方法,包括神经网络、现代深度学习算法和生成技术,用于解决真实世界的问题,如提取日期和名称、合成文本和回答无固定格式的问题;
  4. 提供源代码。

深度学习领域的**进展使各类应用能够极其精准地理解文本和语音。其结果是,聊天机器人能够模仿真人筛选出与职位高度匹配的简历,完成卓越的预测性搜索,自动生成文档摘要——所有这些都能够以很低的成本实现。新技术的发展连同Keras 和TensorFlow之类的易用工具的出现,使专业品质的自然语言处理(NLP)比以往任何时候都更容易实现。

本书主要内容

  • Keras、TensorFlow、gensim和 scikit-learn等工具的使用。
  • 基于规则的自然语言处理和基于数据的自然语言处理。
  • 可扩展的自然语言处理流水线。

阅读本书,读者需要对深度学习的知识有基本的了解,并具有中等水平的Python 编程技能。

 

3、机器学习测试入门与实践

艾辉 著

  • 业界首部AI测试著作,32位BAT专家联袂推荐
  • 精选15个AI测试要点,涵盖5大技术主题
  • 从零开始快速入门机器学习测试。融360AI测试团队著

不同于市面上的机器学习书籍,本书是业界首部AI测试著作,填补了机器学习测试领域的空白。

本书由知名技术专家艾辉领衔融360AI测试团队12位一线工程师联手倾心打造,耗时一年多时间。

1)精选15个AI测试要点,从零开始,全面了解机器学习测试。

2)涵盖5个技术主题,大数据、模型算法、模型评测、工程架构、智能化测试。

3)BAT等数十家一线互联网公司的32位知名专家联袂推荐。

本书内容设计深入浅出,学习路线清晰,帮助读者了解机器学习是如何工作的,了解机器学习的质量保障是如何进行的。

对于工程开发和测试工程师,通过阅读本书可以体系化地了解大数据测试、特征测试及模型评估等知识; 对于有算法数据背景的工程师,通过阅读本书可以学习和拓宽模型评测的方法手段、模型工程实践的思路; 对于技术专家、技术管理者,通过阅读本书可以收获机器学习质量保障与工程效率的建设思路。

 

4、机器学习精讲 全彩印刷

安德烈·布可夫(Andriy Burkov) 著,韩江雷 译

  1. 一本一百多页的精简机器学习入门手册
  2. 亚机器学习类4.5星畅销书,全彩印刷
  3. 人工智能和机器学习领域众多知名专家推荐

《机器学习精讲》包含了监督和非监督学习、支持向量机、神经网络、集成算法、梯度下降、聚类分类、降维、自编码器、迁移学习、特征工程以及超参数调试等方面的知识。书中既有数学公式,又有图解说明,一应俱全。

本书具有以下特色:

  • 精简并直入主题——篇幅短小,读者可以快速读完并掌握机器学习技术的精髓。书中内容是作者和其他从业者多年研究的成果。
  • 配套网页——本书配有持续更新的网页,对书中内容进行补充,包括问答、代码、推荐阅读材料、工具以及其他相关内容。扫描书中二维码即可查看。
  • 全彩印刷——色彩丰富,阅读轻松。
  • 代码基于Python语言。

 

5、深度学习

  • 深度学习领域奠基性经典畅销书
  • 数据科学家和机器学习从业者必读
  • 长期位居美亚AI和机器学习类图书榜首,图灵奖获奖作品,全彩印刷

《深度学习》由全球知名的三位专家Ian Goodfellow、Yoshua Bengio和Aaron Courville撰写,是深度学习领域奠基性的经典教材。全书的内容包括3个部分:第1部分介绍基本的数学工具和机器学习的概念,它们是深度学习的预备知识;第2部分系统深入地讲解现今已成熟的深度学习方法和技术;第3部分讨论某些具有前瞻性的方向和想法,它们被公认为是深度学习未来的研究重点。

《深度学习》适合各类读者阅读,包括相关专业的大学生或研究生,以及不具有机器学习或统计背景、但是想要快速补充深度学习知识,以便在实际产品或平台中应用的软件工程师。

 

6、动手学深度学习

阿斯顿·张(Aston Zhang),李沐(Mu Li),[美] 扎卡里·C. 立顿 等 著

  • 人工智能机器学习领域重磅入门自学教程
  • 交互式实战环境学习的全新模式,原理+实战
  • 配套网站提供Pytorch和TensorFlow代码,提供视频教程

目前市面上有关深度学习介绍的书籍大多可分两类,一类侧重方法介绍,另一类侧重实践和深度学习工具的介绍。本书同时覆盖方法和实践。本书不仅从数学的角度阐述深度学习的技术与应用,还包含可运行的代码,为读者展示如何在实际中解决问题。为了给读者提供一种交互式的学习体验,本书不但提供免费的教学视频和讨论区,而且提供可运行的Jupyter记事本文件,充分利用Jupyter记事本能将文字、代码、公式和图像统一起来的优势。这样不仅直接将数学公式对应成实际代码,而且可以修改代码、观察结果并及时获取经验,从而带给读者全新的、交互式的深度学习的学习体验。

本书面向希望了解深度学习,特别是对实际使用深度学习感兴趣的大学生、工程师和研究人员。本书不要求读者有任何深度学习或者机器学习的背景知识,读者只需具备基本的数学和编程知识,如基础的线性代数、微分、概率及Python编程知识。本书的附录中提供了书中涉及的主要数学知识,供读者参考。

 

7、贝叶斯思维:统计建模的Python学习法

[美] Allen B.Downey 著,许扬毅 译

  • 机器学习,人工智能,数据分析从业者大数据时代的技能基础
  • ThinkStats和ThinkPython图书作者重磅出击
  • 数据分析师,数据工程师,数据科学家案头常备

《贝叶斯思维 统计建模的Python学习法》帮助那些希望用数学工具解决实际问题的人们,仅有的要求可能就是懂一点概率知识和程序设计。而贝叶斯方法是一种常见的利用概率学知识去解决不确定性问题的数学方法,对于一个计算机专业的人士,应当熟悉其应用在诸如机器翻译,语音识别,垃圾邮件检测等常见的计算机问题领域。

可是《贝叶斯思维 统计建模的Python学习法》实际上会远远扩大你的视野,即使不是一个计算机专业的人士,你也可以看到在战争环境下(二战德军坦克问题),法律问题上(肾肿瘤的假设验证),体育博彩领域(棕熊队和加人队NFL比赛问题)贝叶斯方法的威力。怎么从有限的信息判断德军装甲部队的规模,你所支持的球队有多大可能赢得冠军,在《龙与地下城》勇士中,你应当对游戏角色属性的很大值有什么样的期望,甚至在普通的彩弹射击游戏中,拥有一些贝叶斯思维也能帮助到你提高游戏水平。

 

8、Python自然语言处理

[美] Steven,Bird Ewan,Klein Edward,Loper 著,陈涛,张旭,崔杨,刘海平 译


《Python自然语言处理》是自然语言处理领域的一本实用入门指南,旨在帮助读者学习如何编写程序来分析书面语言。《Python自然语言处理》基于Python编程语言以及一个名为NLTK的自然语言工具包的开源库,但并不要求读者有Python编程的经验。全书共11章,按照难易程度顺序编排。第1章到第3章介绍了语言处理的基础,讲述如何使用小的Python程序分析感兴趣的文本信息。第4章讨论结构化程序设计,以巩固前面几章中介绍的编程要点。第5章到第7章介绍语言处理的基本原理,包括标注、分类和信息提取等。第8章到第10章介绍了句子解析、句法结构识别和句意表达方法。第11章介绍了如何有效管理语言数据。后记部分简要讨论了NLP领域的过去和未来。

文章分类
人工智能
文章标签