人工智能系统(一):概述

1,506 阅读6分钟

这是我参与11月更文挑战的第21天,活动详情查看:2021最后一次更文挑战

什么人工智能和人工智能系统

人工智能是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。1956年由约翰.麦卡锡首次提出,当时的定义为“制造智能机器的科学与工程”。人工智能的目的就是让机器能够像人一样思考,让机器拥有智能。 人工智能是计算机科学的一个分支。时至今日,人工智能已经扩展为一门交叉学科。

image.png

人工智能系统是集成了人工智能技术的系统,做到了信息智能处理,提高了企业的销售和管理能力。

因此,人工智能从实际应用上大致可分为两个主要的方向,即理论研究(算法、模型)和工程实践(编程实现、MLOps)。

人工智能的发展

image.png

人工智能的产业生态

• 人工智能的四要素是数据、算法、算力、场景。要满足这四要素,我们需要将人工智能与云计算、大数据和物联网结合以智能整个社会。

image.png

人工智能相关技术及应用场景

image.png

人工智能相关技术

Al技术是多层面的,贯穿了应用、算法、工具链、器件、芯片、工艺和材料等技术层级。

image.png

目前人工智能主要的应用技术方向

  • 自然语言处理,它是利用计算机技术来理解并运用自然语言的学科。自然语言处理研究的主题主要包括机器翻译、文本挖掘和情感分析等。自然语言处理的技术难度高,技术成熟度较低。因为语义的复杂度高,仅靠目前基于大数据、并行计算的深度学习很难达到人类的理解层次。
  • 计算机视觉,它是研究如何让计算机“看”的科学。计算机视觉是三个AI应用技术中最成熟的技术。计算机视觉研究的主题主要包括图像分类,目标检测、图像分割、目标跟踪、文字识别等。
  • 语音处理,它是研究语音发声过程、语音信号的统计特性、语音识别、机器合成以及语音感知等各种处理技术的统称。语音处理研究的主题主要包括语音识别、语音合成、语音唤醒、声纹识别、音频事件检测等。其中最成熟的技术是语音识别,在安静室内、近场识别的前提下能达到96%的识别准确度。

应用场景

人工智能,正在一步步的改变世界,它拥有广泛的应用场景,如私人助理、监控检测、机器翻译、医疗诊断、游戏、艺术、图像识别、语音识别、自然语言处理、生成模型、强化学习、自动驾驶等,人工智能将会改变所有行业。

image.png

人工智能、机器学习、深度学习的关系

image.png

  • 人工智能:是研究、开发用于模拟、延伸和扩展人的智能的理论、方法及应用系统的一门新的技术科学。
  • 机器学习:专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。是人工智能的核心研究领域之一。
  • 深度学习:源于人工神经网络的研究,多层感知器就是一种深度学习结构。深度学习是机器学习研究中的一个新的领域,它模仿人脑的机制来解释数据,例如图像,声音和文本。

为什么人工智能、深度学习最近十年才取得成功

最近十年才取得成功主要是由于高效的编程语言、算法优化、计算机体系结构改进、并行计算以及分布式系统的发展。

海量的(标识)数据

互联网服务和大数据平台给深度学习带来了大量的数据集。

数据来源:

  • 搜索引擎:对于图像搜索: 如ImageNet,Coco等;对于文本搜索: 维基百科(自然语言数据集)
  • 商业网站:如亚马逊,淘宝(推荐系统数据集, 广告数据集)
  • 其他互联网服务:如siri,cortana

对于图像分类问题来说,从最初的MNIST数据集到ImageNet,再到网站图像,数据规模越来越大。 image.png

深度学习算法的进步

采用MNIST数据集,进行手写数字体识别来说:

  • 一个简单的卷积神经网络方法可以等同于最好的 SVM 方法 (1998 年)
  • 深度卷积神经网络方法可以将错误率降低至 0.23%(2012 年),而人类为 0.2%

image.png

编程语言及计算框架的发展

从硬件层面来看,从早起的线性代数库(CPU/GPU),到之后的密集矩阵引擎(GPU),再到后来专门的AI加速器(TPU),处理能力得到了很大的提升。

同时,从早期计算框架需要自定义想要的机器学习算法(Theano/DisBelif/Caffe),到后面的深度学习框架(MxNet/TensorFlow/CNTK/Pytorch)提供更简单的方法来利用各种库,计算框架也得到了十足的进步。 image.png

计算能力的提升

从第一台通用计算机的诞生(eniac),到英特尔 Xeon(至强) X5,再到后面的GPU/TPU,计算能力不断攀升。

image.png

人工智能的面临的问题

  • 隐私问题:现有的人工智能算法都是数据驱动,我们需要大量的数据来训练模型。我们每天在享受人工智能带来的便捷的同时,例如Facebook,谷歌,亚马逊,阿里巴巴等科技公司在获取大量的用户数据。
  • 安全问题:例如,黑客利用人工智能技术、非法窃取私人信息或者模拟用户的行为并试图改变方法。
  • 可信度问题:随着计算机视觉的发展,图像及视频的可信度也越来越低。现在我们可以通过PS,GAN(生成对抗网络)等技术制作假图像,让人难分真伪。

人工智能未来展望

  • 框架:更易用的开发框架。
  • 算法:性能更优,体积更小的算法模型
  • 算力:端-边-云全面发展的算力。
  • 数据:更完善的基础数据服务产业,更安全的数据共享。
  • 场景:不断突破的行业应用。

总结

总之,人工智能、深度学习近年来的十足进步来源于算法、数据、系统等多方面的突破。与此同时,系统面临得新问题也与新的应用问题和挑战相伴而生。

参考文档