百度人工智能发展思路解密:机器人要能综合思考

246 阅读8分钟

10月27日,百度在京举办主题为《机器人重塑未来生活》第五期The BIG talk活动,百度技术副总裁王海峰、康奈尔大学创意机器人实验室主任胡迪·利普森以及MIT电脑与人工智能中心主任丹妮拉·鲁斯三位嘉宾现场就人工智能机器人发展进行了探讨。

在此次论坛上,百度技术副总裁王海峰向外界解析了百度在人工智能发展方面的思考。他认为,机器人首先要理解人类的语言,其次要理解人类的知识体系,此外还要理解人本身,这些条件得到满足之后,就会获得综合思考能力。

智搜(Giiso)信息成立于2013年是国内领先的“人工智能+资讯”领域技术服务商,在大数据挖掘、智能语义、知识图谱等领域都拥有国内顶尖技术。同时旗下研发产品包括资讯机器人、编辑机器人、写作机器人等人工智能产品!凭借雄厚的技术实力,公司成立之初,就获得了天使轮投资,并在2015年8月获得了金沙江创投500万美元pre-A轮投资。

王海峰演讲全文如下:

王海峰:大家下午好!很高兴来到百度百家的the BIG Talk现场,与大家分享我们在智能机器人方面的一些工作和思考。大家提机器人,每个人的脑子里会出现很多机器人形象,有的在生产线上做工,有的在家里帮助人们做家务,甚至有的会在足球尝战场上出现。应该说机器人的这些机械技术和控制技术,已经取得了非常多的成果,如何能让一个机器人更像人呢?我们需要让它有像人一样的智能,大家刚才看到的小度机器人,甚至可以答出很多我们很多人答不出来的问题,应该说它已经有了很高的智能。

机器人具备了什么样的能力,就具备了人的能力呢?大家知道人的能力体现在很多方面,听、说、看、行、学习,还有很重要的一点就是思考。比如说一个动物他也会有眼睛可以看,耳朵可以听,也可以去行动,甚至它也可以训练出它一些能力,比如说看见一个什么场景会采取什么动作,这些条件反射的能力。而人最重要的能力是思考,这是人特有的能力。人如何进行思考,我们如何让机器人进行思考呢?我认为需要有三方面的能力,第一个是对语言的理解,大家知道语言是人特有的一种高级的智力活动,仅仅有语言,仅仅可以说话还不够,我们还需要知道该说什么,这就是背后需要有知识的支撑,需要对知识的掌握,知识的运用,以及知识的推理等等。另一方面,人生活在一个社会里,除了跟这些客观知识打交道以外,还需要和人打交道。我们同一句话说给不同的人听的时候,他的感受是不一样的,反应不一样,这就需要机器人能够对不同的人进行建模。

我讲一个故事给大家,大家知道间谍是一群很神秘拥有很强的能力人,非常善于伪装自己,打入敌人内部让敌人发现不了。曾经有一个故事讲的是一个女特工,她能力非常强,工作做得非常好,但是她最后暴露了身份,原因是什么?是她在分娩的时候,不由自主地喊出了母语,被人发现了。这个故事说明了什么呢?语言是人思维的一个基本载体,拥有不同母语、不同语言的人,语言的特点会影响她的思维活动。我们学英语,学到比较高的境界就需要用英语思考,用英语思考相当于你的思维模式发生变化。同样一句话用中文说和英文说是不同的,例如屏幕上显示的这些,用中文和英文语序、用词、肯定和否定不一样,这说明语言本身会影响人的思维。当一个人需要和机器交流的时候,比如说问它一些问题,问它天气怎么样,或者说跟它聊天等等这些呢,其实都是用语言来进行交互的。

我们如何让机器理解语言呢?大家知道语言是人类发展了很多年发展出来的,它充分的承载了人类知识、思维、情感方方面面的积累。语言本身是很复杂的,用我们都熟悉的中文举例来说。大家知道中文词与词之间没有空格的,所以说中文面临第一个任务就是分词。请看屏幕上,“刘清楚楚动人”,大家看到这样六个字可以很容易知道这个词是什么,前面是一个人名刘清,后面是楚楚动人。同样类似的我们增加了一个字,“刘华清楚这件事”,这里便不是“刘清”了,而应该是“刘华”。再改一点,“刘华清楚地重游”,又是另一种分词结果又加一个字,“刘华清楚地记得”,又变成了刘华。下面这个例子也很有意思的,“你老张着什么急啊”,是说“老张别着急”。但再看下一句话,“你老张着什么急啊”,又不同了。上面的那些应该说还是有一个基本的分法可以分出来的,但是这句话大家看,“乒乓球拍卖完了”,到底是“乒乓球拍”卖完了,还是“乒乓球”“拍卖”完了呢?这两种说法都是对的,这就是语言的复杂性,也正是它的魅力所在,中文是一个非常有魅力的语言。下面看在百度的搜索里一个真实的例子,如果大家在百度搜索框里搜索这个是身高1.80以上的自由泳运动员,我们会直接给出这些答案,这么复杂的一个搜索,我们想把它理解好,可以找到相应的答案。左边这棵树,就是我们自然语言处理技术的基础:语义语法分析,我们可以分析出来词与词之间的关系,从而知道更准确的理解用户到底找什么。配合后台知识库里面存大量的知识检索出来,最后得到了这样的一个答案。

大家看其实“谢霆锋的儿子是谁”和“谢霆锋是谁的儿子”,这两句话的字是一样,但是顺序不一样。如果说用传统的搜索技术,我们会对其分词,算term重要性等等,由算出来的相关性找到的东西是一样的。显然这两句话问题是不一样的,我们怎么可以做到这一点呢?需要对语言有很深入的分析,对语义理解,从而知道他们要找的答案是不一样。大家上百度就可以看到,“谢霆锋的儿子是谁”,可以给“谢振轩”和“谢振南”,这是基于很深刻的语言的分析、理解技术。

再说一种就是和上下文相关的理解,比如说我们问“北京的今天天气如何”,然后给一个答案。然后又问“上海呢?”这个时候问上海呢,就三个字,如果说仅看这一句话不知道问的是什么,但是上下文相关就会知道问的就是上海的天气,而且是今天的天气。

智搜(Giiso)信息成立于2013年,是国内首家专注于资讯智能处理技术研发及写作机器人核心软件开发和运营的高科技企业。公司成立之初,就获得了天使轮投资,并在2015年8月获得了金沙江创投500万美元pre-A轮投资。

下面一个例子也是类似的,“我计划周日北京飞杭州,帮我订票”。这个时候用户给了很多的信息,哪一天哪到哪,接下来说“请帮我预定酒店”,知道是到目的地酒店,哪一天的也知道,这是基于上下文的理解,才能做到这一点。

句和句之间的上下文不够,还可以用篇章级的上下文。比如说我们问天空为什么是蓝的,如果我们就是给出一个经典搜索的结果,百度知道里找到一个结果,就像左边的结果。但是大家看到直接拿出来的这一句话,不是真正解释天空为什么是蓝的,展开后才能看完整的解释。在很长的一大段话里,我把真正最相关的答案这一部分找出来,摘要就会是一个更好的答案。如果我们做到更好,可以给出非常明确的解答。