最前沿:闲谈AI未来及几家学习型机器人初创公司

252 阅读8分钟
原文链接: zhuanlan.zhihu.com
转自微信公众号:FloodSung的AI游乐场

今天不和大家聊纯学术了,和大家聊聊几家学习型的机器人初创公司。


1.为什么关注机器人初创公司?


那我们就要问下一个五年十年最有潜力的AI发展方向是什么?深度学习在计算机视觉语音识别上面的成功诞生了商汤这种独角兽,也诞生了寒武纪这种芯片独角兽,那么下一个独角兽会是什么?


我们可以想到的就是当前深度学习技术在一些垂直领域的应用,比如医疗诊断,比如金融分析。像医疗诊断这种事情,一看就知道是可以做的,而且可以完全使用目前现有的深度学习技术,不带改的,唯一的问题不过还是数据采集问题。这些垂直领域可以诞生一些小的独角兽(垄断了数据资源的独角兽),但这不是最能让人兴奋的地方。


在我看来,工业机器人的智能化才是最有价值的最令人兴奋的发展方向。我们知道每一次的工业革命的核心在于生产力的大幅度提升。能够提升生产力的技术才是最具变革性的技术。从蒸汽机革命,电力革命,计算机革命,互联网革命,下一个是什么?必然只能是机器人智能革命。通过替代目前机器人无法替代的重复性人力劳动,来大幅度的提升生产力。对比一下,现在的什么抖音,什么摩拜,有带来生产力的提升吗?没有,这种产品只是提供一种服务而已,没有核心的技术突破。


但是机器人智能化却不完全是一个现在时,而更多的是将来时。不像计算机视觉已经是完全落地的状态,机器人智能化还有很多需要解决的技术问题,可以说依然很大程度上处于科研前沿的状态。然而有一些子领域上的问题,现在已经看到了一些落地的迹象。所以,我们这里要来关注一下机器人的初创公司,看看机器人智能化的发展趋势。


2. 为什么只关注学习型机器人初创公司?


目前的机器人技术可以分类为两派了,一个还是传统控制流派,使用传统的控制算法来实现机器人的运动控制,至多在计算机视觉问题上加点深度学习技术;另一个就是深度学习流派了,这一派认为机器人可以使用一个端到端的神经网络来实现控制,输入视觉信息,输出控制动作信息。那我当然是站深度学习这一派了。


为什么?


我有三个理由:1.我不相信我们人的运动控制是靠某几个公式计算得到的,而是完全的神经网络控制。也就是从仿生学的角度传统控制流派就不是通往AGI的方式。2. 传统控制流派很难处理机器人通用化的问题。我们完全可以认为传统控制方法都是人为设计出来的一套方法,这和计算机视觉以前人工设计方法提特征是一样的,这必然导致其局限性。而学习型算法则潜力无限,可以学出任意的控制方法。3.机器人智能化面对的核心问题不仅仅是最底层的控制,而是高层的逻辑推理决策问题。而逻辑推理决策这本身就不是传统控制流派能做的。最后额外的理由就是目前的Google,DeepMind,OpenAI这几个最前沿的AI研究机构都站队深度学习这派,肯定是有它的原因的,这就是前沿,就是未来。





相信看过西部世界的朋友都对这个迷宫非常熟悉,实际上我对于AGI的实现想法也和这个迷宫的想法一样,是一个由外到内的过程。比如目前深度学习从X到Y的Mapping,比如机器人简单的能动,能走这些都是智能最最外层的东西,传统控制也不过是这最外层上面的一小点。往内是什么,是逻辑,是推理,是思想,以及到最后的情感,自我意识。这些和传统控制一点关系没有,而深度学习基于神经网络的技术则有可能往内突破。Deep Learning的下一步是Meta Learning学会学习,那Meta Learning的下一步是什么?在我看来就是逻辑推理,这是更往内的东西,也显然是更困难的事情。


3. 有哪些有意思的学习型初创公司呢?


下面我们就来说说4家初创公司吧,3家在硅谷,一家在日本:


(1) Osaro http://www.osaro.com



Osaro这家公司算是创立的比较早了,在DeepMind出来DQN之后很快就创立了。我们谈学习型的机器人初创公司最核心的都是基于深度增强学习Deep Reinforcement Learning,做端到端的学习控制。


这个公司来头不小:



有Peter Thiel等大佬的投资,还有Richard Sutton这位增强学习祖师爷做顾问。


那他们现在在做什么呢?还是机器人抓取。他们和日本餐饮公司合作,实现了落地:



抓取不规则的鸡块放入餐盒,这确实是一个非常有挑战性的任务,基于DRL得到了实现。


(2) Kindred https://www.kindred.ai/


这公司也是以机器人抓取为主打,也同样是使用深度增强学习技术。有腾讯的投资。这家公司完全以物流分拣入手,研究机器人分拣各类不规则物体,比如下图的衣服可能相比鸡块更有挑战性。




这家公司相比Osaro,会发一些paper来体现他们的学术科研能力。这次CoRL2018还开源了一个机械臂的深度增强学习benchmark:



目前机器人机械臂的研究很大的问题就是没有一个benchmark,没有统一的评判标准,非常不利于学术的发展,这种benchmark就非常有益。之前是UCB的Sergey Levine团队有放出一个基于Pybullet的机械臂仿真环境,也还不错,值得研究。


(3)Covariant.ai





Covariant这家公司就比较火了,虽然什么东西都还没做出来,但是是Pieter Abbeel大神带自己的学生搞的。都是基于Deep Reinforcement Learning和Imitation Learning的技术,也都是机械臂。值得期待他们的产品。


(4)Preferred Networks https://www.preferred-networks.jp/en/


日本这家AI公司就比较牛逼了,不仅仅是做机器人,还有大名鼎鼎的Chainer框架(Pytorch就是借鉴它的)




无人驾驶,机器人,医疗都做,还有强大的AI基础科研实力做支撑,简直就是一个完美的AI公司架构啊。这家公司也是这几家初创公司目前发展最好最大的,拿到的投资也蛮多的:




并且这个公司也请了Pieter Abbeel做其顾问,上一篇blog介绍的ICRApaper就来自于这个公司。


4. 这些公司有什么特点呢?


很显然的,都是搞机械臂,都是基于深度增强学习这一技术。为什么以机械臂为切入点?因为机械臂可以说是目前最需要实现智能化通用化的一环。比如物流分拣,一年几十亿的包裹,需要多少人力去分拣呢?现在实用化的不过是一些移动平台。如果机械臂能够代替人去分拣,可以节省巨大的人力资源了。机械臂分拣这种问题相对比较简单,由于Dex-Net 4.0的出现,我们基本上可以看到落地的可能了。


5. 为什么没有中国公司?


我也查一些国内的一些机械臂相关的公司,但是很遗憾都是基于传统控制的,展示的效果也是捡取一些完全规则的物体,相比一下技术弱爆了,国内对于前沿的把握还是落后吧。我们只能说DRL不一定能成功,但是没有去试绝对不会成功。也因此,未来的机器人独角兽,机器人创新型企业恐怕也很难在中国出现。我们依然还是在copy的老路上。


6. 最后再分享两家硅谷的机器人初创公司作为结束:



Off World:这家公司已经在研究下一代月球火星的通用机器人了!






Traptic:研究农业机器人。


ps: 当我在沙漠中穿行的时候,我意识到如果能够由机器人来实现全智能种植,灌溉,那绝对是功盖千秋的事情。This is the future!


最后,本文使用的图片皆来自网络!