人工智能革命不会被垄断
谁将“在AI领域获胜”?目前已有数家大型机构渴望宣称这一头衔。另一些人则认为某个地区将占据主导,使其他地区远远落后。然而,除非出现真正的人工通用智能(AGI),否则没有理由相信机器学习或数据科学领域会有单一的赢家。相反,AI将遵循其他软件开发技术的相同轨迹:大量的开发者、丰富的生态系统、许多失败的项目和少数闪耀的成功案例。
“AI竞赛”概念的混淆
“AI竞赛”这一概念存在极大的混淆性。
“竞赛”的含义:
- 竞赛具有竞争性
- 竞赛有赢家和输家
- 竞赛有起点和终点
我们所说的“AI”指什么?
- 特定的消费产品?
- “人工通用智能(AGI)”?
- 技术官僚独裁?
- 机器人军队?
- 机器学习研究?
垄断的可能性分析
1. 垄断一个新的产品类别? 许多新产品将使用机器学习,其中许多可能会被垄断。被谁垄断?这是个合理的问题!但如果不同的机构创造了所有这些产品,那么谁“赢得”了AI呢?
2. 率先开发出“人工通用智能”? 从现状推断出真正的AGI非常困难。 即使有人开发出AGI,谁开发的还重要吗? 关于AGI的不同看法:
- “AGI是科幻小说” → 那么没有什么可赢的。
- “AGI是生存威胁” → 那么没有人会赢。
- “AGI将解决我们所有问题” → 那么每个人都是赢家?
3. 利用新技术压迫人民? 压迫是我们在AI领域应该讨论的风险,但这绝不是我们想要赢得的“竞赛”!
4. 赢得一场真正的军备竞赛? 政府研究将跟随,而非引领。如果每个人都公开研究成果,没有人能遥遥领先。
5. 发表最多的机器学习研究? 开放研究是协作性的,而非竞争性的。如果研究被发表,每个人都是赢家。
为何大型机构不将其研究保密? 机构发表研究的原因:
- 吸引人才:如果不允许研究人员发表成果,就无法吸引最优秀的研究者。
- 必然性:试图封锁秘密无论如何是行不通的。
- 杠杆效应:提高“AI基准线”对其业务有利。
以某届顶级机器学习会议(NIPS)的论文统计为例:
| 排名 | 机构/公司 | 论文总数 | 占比 |
|---|---|---|---|
| 1 | 某机构 | 60 | 8.8% |
| 2 | 卡内基梅隆大学 | 48 | 7.1% |
| 3 | 麻省理工学院 | 43 | 6.3% |
| 4 | 某中心 | 40 | 5.9% |
| 5 | 斯坦福大学 | 39 | 5.7% |
数据显示,没有单一实体“主导”机器学习研究。
数据能带来垄断吗?
复用数据就像复用代码。如果它不符合你的需求,就没有多大用处。 个人数据之所以重要,在于它与个人相关。通用知识很容易获取,不需要独特的专有数据集。
数据本身不会授予任何人垄断权:
- 数据存在收益递减效应。将数据集扩大10倍,并不会使其质量提升10倍。
- 获取数据的成本并不那么高昂。有什么数据集会比建造一座制造工厂更昂贵呢?
我们不会都从“AI商店”购买“AI”
机构正在内部化AI能力:
- 机器学习是软件开发,需要随着项目发展而演进。
- 没有人垄断AI专业知识,人们正在快速学习。
- 对许多应用而言,拥有和控制数据至关重要。
供应商提供的是产品,而非魔法: 挑战在于将理论上的可能性应用于实际问题。重要的是为更大的应用做出正确的决策。
技术的采用者并非陈旧和愚昧: “技术文盲管理”的刻板印象已经过时。大多数公司让开发者选择自己的工具。开发者强烈偏好开放技术,因为它们更灵活,有利于职业发展。
丰富的开源生态系统
(截至2018年11月,部分流行的机器学习/自然语言处理开源库在GitHub上的星标数举例,例如TensorFlow、scikit-learn、PyTorch、spaCy等,展示了社区的活跃度。)
那么,谁将赢得AI?
✊ AI革命不会被垄断。
- 不存在单一的“AI竞赛”——许多人正在构建许多东西。
- 没有什么等待被发现的魔法解决方案。
- 机器学习的特性并不指向垄断或赢家通吃的市场。