AI辩手背后的原理IBM的Project Debater开始成为最强辩论机器，其背后依据的是什么技术？AI辩手这个ID在

IBM的Project Debater开始成为最强辩论机器，其背后依据的是什么技术？

2023-05-10 21 05 39.png

很有幸在美好的周日(抽奖二等奖拿了个xiaomi充电宝)享受了有别于的长时间信息吞吐，我也才知道IBM推出了Project Debater(卷ai的另一种应用)我更多兴趣在能讨论出什么观点。

其实Project Debater并没有用到训练Alpha Go的强化学习工具。强化学习是机器学习中一个重要的类型，其典型特点就是在没有人为指导的情况下，通过不断的“试错”获得反馈来提升任务性能。

Project Debater 的训练中使用了深度神经网络和弱监督学习。深度神经网络（DNN）和弱监督都要用到有标签的数据去培训机器做出正确的回答。

据介绍，除了人工标签，研究人员还教会Project Debater通过关键词判别标签，比如一旦句子中出现“认为”、“想”、“假定”、“相信”等表达，这就判定为属于陈述内容。科学家开发了多种工具和方法，以弱监督方式训练DNN，以获得训练需要的大量人工标记的高质量数据。

AI辩手这个ID在辩论场上可以理解为是为了赢，根据各种语料库和依靠强大的最优化算法（其实已经更intelligent）来选择概率最大的赢法。反方这块举证，“地板论-定义战”是赢面相对更大所以AI辩手会去打地板论，emmm辩论赛不同于当时AlphaGo下围棋，辩论赛相对更主观，我很喜欢当时评委提到的“法无定法”的思想。因此，我猜测AI辩手可能也不一定过程之中一直打定义，更启发的论点和思路也可能会有的（plus 如果事实真是地板论，那可以向researcher反映一下）

还有点就是AI辩手带来的增量问题，在我看来把AI当工具增量一定有，就如GPT能够增加思考的视角以及时间，至于考虑到节省出备赛时间拿来干嘛？是不是会损害辩手的独立思考？是不是以后辩论的攻防都是透明化？我很喜欢正方的思想“没有义务去论证深度思考，但是可以保留我们深度思考，不会割舍不下对辩论的尊重”。

前些流行的AutoGPT其实通过prompt learning 其实已经可以给辩手当一个AI Assitant，或者甚至是一个AI辩手。但由于ai基于big data，人类基于最强智能（Your Brain🧠 ），再者由于辩论赛面向human的特殊性，人类不一定会比AI差，我们通过辩论比赛得到的不只是model answer。

谢谢辩论。