IBM的Project Debater开始成为最强辩论机器,其背后依据的是什么技术?
很有幸在美好的周日(抽奖二等奖拿了个xiaomi充电宝)享受了有别于的长时间信息吞吐,我也才知道IBM推出了Project Debater(卷ai的另一种应用)我更多兴趣在能讨论出什么观点。
其实Project Debater并没有用到训练Alpha Go的强化学习工具。强化学习是机器学习中一个重要的类型,其典型特点就是在没有人为指导的情况下,通过不断的“试错”获得反馈来提升任务性能。
Project Debater 的训练中使用了深度神经网络和弱监督学习。深度神经网络(DNN)和弱监督都要用到有标签的数据去培训机器做出正确的回答。
据介绍,除了人工标签,研究人员还教会Project Debater通过关键词判别标签,比如一旦句子中出现“认为”、“想”、“假定”、“相信”等表达,这就判定为属于陈述内容。科学家开发了多种工具和方法,以弱监督方式训练DNN,以获得训练需要的大量人工标记的高质量数据。
AI辩手这个ID在辩论场上可以理解为是为了赢,根据各种语料库和依靠强大的最优化算法(其实已经更intelligent)来选择概率最大的赢法。反方这块举证,“地板论-定义战”是赢面相对更大所以AI辩手会去打地板论,emmm辩论赛不同于当时AlphaGo下围棋,辩论赛相对更主观,我很喜欢当时评委提到的“法无定法”的思想。因此,我猜测AI辩手可能也不一定过程之中一直打定义,更启发的论点和思路也可能会有的(plus 如果事实真是地板论,那可以向researcher反映一下)
还有点就是AI辩手带来的增量问题,在我看来把AI当工具增量一定有,就如GPT能够增加思考的视角以及时间,至于考虑到节省出备赛时间拿来干嘛?是不是会损害辩手的独立思考?是不是以后辩论的攻防都是透明化?我很喜欢正方的思想“没有义务去论证深度思考,但是可以保留我们深度思考,不会割舍不下对辩论的尊重”。
前些流行的AutoGPT其实通过prompt learning 其实已经可以给辩手当一个AI Assitant,或者甚至是一个AI辩手。但由于ai基于big data,人类基于最强智能(Your Brain🧠 ),再者由于辩论赛面向human的特殊性,人类不一定会比AI差,我们通过辩论比赛得到的不只是model answer。
谢谢辩论。