ChatGPT 的优点| 豆包MarsCode AI刷题

90 阅读4分钟

一、ChatGPT 的优点

(一)可处理多种 NLP 任务

在 ChatGPT 发布前,NLP 领域多针对特定任务独立开发模型,如中英机器翻译模型只能完成单一翻译功能,若涉及其他任务需更换相应模型,且定制不同语言翻译等任务还需大量标注对应语言数据,整个 NLP 产业处于传统手工业模式。而 OpenAI 从 GPT2 开始研究多任务模型,至 ChatGPT 已实现让用户可提出各类问题,它能完成编写代码、做数学题、编写诗歌等多种任务,标志着 NLP 领域进入工业时代,已成为基于文字模态的通用 AI 模型,不再局限于过去特定的 NLP 任务。

(二)减少对大规模标注数据的依赖

AI 模型通常依赖大量标注数据来提升效果,但 ChatGPT 主要依靠至少上百 GB 的大规模非标注高质量文本语料,在 RLHF 阶段也仅使用远少于预训练语料的数据完成训练。这使得很多互联网科技公司在制作对标大语言模型时,一定程度上受益于无需依赖超大规模标注数据(虽标注数据越多模型质量越好的法则不变)。

二、ChatGPT 的缺点

(一)存在严重的幻觉妄语现象

ChatGPT 常编造信息,出现类似 “幻觉妄语” 的情况。例如对 “宫廷玉液酒” 的理解有误,将其当作概念解释而非理解为对暗号的内容,还会出现如误把艾伦图灵当作电线发明者等事实性错误。即使后续推出的 GPT4 该情况有所改善,但仍不是完全可靠的知识库,不能完全替代搜索引擎。其原因在于它是基于概率论构建的神经网络模型,在推理阶段易犯错,且本质上更关注回答是否像人类话语,而非内容真实可靠。

(二)无法连接外部实时信息

ChatGPT 本身无法回答实时性很强的问题,不能连接搜索引擎获取最新信息反馈给用户,所以不能完全替代搜索引擎,不过可作为搜索引擎入口的优化。微软的 NewBing 和 OpenAI 在网站中的相关做法是通过将用户问句先交予搜索引擎获取结果,再让 ChatGPT 基于此做阅读理解来回答实时性问题。

(三)不具备真正的思考和推理能力

ChatGPT 做数学题虽能给出答案及解题过程,但实际上这些内容多来自预训练语料。若题目不在其预训练语料中,大概率无法解答。它就像死记硬背题型的学生,通过大量数据记住解答方式,并非真正懂得背后原理,能融会贯通进行创新思考。所以目前它只是弱人工智能顶峰,距离强人工智能还有差距,无法替代人完成如科研论文核心创新观点等需要创造力的工作。

三、ChatGPT 对社会的影响

(一)对搜索引擎市场的影响

ChatGPT 虽不能完全替代搜索引擎,但作为方便人类交流的接口途径,极大优化了用户查询信息的体验,已对搜索引擎市场地位构成挑战,如 Google 搜索量统计指数逐渐下滑。

(二)对教育行业的影响

教育中知识记忆占比较大,ChatGPT 擅长提供客观知识点答案,其出现可能促使教育行业更加注重逻辑推理、人文欣赏、创新创造能力,对当前教育行业格局产生冲击,引发行业洗牌。

(三)对就业的影响

  • 对 NLP 相关岗位的冲击:制作 ChatGPT 成本高,多为大型互联网公司有能力制作,未来可能不需要那么多 NLP 算法工程师和标注员。
  • 对文字相关工作的冲击:新闻记者润色新闻稿、电商客服对接咨询、笔译人员等与文字材料相关工作都将受到影响,ChatGPT 及其相关工具正在改变整个社会的就业环境,减少脑力劳动岗位数量。

四、总结

ChatGPT 跨越了 NLP 分任务限制并减少标注数据依赖,推动 NLP 领域发展,但仍存在如幻觉妄语、缺乏思考推理能力、无法连接外部信息等明显缺陷。其对社会影响深远,不仅改变了信息查询方式,还冲击了教育行业和就业市场,是 AI 改变世界的重要引子。