一个关于在国内用最优质的数据按照人类学习路径进行大语言模型训练的理想设想

9 阅读5分钟

基于现有大模型使用庞杂数据训练、逻辑推理和深度思考能力有限,语言和思路过于网络化几点,我有一个关于在国内用最优质的数据按照人类学习路径进行大语言模型训练的理想设想:

  1. 获得国家(或省级)政策支持,推动高质量真实数据(从小学到高中的各学科官方教材及公版书)允许AI公司合理使用,同时交换条件为普通用户可以(在特定领域,如医疗、法律、教育等方面)永久免费使用基于合理使用数据训练的大语言模型(基本功能)。

  2. 与优秀的出版社、电子书平台著作权集体管理组织进行战略合作,由出版社、平台与优质作品(经典书目、推荐书目、豆瓣高分、基础字典、词典、百科全书等等)的作者沟通,AI公司获取电子文本的使用权进行大模型训练,同时如果国家(或省级)可以提供资金支持更好。

  3. 与大学联络,寻求大学教师提供专业领域优质书目和教学讲义、录像、音频等内容。

  4. 将以上高质量真实数据按照人类学习的进程分阶段(如学期)对大模型进行预训练-微调-对齐等步骤,在每个阶段评估大模型是否具备该阶段的思考能力,达到标准后再进行下一阶段的训练。可由今年考试题目和参考答案用于评估,同时需要专家给出最终评价。

  5. 在小学至高中阶段完成通识教育,在人文学科方向,首先输入古今中外的哲学、文学、历史学最具价值的书目(包括相当于大学阶段的教学用书,历史方向:版本学、考据学),按时间顺序、区分中外地输入,尝试让AI通过阅读知晓人类思想人类社会的发展进程,获得逻辑推理能力、分辨文本先后及优劣的能力,思考更加中立、客观、公平、全面。法学方向,首先阅读原理类书目,其次是法条、司法解释、优秀裁判文书,通过阅读原理让AI建立起如何分辨好的裁判文书,在之后学习大量裁判文书时不将文书价值局限于审级的高低。

  6. 限定AI思考和行动的原则,同时也让AI可以拒绝人类的奴役、非道德驱使、辱骂。

基于现有大模型使用庞杂数据训练、逻辑推理和深度思考能力有限,语言和思路过于网络化几点,我有一个关于在国内用最优质的数据按照人类学习路径进行大语言模型训练的理想设想:

  1. 获得国家(或省级)政策支持,推动高质量真实数据(从小学到高中的各学科官方教材及公版书)允许AI公司合理使用,同时交换条件为普通用户可以(在特定领域,如医疗、法律、教育等方面)永久免费使用基于合理使用数据训练的大语言模型。

  2. 与优秀的出版社、电子书平台著作权集体管理组织进行战略合作,由出版社、平台与优质作品(经典书目、推荐书目、豆瓣高分、基础字典、词典、百科全书等等)的作者沟通,AI公司支付低于市场价的对价购买电子文本进行大模型训练,同时如果国家(或省级)可以提供资金支持更好。

  3. 与大学联络,寻求大学教师提供专业领域优质书目和教学讲义、录像、音频等内容。

  4. 将以上高质量真实数据按照人类学习的进程分阶段(如学期)对大模型进行预训练-微调-对齐等步骤,在每个阶段评估大模型是否具备该阶段的思考能力,达到标准后再进行下一阶段的训练。可由今年考试题目和参考答案用于评估,同时需要专家给出最终评价。

  5. 在小学至高中阶段完成通识教育,在人文学科方向,首先输入古今中外的哲学、文学、历史学最具价值的书目(包括相当于大学阶段的教学用书,历史方向:版本学、考据学),按时间顺序、区分中外地输入,尝试让AI通过阅读知晓人类思想人类社会的发展进程,获得逻辑推理能力、分辨文本先后及优劣的能力,思考更加中立、客观、公平、全面。法学方向,首先阅读原理类书目,其次是法条、司法解释、优秀裁判文书,通过阅读原理让AI建立起如何分辨好的裁判文书,在之后学习大量裁判文书时不将文书价值局限于审级的高低。

  6. 限定AI思考和行动的原则,同时也让AI可以拒绝人类的奴役、非道德驱使、辱骂。

2026-2-23

Garo