20240115 大模型快讯

95 阅读1分钟

基础模型拥有强大的推理、生成和泛化能力,适用于产业界中最具商业价值的任务,如精准预测和控制、高效优化决策,以及智能化、可交互的工业模拟。

//AI安全//

  1. 大模型可以学会欺骗。 OpenAI的竞争对手Anthropic研究者发现:在训练过程中给大模型植入欺骗的后门,后期无法通过监督微调等消除,并且模型的参数越大欺骗发生概率越高,加入COT会让欺骗保持得更久。

//社区生态//

  1. 中国电信开源自研大模型星辰语义,并共享1T高质量数据。 星辰语义大模型具备长文本生成、多轮对话智能问答和基于思维链的插件体系,基于星辰语义基座模型的星辰教育大模型,能够对学生英语作文的快速评分和提出修改建议。

//基础技术//

  1. Patchscopes:一个革命性的AI框架。 谷歌的AI Research提出,Patchscopes可以检查大模型的隐藏表示,帮助大模型在多步推理中的自纠正。