AI资讯01-20

162 阅读14分钟

AI资讯01-20

新闻摘要

1.OpenAI CEO将向美国官员简报先进AI代理的复杂任务能力

2.“湘江1号”健康陪护人形机器人在长沙发布

3.智谱被列入实体清单对国内大模型行业的影响

4.中国AI黑马DeepSeek引发硅谷震动

扫码加入AI交流群

获得更多技术支持和交流

(请注明自己的职业)

123

1.OpenAI CEO将向美国官员简报先进AI代理的复杂任务能力

OpenAI首席执行官Sam Altman计划于1月30日在华盛顿特区与美国政府官员进行闭门会议,讨论新技术,可能涉及能够执行复杂人类任务的“博士级超级代理”。据报道,OpenAI计划推出名为“Operator”的AI代理,能够为用户执行网页浏览相关任务。该技术预计将在1月作为研究预览发布,并通过开发者API提供。尽管AI代理技术并不新鲜,其他公司如Anthropic PBC也有类似产品,但OpenAI的代理可能在自动化任务方面更进一步。尽管如此,AI行业常常伴随炒作,过去OpenAI的发布有时未达预期,因此此次发布也引发了一些怀疑。

2.“湘江1号”健康陪护人形机器人在长沙发布

1月18日,湖南超能机器人技术有限公司在长沙发布了全球首个专注于健康陪护的人形机器人“湘江1号”。该机器人由企业自主研发,具备完全自主知识产权,基于全链条人工智能技术中台研制。通过与湘江实验室、中南大学湘雅医学院等合作,突破了多模态AI预训练模型的具身智能关键技术,实现了人形机器人肢体三维精准定位与控制,并融合了医疗健康垂类大模型,达成了人机深度共融。机器人采用新材料替代传统金属件,提升了灵活性与续航能力,且全面应用国产化技术,实现自主可控。“湘江1号”具备多种健康陪护功能,如助医、助行、助餐等,能为行动不便者提供全方位支持。公司计划在未来两年内实现产品定型和小批量生产,并在三年内实现规模定制与批量生产,目标成本降至10万元以内。此外,公司还发布了基于健康智联网的超能“数智健康管家”,计划在全国范围内推广健康服务机器人,助力健康中国建设。

3.智谱被列入实体清单对国内大模型行业的影响

在中美AI竞争加剧的背景下,智谱成为首家被美国列入实体清单的中国大模型公司。美国商务部将智谱及其关联公司列入清单,限制其在芯片和软件等方面的供应链。智谱对此表示反对,并称其业务不会受到实质影响。智谱在大模型领域拥有自主研发的GLM架构,强调技术自主可控,并已适配多款国产芯片。然而,业内人士认为,智谱及其他大模型企业将面临更大的内外部挑战,尤其是在供应链多样化和技术自主创新方面。美国对中国AI的限制不断加码,智谱的遭遇对国内大模型企业是一次警示,促使企业更加注重供应链的多样化与技术自主可控。智谱在声明中表示,将继续为用户提供世界一流的大模型技术和服务,并在全球AI竞争中坚持高标准。未来,中国AI企业需加快自主创新,解决“卡脖子”问题,以应对日益严峻的国际竞争环境。

4.中国AI黑马DeepSeek引发硅谷震动

DeepSeek,这家被称为“AI界拼多多”的中国公司,凭借其开源AI大模型DeepSeek-V3,以极高的性价比震惊了全球AI行业。DeepSeek-V3在性能上与世界顶尖的闭源模型不相上下,且其预训练成本仅为GPT-4o的二十分之一。DeepSeek的成功在于其创新的模型架构和高效的训练技术,尤其是MLA架构,使得模型在处理用户任务时更加高效。DeepSeek的低成本策略为AI行业提供了新的思路,展示了在有限资源下实现技术突破的可能性。扎克伯格对此表示赞赏,称中国在AI领域的进步令人印象深刻。DeepSeek的崛起不仅为中国AI行业带来了希望,也为全球AI行业提供了新的发展范式。

5.2024年大模型中标情况:科大讯飞领先,百度紧随其后

2024年,中国大模型市场迎来显著增长,公开披露的中标项目达到1520个,总金额64.67亿元。科大讯飞以91个中标项目和84780.8万元的金额位居榜首,项目主要分布在通信、金融、能源等行业。百度以69个项目和37295.3万元的金额排名第二,项目集中在金融、能源等领域。智谱、火山引擎和阿里云分别位列第三至第五。央国企在大模型招投标中表现突出,科大讯飞与多家央企合作,推动行业大模型发展。

6.首个国际奶业领域垂直大模型发布,助力奶业高质量发展

近日,首个国际奶业领域垂直大模型——孺子牛大模型-AI4DLLM正式发布。该模型由中国农业大学的曹志军教授团队开发,基于GLM-4大语言模型架构,具备百亿级参数,专为奶业设计。孺子牛大模型包含牧场超级大脑、智能决策系统、仰廉数字书院和数字孪生牧场四大功能模块。牧场超级大脑利用自然语言处理技术,提供精准决策支持;智能决策系统实时监测奶牛健康和产量,确保牧场运营最佳状态;仰廉数字书院提供个性化学习资源和在线课程;数字孪生牧场通过虚拟技术模拟生产流程,提升管理效率。农业农村部和全国畜牧总站的相关负责人表示,该模型将为奶业全产业链提供智能化解决方案,提升生产效率和质量水平,推动行业规范化和技术革新。

7.OpenAI与长寿初创公司合作训练GPT-4b以延长人类寿命

OpenAI与长寿初创公司Retro Biosciences合作,训练了一款名为GPT-4b的AI模型,旨在提高干细胞生产效率。这一合作标志着AI在科学发现中的新应用。GPT-4b专注于生物研究,能够可视化将普通细胞转化为干细胞的蛋白质。与谷歌DeepMind的AlphaFold不同,GPT-4b不仅预测蛋白质结构,还在某些任务上超越了人类。OpenAI的CEO Sam Altman对公司开发通用人工智能(AGI)的能力充满信心,认为这将革新科学发现。GPT-4b使用多物种蛋白质序列和交互数据进行训练,尽管数据集较小,但在特定任务上表现出色。Retro Biosciences希望通过AI延长人类寿命十年,并在GPT-4b的建议下,成功提高了Yamanaka因子的有效性。这一合作始于Retro Biosciences的主动接洽,Altman作为主要投资者促成了这一合作。

8.OpenAI即将推出o3-mini模型,GPT系列或与o系列合并

1月17日,OpenAI CEO阿尔特曼在社交平台X上宣布,最新的o3-mini推理模型将在几周内推出。o3-mini以其快速推理能力为特色,适合对响应时间要求高的应用场景。阿尔特曼还透露,计划在2025年将GPT系列与o系列合并,可能会诞生一个结合两者优势的强大AI模型。

关于备受关注的GPT-5,阿尔特曼未提供具体时间表,仅表示仍在确定中。AI专栏作家Alberto Romero猜测,GPT-5可能已开发完成,但OpenAI可能选择不公开发布,而是用于内部模型蒸馏,以提升其他模型的性能。Romero认为,OpenAI可能会继续通过蒸馏技术优化模型性能,同时控制成本,GPT-5或许永远不会对外发布。

9.微软推出MatterGen AI模型,助力新材料研发

微软研究院发布了一款名为MatterGen的生成式AI模型,旨在为材料科学领域带来变革。MatterGen能够创造具有特定属性的新材料,极大地简化了科学家发现材料的过程。传统上,研究人员需要在实验室中花费大量时间测试元素组合,而MatterGen则通过预测尚不存在但具有实用属性的材料来加速这一过程。该模型采用扩散架构生成元素类型、坐标和晶体结构,其生成的材料稳定性是以往方法的两倍,并且更接近其最佳能量状态。MatterGen与验证工具MatterSim协同工作,形成一个集成系统,帮助研究人员根据特定需求设计材料。通过学习现有材料,MatterGen可以在几秒钟内提供实验室可能需要数年才能获得的结果,甚至提出研究人员未曾考虑的创新材料方案,如不依赖稀土元素的磁体和改进电池能量存储的方法。MatterGen的出现为电子、建筑等行业的快速创新提供了可能,加速了可持续、经济高效材料的开发。

10.理想汽车在德国慕尼黑设立首个海外研发中心,开启智能车全球化布局

理想汽车宣布在德国慕尼黑设立其首个海外研发中心,标志着中国智能车在全球汽车工业核心地带的战略布局。该中心将与德国团队合作,专注于前瞻造型设计、功率半导体、智能底盘和电力驱动四大领域的技术研发。通过德国研发中心,理想汽车不仅能更好地适应欧洲市场需求,还能借助德国在功率半导体等领域的技术优势,推动下一代技术的开发。理想汽车的全球设计体系已扩展至“两国三地”,并计划在智能化线控底盘等前沿技术上取得突破。此次布局不仅是理想汽车全球化的一步,也是其在人工智能技术领域的进一步加码,助力其实现成为全球领先AI企业的目标。

11.OpenAI 推出 GPT-4b 提升干细胞生产效率

OpenAI 开发了一款名为 GPT-4b 的创新 AI 模型,旨在提高干细胞生产的效率。该模型与长寿初创公司 Retro Biosciences 合作,专注于蛋白质工程,能够将普通细胞重新编程为干细胞。这一突破标志着生物研究的重大进展。GPT-4b 是 OpenAI 首个基于生物数据的模型,专门用于解决蛋白质工程中的挑战。与谷歌 DeepMind 的 AlphaFold 不同,GPT-4b 的任务是可视化能够转化普通细胞的蛋白质,其性能已超越人类水平。OpenAI 的这一举措表明其在科学发现中的角色不断扩大,尤其是在长寿和医学领域。GPT-4b 的训练数据包括来自不同物种的蛋白质序列和蛋白质相互作用数据,尽管规模较小,但在蛋白质工程领域取得了显著贡献。与 Retro Biosciences 的合作始于一年前,目标是通过 AI 工具推动科学和医学进步,延长人类寿命。GPT-4b 的成功为实现人工通用智能(AGI)的愿景提供了有力支持。

12.英伟达推出NeMo Guardrails AI安全套件,防范大模型“越狱”

英伟达近日发布了名为NeMo Guardrails的AI安全套件,旨在为大语言模型(LLM)提供一系列护栏规则,防止用户通过提示词“越狱”模型,生成不符合预期的内容。该套件基于英伟达的Aegis内容安全数据集训练,包含3.5万个标注样本,并已在Hugging Face上公开。NeMo Guardrails体积小、效率高,适用于多种场合,企业可将其嵌入AI模型开发中,提升医疗、汽车、制造业等领域的AI部署安全性。此外,英伟达还推出了Garak漏洞扫描工具,用于检测模型安全性,防止输出幻觉内容或泄露企业机密信息。这些措施将有效提升AI应用的安全性和可靠性。

13.广东保伦电子申请基于大模型的广播专利,提升广播灵活性

广东保伦电子股份有限公司近日申请了一项名为“基于大模型的广播方法、设备、介质及产品”的专利。该专利旨在通过大模型技术提升广播内容的生成速度和灵活性。具体方法包括采集广播区域的环境和行为数据,提取广播特征并传输给大模型,生成相应的广播信息以执行广播操作。这种方法不仅简化了操作流程,还能有效降低人力成本,快速适应广播区域的变化,确保广播内容的及时性和灵活性。广东保伦电子成立于2008年,位于广州市,主要从事计算机、通信和其他电子设备制造业,拥有丰富的知识产权和投资项目。

14.中铁科学研究院申请增强大模型插件调用能力的专利

中铁科学研究院集团有限公司申请了一项名为“一种插件调用能力微调的大模型的插件调用方法”的专利,公开号为 CN 119312930 A。该专利旨在通过微调大模型的插件调用能力来提升其性能。具体方法包括构建训练样本集,设计微调模块,并将其添加到原始大模型中。根据不同的添加方式(串并联),对微调模块进行训练,最终合并权重以增强大模型的插件调用能力。中铁科学研究院成立于2014年,位于成都市,主要从事研究和试验发展,拥有丰富的知识产权和投资项目。

15.MiniMax发布新一代01系列模型,创新引入线性注意力机制

MiniMax公司近日发布并开源了新一代01系列模型,包括基础语言大模型MiniMax-Text-01和视觉多模态大模型MiniMax-VL-01。该系列模型创新性地引入了线性注意力机制,支持最多400万个token的上下文输入,显著提升了长文本处理能力。MiniMax坚持预训练的投入,未来将专注于完善复杂编码能力和多模态agent能力。新模型已在开放平台上线,便于开发者和企业集成使用。MiniMax的技术创新吸引了全球开发者的关注,预计将推动相关应用的进一步发展。

关注「阿杰与AI」公众号

与AI时代更靠近一点

资讯汇总 ominiai.cn