新闻摘要
1.KT与微软合作,构建“韩国型”GPT与云计算
2.央企聚焦重点领域 推进专业化整合
3.重庆首个网络安全知识库大模型发布
4.加州否决SB-1047法案,AI发展获得喘息空间
5.自动驾驶大模型算法落地
6.中国公共安全与安保市场规模将突破8780亿美元
7.中国儿童健康领域AI大模型发展迈出重要一步
8.中国开源参与者数量位居世界前列,大模型开源生态渐成
9.深度学习中权重衰减的新视角
10.单靠推理 Scaling Law 难以超越GPT-4o
11.汤森路透在数据产品中融入人工智能
扫码加入AI交流群
获得更多技术支持和交流
(请注明自己的职业)

1.KT与微软合作,构建“韩国型”GPT与云计算
KT公司宣布与微软展开5年战略合作伙伴关系,旨在融合信息通信技术(ICT)和人工智能(AI)打造AICT公司。双方将共同开发韩国型GPT,将其与微软的AI模型融合,并将其应用于韩国企业和创业公司。
KT将引进微软AI和云计算服务,并将其适配韩国市场需求。此外,KT还将利用微软的Azure云平台,推出符合韩国特定法规和保护隐私需求的“主权云”服务。(主体云是一个为特定国家或行业定制的云计算服务,满足其特定安全和隐私需求)。
韩国新韩银行已经确定采用基于KT与微软合作开发的AI模型,为其金融客户提供最新AI驱动的创新服务。
这个合作将标志着KT从自主开发AI模型转向更广泛的外部技术整合。KT计划一边继续发展自有模型,例如与泰国的Jasmine集团合作开发泰语专用AI模型,一边与微软等外部巨头技术合作,以增强其AI服务能力。
2.央企聚焦重点领域 推进专业化整合
近日,国务院国资委组织中央企业专业化整合推进会暨重点项目集中签约仪式。 26家央企分四批签署了26个重点项目,包括能源、汽车、装备制造、新材料等领域。国务院国资委要求,央企要聚焦重点领域,助力战略性新兴产业发展,推动产业链供应链融合发展,锻造核心竞争优势,提升国有资本运营效率。这次签约项目涵盖了中国一汽、兵器装备集团、东风公司、南方电网等知名央企,并涉及人工智能、动力电池、稀土冶炼等多个重要领域,具有代表性和示范性。
3.重庆首个网络安全知识库大模型发布
重庆首个网络安全知识库大模型“两江智网星CyberStar”已在重庆两江新区投入使用。该模型借助人工智能技术,对大量数据进行学习和分析,形成了全面且精准的网络安全知识体系。随着数字化时代的到来,网络安全已成为企业发展的关键支撑,但网络安全领域知识广阔而复杂,相关人员常缺乏快速查找网络安全知识的途径。
“两江智网星CyberStar” 能快速检索网络安全信息,并准确回答用户问题,有效降低网络安全风险。该模型将为广大市民提供丰富的网络安全知识和最新动态,为从业者提供权威知识支持和实践建议,为推动网络安全行业智能化发展贡献力量。
4.加州否决SB-1047法案,AI发展获得喘息空间
美国加州州长Gavin Newsom否决了SB-1047法案,这项法案旨在加强大模型安全和透明性,但引发了广泛争议。许多科技界人士,包括吴恩达、Yann LeCun和李飞飞,都对该法案提出了批评,认为其过于限制性和不灵活。他们指出,法案过于关注昂贵的、大规模的模型,忽略了小型专业模型的潜在风险,同时缺乏针对不同AI应用的细化规定。
加州是全球科技创新中心,聚集了众多科技巨头和顶尖高校。SB-1047的执行将对这些机构造成重大打击,并且可能导致科技企业撤离加州。最终,加州州长Gavin Newsom 考虑到了AI技术发展的重要性,以及该法案对创新和经济的影响,决定否决该法案。
5.自动驾驶大模型算法落地
自动驾驶技术近年来快速发展,大模型算法作为其重要组成部分,在端到端顺利落地方面发挥着关键作用。大模型算法能够学习大量的驾驶数据,并从中提取出驾驶规律和决策模式,从而提高自动驾驶系统的感知、规划和控制能力。
为了让自动驾驶大模型算法更好地落地,需要解决一些关键问题,包括数据获取、算法训练、模型部署和安全可靠性等。
首先,需要收集大量高质量的驾驶数据,包括图像、视频、点云等,以便大模型算法能够充分学习驾驶场景。其次,需要设计有效的算法训练方法,提高模型的泛化能力和鲁棒性。
同时,模型部署需要考虑计算资源和通信性能的限制,以及对安全性和可靠性的要求。
6.中国公共安全与安保市场规模将突破8780亿美元
近期数据显示,中国公共安全和安保市场正处于蓬勃发展阶段。预计到2029年,这一市场规模将达8782亿美元,年复合增长率为11.0%。这一增长趋势得益于对视频监控、应急管理、网络安全、生物识别安全等技术的不断需求。
7.中国儿童健康领域AI大模型发展迈出重要一步
中国科学院宣布启动了一项旨在构建儿童健康大模型的工程项目。该项目旨在将儿童健康领域的海量数据整合,研发能够辅助诊断、预防和治疗儿童疾病的智能系统。
中国科学院院士、该项目的负责人表示,儿童健康是一个全球性挑战,对儿童健康数据的研究和分析刻不容缓。AI大模型的应用能有效提升医疗诊断准确率,并为儿童疾病的预测和治疗提供新的思路。项目团队将整合文本、图像、声音等多模态数据,利用先进的深度学习算法,构建具备多方面的认知能力的儿童健康大模型。
该项目预计将在五年内完成,带动中国儿童健康领域人工智能技术的发展,为提升儿童健康水平做出贡献。
8.中国开源参与者数量位居世界前列,大模型开源生态渐成
近年来,中国积极构建国内开源体系,并搭建国内外交流、产学研合作的重要平台,开源参与者数量、增长速度均位居世界前列。开放原子开源基金会发布了开放原子模型许可证,为大模型应用提供开放许可证,推动AI技术进步。 尽管一些企业认为开源会影响商业化发展,但开源也带来许多优势,例如克服中文数据不足问题,降低研发门槛,促进技术迭代与快速试错。通过社区合作,能够更好地解决开源技术本身面临的困境,例如算力投入产出比低的问题。同时,商业模式也可与开源相结合,共同推动AI技术的发展。
9.深度学习中权重衰减的新视角
近年来,研究人员对深度学习中权重衰减的作用提出了新的观点,挑战了传统认为权重衰减主要作为正则化技术的看法。研究表明,权重衰减在超参数化和欠参数化网络中显著影响优化动态。
研究人员使用 GPT-2 模型在 OpenWebText 数据集上进行了实验,发现权重衰减在大型语言模型 (LLM) 训练中发挥着至关重要的作用,特别是对于 bfloat16 混合精度训练。 权重衰减能够防止在 bfloat16 训练中后期出现的损失发散,从而保证模型训练的稳定性。
他们还发现,权重衰减有效地解决了浮点精度有限的挑战,例如在 float16 训练中,权重增长过快会导致数值溢出问题,而权重衰减可以有效防止这些问题。
此外,研究人员认为在数据有限的环境下,优化速度和训练稳定性比传统正则化更加重要。
10.单靠推理 Scaling Law 难以超越GPT-4o
近年来,人工智能领域热度很高,许多研究者都试图通过“规模化学习”(Scaling Law)来提升模型能力。这个理论认为,模型规模越大,性能越好。 然而,新的研究表明,单靠推理 Scaling Law 无法突破 GPT-4o 的性能。
虽然推理能力是人工智能的一个重要方面,但它不能完全决定模型的强大程度。GPT-4o 强大之处在于其庞大的知识库和复杂的语言模型架构,这些因素也对推理能力有很大影响。单纯依靠扩大体积来提升模型推理能力,效果有限。未来的研究方向可能需要探索其他方法,例如更加高效的训练算法、更大的数据量以及更先进的模型架构,才能真正超越 GPT-4o 的性能。
11.汤森路透在数据产品中融入人工智能
汤森路透公司意识到人工智能技术的巨大潜力,并加速向其核心产品注入人工智能。该公司预计未来 3 到 5 年,每个专业人士都会拥有一个生成式 AI 助手。受 GPT 模型快速发展和对 A I 商业领域投资的持续加剧的影响,汤森路透发现其现有的搜索引擎和数据库服务与 AI 语言模型的应用高度相关。
该公司在问卷调查中发现,77% 的法律、税务、风险和合规专业人士预计 AI 将在未来 5 年对他们的工作产生巨大或革命性影响。他们预计每周可以减少 12 小时的工作时间。 但用户仍然对精确性、数据安全、伦理和业务模式的颠覆持谨慎态度。
汤森路透承诺每年投入 1 亿美元用于开发 AI 功能并将它们集成到其产品中,并从原来的目标中超出。为了使这项技术更深入地应用于客户工作流程中,该公司正在扩展其生成式 AI 助手 CoCounsel,该助手能够执行多步骤流程,例如审查对话、比较和起草文件以及提供建议。
汤森路透面临的挑战包括在一个日益拥挤的 AI 工具市场中脱颖而出。该公司希望其多功能 AI 助手可以满足客户的所有需求,并且能够将 AI 集成到其所有主要行业中,包括税务和金融领域。
关注「阿杰与AI」公众号
与AI时代更靠近一点
资讯汇总 ominiai.cn