新闻摘要
1.腾讯全新一代万亿参数大模型混元Turbo震撼发布
2.元象发布国内首个MoE大模型,助力低成本AI应用
3.OpenAI o1聊天机器人新功能解析
4.360联合组长国家"大模型测试基准研究组"
5.百度将AI应用作为核心发展方向?
6.作业帮携AI编程及大模型亮相服贸会
7.亚马逊加入C2PA标准组织,致力于识别AI生成内容
8.公众钟爱科技巨头,华为、大疆、比亚迪领跑研发
9.中国金融科技加速AI大模型应用集成
10.人工智能生成的虚假研究论文泛滥学术搜索引擎
11.华为预测大模型助力宝钢生产控制成功
扫码加入AI交流群
获得更多技术支持和交流
(请注明自己的职业)

1.腾讯全新一代万亿参数大模型混元Turbo震撼发布
近日,腾讯正式发布其新一代旗舰大模型——混元Turbo。该模型基于万亿参数,采用全新的分层异构MoE架构, 显著提升了推理和训练效率。拥有更高的参数规模和更低的推理成本(降低50%),推理时延也减少了20%。混元Turbo在权威第三方评测中表现出色,在国内大模型领域排名第一,超过其他同类产品。
与前代混元Pro模型相比,混元Turbo在各项基准测试中表现都更加出色,将与国际顶尖模型的差距进一步缩小。混元Turbo的出色表现得益于腾讯在Pretrain和Postrain两个阶段的创新策略。在Pretrain阶段,腾讯遵循了Scaling Law理念,采用高效异构MoE架构和优化激活机制,大幅提升训练效率。同时,为了填补大模型在文理科学能力上的不足,腾讯专门强化了混元Turbo在高质量文本创作、数学、逻辑推理等方面的能力。混元Turbo在文本创作领域表现出色,尤其是在专业写作方面,其能够完成复杂指令,并在高考作文测评中取得第一名。
此外,混元Turbo 在数学和逻辑推理能力方面也有显著提升。腾讯通过扩展数学题库和模拟训练,结合蒙特卡洛树搜索技术,有效增强了模型解题能力。 在逻辑推理方面,腾讯通过建立问题抽取和评价模型,提升了推理能力的广度和质量。混元Turbo还支持AI搜索联网插件功能,整合腾讯丰富的生态资源,提供更便捷的深度问答和信息获取体验。
该模型的背后支撑的还有腾讯自研的 Angel 机器学习平台。该平台优化了多项关键技术,有效提升了训练效率和降低了成本,并支持更长的窗口,实现高达10M的训练能力。
标题: 腾讯科技掀起新AI热潮:推出万亿参数大模型混元Turbo
2.元象发布国内首个MoE大模型,助力低成本AI应用
元象科技发布中国首款大型MoE开源模型,名为XVERSE-MoE-A36B。该模型拥有总参数255B,激活参数36B,性能相当于100B参数模型,训练时间减少30%,推理性能提升100%。元象以「高质量开源」为目标,将整个模型开源免费商用,以便为中小企业、研究机构和开发者提供辅助。
莫式专家模型(MoE)是目前最先进的模型架构之一,通过将多个专家模型组合成一个超级模型,突破传统扩展定律的限制,在扩大模型规模时,保持高性能同时减少计算成本。XVERSE-MoE-A36B在MoE架构方面进行了深入探索,包括4D拓扑设计、专家路由与预丢弃策略、通信与计算重叠以及动态数据切换等技术,使得模型训练效率大幅提升,性能达到业界领先水平。
此次开源,是元象在通用人工智能(AGI)领域持续耕耘的成果之一。先前,元象曾发布过中国最大参数开源模型XVERSE-65B和支持25万汉字输入上下文的全球首款大模型,此次MoE开源,为国内AI生态发展提供了强有力支持,也展示了元象在AI领域的领先地位。
3.OpenAI o1聊天机器人新功能解析
OpenAI发布了新的聊天机器人模型o1,它相比GPT-4在解决科学、编程和数学等复杂任务方面表现更出色。o1在编程竞赛、美国数理奥赛和科学测试中都取得了超越人类水平的结果。专家称,o1更适合特定领域专业人士,如律师、程序员、科学家等。在新机型中,OpenAI更加关注“思考”过程,并让其在处理逻辑推理方面得到提升。
测试表明,o1在某些领域(如生物学等)的表现优于GPT-4,也具备更长思考时间的特点,并在处理信息时会进行分析和推理。然而,其在创意写作方面表现可能不如GPT-4。
4.360联合组长国家"大模型测试基准研究组"
最近,由工业和信息化部和国家标准化管理委员会指导的全国信标委人工智能分委会会议在青岛召开。会上,360集团被任命为"大模型测试基准研究组"的联合组长单位。
这是继360被工信部授予“国家人工智能标准化总体组大模型专题组”组长单位后,又一重要的里程碑。
研究组旨在推动人工智能标准化工作的规范化、高质量发展。360积极响应国家号召,将大模型应用于各行各业,并取得显著成果。 "360智脑"已为20多个行业提供大模型企业级解决方案,同时组建GPT产业联盟,与合作伙伴合作推动产业数字化转型。
360已发布了"AI助手",接入国内16家主流大模型,并提出"用AI重塑安全"的理念,研发出基于人工智能的安全大模型,显著提升了安全检测能力。
5.百度将AI应用作为核心发展方向?
最近,关于百度放弃通用基础大模型的传闻甚嚣尘上。但百度官方回应称纯属谣言,并表示将持续加大基础大模型研发投入。不过,外界一致认为,百度在新一代人工智能时代将更加重视AI应用开发。
相较于专注于模型技术本身,百度的AI应用开发路线更符合当前市场趋势。许多分析认为,高成本的模型研发与相对有限的应用商业化回报让人们开始重新审视AI产业的未来。
百度高层多次强调“卷模型没有意义,卷应用机会更大”,并表示希望开发者基于文心大模型开发更多AI应用。该公司也推出了三款AI开发工具,旨在加速AI应用落地。
尽管百度做出了明确的表态,但AI应用的路径依然存在一些争议。部分内部员工认为,目前百度展示的某些“智能体”反而显得过于简陋,缺乏实际价值。此外,一些开发者也对百度将算法和数据暴露给自身平台保持谨慎态度。
未来,百度将如何平衡大模型研发与AI应用开发,并将其转化为实际的商业收益,将是公司发展的重要考验。
6.作业帮携AI编程及大模型亮相服贸会
2024年服贸会在北京举行,作业帮编程与云思智学携最新成果亮相教育服务专题展。作业帮编程展示了全新升级的AI编程产品和课程体系,包含智能停车场、智能家居、智慧农业等AI编程科创项目,通过项目实践形式,引导孩子以探究为主,培养问题解决能力和社会责任感。
云思智学展示了作业帮大模型,该模型具备多学科知识解答能力,还能够实现创意写作、自主提问、陪伴式辅导等功能。 作业帮大模型通过教研资源生产、精准作业设计和智能教学助手等应用提升了教师的教学效率,并在云思智学高质量作业等产品得到广泛应用。云思智学基于AI能力、数据能力、资源能力、开放能力等积累,开发出了高质量作业、智慧课堂、课后服务、智慧体育等产品服务,助力教育教学数字化转型。
7.亚马逊加入C2PA标准组织,致力于识别AI生成内容
随着人工智能技术的发展,深fake和合成媒体越来越普遍。为了识别内容的来源,许多机构都在努力完善数字水印技术。其中,C2PA(内容源和真实性联盟)是一个致力于解决在线虚假信息问题的开放技术标准机构。
亚马逊近日加入了C2PA的管理委员会,并承诺会在其生成的图片和视频中使用C2PA的“内容证书”(Content Credentials)技术,以便用户可以验证内容的来源和真实性。亚马逊表示,将“内容证书”技术整合到AWS Elemental MediaConvert视频处理服务中,让新闻机构和体育转播公司等能够在传播视频内容之前核实其来源。
C2PA希望将“内容证书”标准化,以减少虚假信息在数字媒体生态系统中传播。除了亚马逊,C2PA还包括谷歌、Meta、OpenAI、微软、BBC和英特尔等多家大型科技公司和机构参与。 但同时,也有一些人担心C2PA的决策可能会偏向其创始成员,比如Adobe。为了应对这些担忧,一个叫做“Creative Origin Alliance”(创作起源联盟)的新组织成立,旨在为隐私、开源技术和小型机构提供支持,并为数字内容认证提供一个更加民主和透明的选择。
8.公众钟爱科技巨头,华为、大疆、比亚迪领跑研发
近期,中国人民大学中国调查与数据中心发布的《全国公众科技创新认知度调查报告》显示,公众对科技创新成果的认可主要集中在三大梯队。首梯队包括华为、大疆、比亚迪,涵盖通信、无人飞行器和新能源汽车等领域。第二梯队则由科大讯飞、腾讯、小米、字节跳动、阿里、国家电网、宁德时代等科技巨头和互联网公司组成。最后的第三梯队由百度、京东、电信等20家企业构成。 值得一提的是,公众对科研院所和民营企业的科技创新贡献普遍认可度较高。科大讯飞作为人工智能领域的领军企业,在语音识别技术等方面取得了巨大突破,为社会经济发展做出了重要贡献。多年来,科大讯飞一直致力于赋能教育、医疗、金融、汽车等多个领域,助力民生福祉和产业高质量发展。
9.中国金融科技加速AI大模型应用集成
近期,金融科技领域备受关注,众多企业积极推动场景化应用,将AI大模型与金融行业融合更深。
调研显示,绝大多数金融科技企业看好大模型在金融领域的应用前景,部分企业已布局相关技术和产品。 然而,通用大模型难以满足金融特定需求,训练领域大模型也面临数据质量低、精度不足的挑战。
尽管如此,金融科技企业正在积极探索AI大模型的应用,并加大在技术方面的投入,如奇富科技在研发团队和人工智能联合实验室建设等方面持续投入大量资源,以推动中国金融科技的全球领先地位。
10.人工智能生成的虚假研究论文泛滥学术搜索引擎
近年来,利用人工智能,尤其是ChatGPT生成的虚假研究论文正在大量涌现,污染着Google Scholar等学术搜索引擎。哈佛肯尼迪学院的《虚假信息评论》期刊发表的一项研究指出,学术期刊、档案馆和存储库越来越多的出现可疑的论文,这些论文很可能使用生成式人工智能编写而成。研究人员分析了谷歌学术中显示GPT痕迹的论文样本,发现其中139篇论文是可疑的。这些论文散布在主流学术期刊和非索引期刊,涉及健康、计算和环境等敏感领域,易受虚假信息传播影响。虽然删除这些虚假论文是可行的,但研究人员警告称,这样做可能会加剧阴谋论,因为新冠疫情期间的“反疫苗”运动和持续存在的对气候变化的否认,都表明撤回错误出版物往往会导致这些运动更加流行。研究人员还指出,人工智能生成虚假论文存在两个主要的风险:第一,虚假研究论文的泛滥可能会淹没学术交流体系,并危及科学记录的完整性。第二,存在着人工智能工具能够生成具有说服力的假科学内容,并被公开的学术搜索引擎检索到的可能性,这可能会破坏公众对科学知识的信任,并对社会造成严重风险.
11.华为预测大模型助力宝钢生产控制成功
华为公司与宝钢股份合作开发的基于盘古预测大模型的自动宽度控制模型正式应用于宝钢热轧1880产线。这个项目标志着大模型技术第一次被用于钢铁制造行业的实时生产控制,也为以大数据和AI为核心的智能化生产运营应用开了先河。
项目团队克服了数据采集处理不准确、推理结果时延等难题,经过三个版本迭代,最终成功实现了大模型在生产控制环节的闭环控制。
下一步,宝钢将与华为继续合作,将大模型应用的经验拓展到更多产线,为钢铁行业的智能化转型发展做出贡献。
关注「阿杰与AI」公众号
与AI时代更靠近一点
资讯汇总 ominiai.cn