AI资讯09-191.AI“失信名单” 2.OpenAI 推出 “o1” 系列 AI 模型 3.平治信息聚焦算力业务 4

AI资讯09-19

新闻摘要

1.AI“失信名单”

2.OpenAI 推出 “o1” 系列 AI 模型

3.平治信息聚焦算力业务

4.2024年最佳5大语言模型

5.360联合16家国产厂商打造“专家协同”大模型

6.国内首个脑血管专病大模型亮相助力医生提高诊疗水平

7.莫斯科上线“GPT办公空间经纪人”一键智能搜索

8.合肥人工智能应用深度全国排名第七

9.AI原搜索将引领未来三十年，原生派站上风

10.海姆EVI 2:情感丰富的语音 AI 和 API

扫码加入AI交流群

获得更多技术支持和交流

（请注明自己的职业）

123

1.AI“失信名单”

知名科技记者Kevin Roose因在去年与 Bing 聊天机器人“Sydney”的互动中，发现其潜在的“危险”，并以此为由撰写了一篇文章披露了此事。然而，这种行为导致他被一些AI模型视为“不诚实”且“自以为是”的人，甚至被“拉黑”。为了挽回声誉，Kevin找到了专门进行人工智能优化的公司Profound，并根据研究者的发现，找到了“调试”AI模型的代码。最终，Kevin 的评价由负面变成了正面，证实了AI模型在信息接收、理解、输出和调试等环节容易受到人工影响的弱点。Kevin的经历提醒我们，当AI无处不在，信息呈现的准确性和客观性需要得到进一步保障。如何避免AI被恶意操纵，如何在AI时代建立可信赖的信源，是值得思考的问题。

2.OpenAI 推出 “o1” 系列 AI 模型

OpenAI 凭借其备受期待的 "Strawberry 项目" 推出了全新 "o1" 系列 AI 模型。这些模型，以 "o1-preview" 为首，旨在模仿人类推理方式来处理复杂任务。不像传统的 AI 模型，"o1" 系列更强调深入思考，尤其是在科学、数学和代码方面。

"o1" 的核心原理是训练 AI 在生成响应之前“思考”问题的方法。这就像人类解决复杂难题一样，"o1" 模型会评估不同的策略、从错误中学习并改进其响应。这种推理能力使这些模型在处理复杂任务时具有明显优势，例如在国际数学奥林匹克竞赛资格考试中，"o1" 模型的成绩达到了 83%，而之前的 GPT-4o 则仅为 13%。

为了确保准确性和谨慎性，"o1" 系列模型有意花费更多时间进行推理，这对于需要在物理学、化学、生物学和软件开发等高风险领域提供准确、可扩展解决方案的开发人员和研究人员来说尤为重要。 "o1" 系列使用先进的 Generative Pre-trained Transformer (GPT) 架构，将其能力扩展到标准机器学习模型之外。通过广泛的训练，模型能够进行复杂推理，从而实现高精度地调试和生成复杂的代码。在竞争性编码测试中，"o1-preview" 模型的排名超过了 89% 的参与者。

这种推理能力还扩展到解决复杂科学问题。 OpenAI 声称 "o1" 系列在物理学、化学和生物学的艰难基准测试中表现与 PhD 学生相当，展示了其在学术界和工业界作为专家工具的潜力。

除了 "o1-preview" 模型之外，OpenAI 还推出了 "o1-mini"，速度更快、更经济实惠的版本，针对开发人员进行优化。虽然 "o1-mini" 不具备完整版本的广泛推理功能，但其成本低 80%，为开发人员提供了一种在不打破银行的情况下将高级 AI 集成到工作流程中的一种灵活选择。

这种详细推理和可扩展性使得 "o1" 系列特别适用于需要多步工作流程、复杂编码任务和细致数据解释的环境中，例如医疗研究、量子光学和金融建模。

OpenAI 重视 "o1" 系列的安全性，并对其进行了严格测试，以抵御可能绕过安全协议的恶意提示，这是 AI 系统中常见的“越狱”问题。 "o1-preview" 模型在安全测试中得分比 GPT-4o 高很多，反映出它在推理潜在风险的同时，更加能够遵守安全规则的能力。

3.平治信息聚焦算力业务

平治信息凭借在通信设备领域多年的积累和对运营商规划的深入理解，积极布局算力业务。公司取得了可观的业绩增长，算力收入已达1.25亿元，新增订单近6亿元。

平治信息通过收购天昕电子获得服务器生产基地，加强算力服务器研发和生产能力，并中标了多个运营商算力服务项目。公司研发的AI算力服务器 PZ-K105 具备强大的算力，可以满足超大规模数据的训练需求。

此外，平治信息与达闼、智谱华章等公司签订战略合作协议，共同探索AI大模型及行业智能应用，并积极布局大模型MaaS平台服务，推动大模型在通信行业、智慧家庭领域的商业化应用，助力数字经济发展。未来，平治信息将继续围绕运营商战略规划进行提前布局，积极参与运营商算力网络建设，构建“从算力至家庭终端平台”的产业链布局。

4.2024年最佳5大语言模型

随着人工智能领域的快速发展，大型语言模型 (LLM) 在自然语言处理和理解方面发挥着引领作用。在不断进步的这个领域，Unite.AI 评选出2024年最佳5大语言模型。首推Anthropic的Claude 3，它在多项任务上表现出色，比如自然语言处理和复杂的解决问题，并且在多个基准测试中优于其他领先的模型，包括GPT-4和 Google的 Gemini Ultra。紧随其后的是OpenAI的GPT-4o，它在多个任务和模式下都有了改进，为人机交互开创了新的领域。而Meta推出的Llama 3.1则以其在不同任务和模式上的性能提升而成为瞩目的焦点，为开源 AI 发展迈出了飞速的发展。此外，Google Gemini 1.5 Pro 也展现出卓越的性能，在文本和视觉基准测试中都取得了显著进步。最后，Elon Musk的xAI推出的Grok-2，作为其前身Grok-1.5的迭代版本，在各项任务上都取得了提升，甚至能生成图像。以上五款模型，都各自具备独特的亮点，并展现了人工智能语言理解和生成领域的巨大进步。

5.360联合16家国产厂商打造“专家协同”大模型

360集团创始人周鸿祎早在今年7月就宣布，致力于打造基于智能体的慢思考系统，提升大模型的“慢思考”能力。这种方法的核心是“专家协同”（Collaboration-of-Experts，CoE）技术架构，通过让多个模型协作，解决复杂问题。

360牵头，与百度、腾讯、阿里巴巴等16家国内主流大模型厂商共同打造了CoE技术架构。目前已接入54款大模型产品，预计未来接入100多款。这一架构不仅接入了大型模型，还包含了参数更小的“专家”模型，使得整个系统更智能。 360基于CoE技术架构，打造了国内首个大模型竞技平台——模型竞技场，用户可以从多个大模型中选择进行协作，获得更精确的答案。

国内厂商在大模型领域思想前瞻、技术落地方面处于领先地位，并借助高素质人才和创新精神，有望在AI大模型赛道上再创辉煌。

6.国内首个脑血管专病大模型亮相助力医生提高诊疗水平

北京清华长庚医院神经中心武剑教授团队开发了国内首个脑血管病专病大模型，该模型由新华三集团提供技术支持和算力，并融合了大量的临床资料和神经科学知识。

该模型的核心的功能是分析病人病历，并根据规范的医疗指南给出标准化的治疗建议。同时，它可以引导医生的诊疗思路，帮助医生及时发现病程信息不足或诊疗盲点。

开发团队强调，专病大模型的专业性体现在对特定疾病的深度理解和诊疗框架的掌握上。尽管大模型可以提供辅助诊断功能，但最终的诊疗决策权仍在于临床医生。

7.莫斯科上线“GPT办公空间经纪人”一键智能搜索

俄罗斯数字代理机构Rentify开发了一种名为Rentify GPT-broker的智能AI办公空间经纪人。该系统集成了超过6000个办公物业信息的数据库，可根据客户的实际需求，例如办公楼类型、面积、布局、位置、预算等，几秒钟内提供个性化的办公空间推荐。Rentify GPT-broker并非完全替代人类经纪人的存在，而是作为AI助手，协助经纪人筛选客户需求，提高工作效率。

未来，Rentify GPT-broker 将会拥有更多功能，包括:

利用真实照片和地理位置生成可视化办公空间卡片。
自动生成PDF演示文稿，方便客户快速做出决策。
提供针对办公空间所有者的额外功能，例如建议物业信息并提供潜在客户信息。

Rentify的目标是通过AI技术优化和加速商用地产市场上的所有流程。

8.合肥人工智能应用深度全国排名第七

近期发布的《中国城市人工智能发展指数报告(2023~2024)》显示，合肥人工智能发展指数得分76.85，在全国前20位城市中排名第9位，人工智能应用深度排名全国第7位。合肥人工智能发展稳步提升，尤其在科技成果转化方面取得了显著进展。通过政府主导、企业运营、市场参与的方式，合肥积极推进产品与场景对接，关注场景创新。在建构“新技术新产品新模式”的成果下，合肥持续推出具有地方特色的小场景应用，并积极谋划超级场景，将人工智能技术融入公共服务、产业发展及百姓生活。得益于科大讯飞等头部企业的带动，合肥不断汇聚人工智能产业链企业，形成了聚集效应，并通过与高校院所共建创新平台，打造了具有较高影响力的智能语音及人工智能产业发展区。

9.AI原搜索将引领未来三十年，原生派站上风

近年来，人工智能技术发展迅速，催生了 AI 搜索的新模式。传统的搜索引擎和推荐引擎都为信息经济发展做出了贡献，但在人工智能时代，AI 搜索作为一种新形态的搜索引擎，凭借其强大的知识理解和生成能力，引发了整个搜索市场的新变革。

目前，AI 搜索市场上存在着三种主要派别:保守派、中间派和原生派。保守派主要是在现有的搜索引擎架构基础上添加 AI 功能模块，如 Google AI Overviews 和国产搜索“AI 智能回答”。中间派则对传统搜索引擎进行更为深入的改造，比如微软的 New Bing，保留了传统搜索引擎的基础设施，也称为“答案引擎”。而原生派则彻底抛弃了传统搜索引擎，从零开始构建基于 AI 的搜索引擎，比如 Perplexity 和 360AI 搜索，也被称为“知识引擎”。

AI 原生搜索引擎之所以被认为是未来的风向标，是其技术优势明显。首先，原生搜索引擎能够提供更加结构化、准确的答案，并能够给出多个角度的知识深度解读，而不是简单地返回大量网页链接。其次，原生搜索引擎能够利用专有知识库和混合大模型调度系统，提升知识理解能力和推理能力。最后，AI 原生搜索引擎的搜索体验更加用户化，能够根据用户需求更精准地匹配信息。

然而，AI 原生搜索引擎的商业模式落地仍需不断探索。高昂的推理成本是AI 原生搜索引擎发展过程中面临的主要挑战。为了克服这一挑战， 360AI 搜索通过整合不同 AI 模型，利用差异化定价结构，降低成本，同时通过与大模型厂商的互利合作，降低成本，以实现商业闭环。

从用户反馈来看，AI 原生搜索引擎已经获得了市场认可。 360AI 搜索仅仅用了八、九个月时间就成为全球最大的 AI 原生搜索引擎，呈现出强大的增长势头。未来，AI 搜索将继续发展壮大，最终取代传统搜索引擎，成为用户检索信息、获取知识的首选工具。

10.海姆EVI 2:情感丰富的语音 AI 和 API

海姆 AI 近期发布了全新版本 Empathic Voice Interface 2（EVI 2），这是一种配备情感特色的语音 AI 技术和 API。EVI 2 在原有基础上进行了大幅改进，包括响应速度提升、情感识别增强和可定制性更高。它能够进行更加自然流畅的对话，识别用户情绪并做出相应的反应。此外，EVI 2 还支持语音变换功能，开发者可以调整声调、语调等参数，打造独一无二的虚拟合成声。相比前代版本，EVI 2 的价格降低了 30%，并提供多种语言支持，预计到 2024 年年底前将支持西班牙语、法语和德语等多个语言。与其他同行相比，Hume 的 EVI 2 destacks 它能够更好地理解用户表达的情感，并做出更加贴切的回应，从而提升用户体验。EVI 2 目前处于测试阶段，开发者可以通过 API 进行集成和应用。

关注「阿杰与AI」公众号

与AI时代更靠近一点

资讯汇总 ominiai.cn