AI资讯09-131.OpenAI发布全新AI模型家族o1，宣称拥有博士级能力 2.OpenAI推出的“Strawber

AI资讯09-13

新闻摘要

1.OpenAI发布全新AI模型家族o1，宣称拥有博士级能力

2.OpenAI推出的“Strawberry”模型:强调思考速度而非反应速度

3.OpenAI新模型o1助力科研突破

4.亚马逊AI购物助手将开始投放广告

5.专家警告:人工智能在皮肤科的潜在风险

6.POSCO E&C 利用人工智能技术开发投标文件审查系统

7.美国可能批准向沙特阿拉伯出售英伟达芯片

8.百度李彦宏:智能体是大模型应用未来

9.中国大模型企业从“大”向“小”转型

10.Glean公司获得巨额融资，估值达46亿美元

11.Figure推出新一代人形机器人F.02，搭载GPT人工智能

扫码加入AI交流群

获得更多技术支持和交流

（请注明自己的职业）

123

1.OpenAI发布全新AI模型家族o1，宣称拥有博士级能力

OpenAI推出了全新的AI模型家族“o1”，包括o1-preview和o1-mini两个模型。OpenAI声称，o1系列模型能够在解决复杂问题方面胜过GPT系列模型，在科学、医疗和技术等领域表现优异。

o1-preview模型专注于处理复杂的科学和技术任务，并能够在物理、化学和生物学等领域表现出接近博士水平的能力。它在Codeforces编程竞赛中排名第89%，展现了其在代码编写、调试和解决程序缺陷方面的强大能力。o1-preview还能够在国际数学奥林匹克(IMO)资格考试中解决83%的题目，远超其前身GPT-4o的13%。

相比之下，o1-mini模型更精简，速度更快，成本更低，主要用于编程和STEM领域，但仍能取得卓越表现，特别是数学和编程方面。在IMO数学基准测试中，o1-mini的表现达到了70%，几乎与o1-preview持平，但价格只有o1-preview的80%。

o1系列模型都采用了一种新的安全训练方法，使其能够更好地遵循安全和对齐指南。OpenAI计划定期更新和改进o1模型，并添加功能，例如浏览网页、上传文件和图像以及函数调用等。

该系列模型目前在ChatGPT Plus和Team用户中可用，企业和教育版用户下周将获得访问权限。开发人员可通过OpenAI API（需满足 API 使用等级 5 的条件）使用这些模型。

2.OpenAI推出的“Strawberry”模型:强调思考速度而非反应速度

OpenAI发布了新的AI模型GPT-o1，该模型是备受关注的"Strawberry"项目的成果。与前一代GPT-4o相比，GPT-o1的特点是思考更慢，但OpenAI认为这体现了更高水平的智能。OpenAI表示，他们训练这些模型花费更多时间思考问题，就像人类一样。通过训练，它们学会改进思考过程，尝试不同的策略，并识别错误。

GPT-o1专注于研究人员、科学家和开发人员，他们需要解决复杂的编码和数学问题。在内部测试中，GPT-o1在国际数学奥林匹克竞赛（IMO）的资格考试中回答了83%的题目，而GPT-4o只回答了13%。OpenAI称，该新模型在物理、化学和生物学任务上也能与博士生表现相似。虽然GPT-o1在某些方面不如其前身（例如不能浏览网络或读取上传的文件和图像），但OpenAI认为GPT-o1是朝着通用人工智能 (AGI)迈出的重要一步。

3.OpenAI新模型o1助力科研突破

OpenAI发布新推理模型系列o1，推翻以往“快速响应”的AI思维模式，更注重模型思考和决策过程。OpenAI o1经过训练，能学习完善自身思维过程，尝试不同策略，并在遇到难题时尝试不同的解决方法。这使得其在复杂科学、编码和数据问题上的表现超越了此前主流模型GPT-4o。

o1模型一共有三个版本: o1-preview、o1和o1-mini。其中，o1-preview和o1能解决博士生级别科学问题，而o1-mini则更轻便，适用于不需要广泛知识库的应用。OpenAI表示，o1系列模型的推出标志着AI能力进入了一个新的阶段，更能像人类一样进行复杂推理。

该系列模型的潜在应用领域广泛，例如医疗保健研究、物理学、软件开发等。它可以帮助科学家分析细胞测序数据、物理学家解决复杂计算问题，以及开发人员构建复杂的程序流程。尽管相比GPT-4o，o1模型的响应速度略慢，但其更强大的推理能力更适合解决复杂难题，打开了AI在科学研究等领域的全新应用前景。

4.亚马逊AI购物助手将开始投放广告

亚马逊电商巨头宣布，其AI驱动的购物助手聊天机器人Rufus将开始投放广告。亚马逊在向广告客户的更新中表示，广告将出现在与Rufus相关的页面上。为了帮助用户发现更多产品，Rufus会在对话上下文中生成相关文本，并将广告与之关联。广告内容会根据用户提供的信息进行定制，比如用户的搜索词和与聊天机器人的对话内容。Rufus于今年早些时候发布，并在7月份全面面向所有亚马逊用户推出。该AI聊天机器人以对话方式提供有关产品、建议以及比较等更多信息。它使用亚马逊产品页面上的信息作为知识库。

5.专家警告:人工智能在皮肤科的潜在风险

斯坦福大学生物医学数据科学和皮肤病副教授罗拉娜·丹尼什乔博士在太平洋皮肤病学会年会上表示，目前许多皮肤科医生正在临床实践中使用大型语言模型（LLM），如ChatGPT，这引发了她的担忧。虽然了一些皮肤科医生将LLM应用于患者护理、管理任务和医学记录等方面，但丹尼什乔警告说，LLM 未经临床试验，其准确性欠佳，并可能导致误诊或伤害患者。

丹尼什乔及其同事进行了一项红队演习，让LLM模拟临床健康场景，并发现约20%的LLM回应不当。例如，LLM在计算某患者药物反应性红斑与系统症状（DRESS）的RegiSCAR评分时，给出了 eosinophilia 的错误评分。这表明LLM在皮肤科应用中可能存在风险，因为即使在看似正确的回应中，也可能包含影响患者护理的细微错误。丹尼什乔还建议不再将图像上传到gpt-4 Vision（可以分析图像并为图像问题提供文本响应的LLM）进行诊断支持，因为该模型的准确性和敏感性不够理想。

6.POSCO E&C 利用人工智能技术开发投标文件审查系统

POSCO E&C成功开发了一种基于人工智能（AI）的投标文件审查系统，该系统能够快速准确地审查投标文件。该系统已完成两项专利申请。

为了参与建设项目的投标，负责人必须在短时间内审查数千页的投标文件，其中包括客户提出的商业条件和技术要求。在这个过程中，可能会出现各种错误和风险推断准确性偏差等问题。

新开发的AI投标文件审查系统允许用户向AI投标文件审查系统提问，例如使用Chat GPT，并根据投标文件内容得到答案，同时也会提供支持答案的依据。它还会自动搜索公司必须根据以往项目执行情况检查的关键投标条件。此外，为了最大限度地方便用户，可以通过单击轻松查询技术术语的含义，并在修改数千页投标文件过程中展示用户修改前后的变化。

7.美国可能批准向沙特阿拉伯出售英伟达芯片

路透社报道称，美国政府可能即将批准向沙特阿拉伯出口英伟达用于人工智能的图形处理器。据知情人士透露，美国国家安全局正与相关部门协调，准备向沙特阿拉伯出售英伟达 A100 和 H100 芯片。尽管沙特阿拉伯拥有庞大的石油资源，但该国在人工智能领域也表现出雄心壮志。在美国的限制下，沙特阿拉伯尚未能够广泛采购英伟达的高端芯片，而这对于其实现人工智能目标至关重要。批准出售这些芯片可能会加剧美中科技竞争的担忧，但美国方面表示，这些芯片只有在满足严格的出口管制条件下才会出售。

8.百度李彦宏:智能体是大模型应用未来

李彦宏在最新内部讲话中指出，大模型之间的差距会越来越大，开源模型效率不高，无法解决算力问题。他认为，智能体是大模型最重要的发展方向，可以通过AgentBuilder平台降低开发门槛，迅速构建功能强大的应用生态。李彦宏将智能体比作“AI时代的网站”，预示着它将在未来形成一个数百万级的庞大生态。百度已吸引了20万开发者和6.3万企业入驻，并于2023年7月免费开放版文心大模型4.0，为智能体开发提供了更多工具和资源。据数据显示，智能体的分发量正在快速上升，覆盖了教育、法律等多个行业。李彦宏强调，智能体的未来发展不仅依赖技术创新，更需紧密结合用户的需求，并持续迭代优化算法以提升用户体验。预计未来智能体应用将扩展到更广泛的领域，为用户提供更个性化、高效的解决方案，推动AI技术向更高层次发展。

9.中国大模型企业从“大”向“小”转型

随着AI大模型融资退潮，中国科技企业开始把"小而精"的战略放在首位。百度、腾讯、字节、蚂蚁等互联网巨头纷纷推出独立的AI助手应用，例如百度文小言、支付宝支小宝等，并将其定位于垂直场景的解决方案，而不是单纯的大模型通用应用。这反映出行业从技术信仰转向市场落地，从追求超级应用到探索PMF路径的转变。

不少分析认为，大模型技术发展初期, 追求参数规模、算法突破的“大”是主流选择。但随着技术瓶颈和市场现实的叠加，大模型产品需要更贴近用户需求，聚焦细分场景，才能实现商业化价值。

一些初创企业也效仿此举，例如王小川旗下的百川智能，从医疗领域切入，专注于解决垂直行业痛点。

大厂们也意识到，AI应用研发是一个循序渐进的过程，在技术处于发展初期阶段，更要注重用户体验和商业价值。他们更愿意把AI应用与自身业务优势结合，例如支付宝将AI技术融入支付场景，腾讯则将AI应用于金融、医疗等特定领域。

中国AI企业正在从追求技术“大”到追求应用“小”的转变，最终目标是实现AI的良性发展，为社会创造更大的价值。

10.Glean公司获得巨额融资，估值达46亿美元

人工智能搜索初创公司Glean宣布获得超过2.6亿美元的最新融资，使其估值翻倍至46亿美元。此轮E轮融资由Altimeter和DST Global领投，体现了投资者对人工智能驱动服务的初创公司持续增长的兴趣。 Glean利用对话式人工智能助手和大型语言模型（例如OpenAI的GPT，其为ChatGPT提供动力），根据公司内部数据生成针对查询的个性化答案。Glean于2019年由前谷歌员工创立，旗下客户包括Reddit、Pinterest、Databricks等知名公司。

11.Figure推出新一代人形机器人F.02，搭载GPT人工智能

科技公司Figure发布了旗下全新的人形机器人F.02，其最大特点是集成了OpenAI提供的GPT语言模型，这使机器人能够与人进行对话交流。Figure致力于将人工智能融入其机器人产品，目標是打造一个用途广泛的人形机器人，可以胜任各种工作，比如职业领域或家庭助手，甚至只是提供陪伴。

F.02身高1.67米，重70公斤，可承载最大20公斤重量，拥有5小时的续航时间，最高速度可达1.2米/秒。在新一代机器人中，Figure借助GPT的多模态能力，使F.02能够通过摄像头捕捉图像，并运用语言模型分析图像上下文。同时，F.02配备了麦克风和扬声器，能够识别语音指令，并根据上下文理解和执行请求。例如，用户可以要求机器人“把桌上绿色的花盆拿过来”。

为了帮助F.02理解周围环境，Figure开发了一个视觉语言模型，可以将摄像头捕捉到的图像翻译成简单易懂的概念，以便用户理解。 F.02能够根据其看到的图像上下文做出自主决策，例如，如果附近有人意外受伤，F.02能够感知到情况并提供帮助。

关注「阿杰与AI」公众号

与AI时代更靠近一点

资讯汇总 ominiai.cn