1107 早早聊 AI 资讯|OpenAI 开发者大会,再次开启 AI 领域新时代、ChatGPT 的定制版本、OpenAI【机器人商店】的功能...

1,077 阅读11分钟

👉👉原文链接👈👈

阅读详细图文,可访问知识库

「 行业动态 」

OpenAI DevDay 上宣布的新模型和开发者产品 🔗 Twitter

OpenAI 引入了一系列新功能和改进,同时降低了平台各部分的价格。其中包括发布了 GPT-4 Turbo 模型,具备 128K 上下文窗口支持,提供更高性价比。还推出了新的 Assistants API,允许开发人员构建多模式 AI 应用程序,包括访问视觉、图像创建和文本转语音等功能。平台还提供了函数调用更新,允许用户为模型描述应用函数或外部 API,改进了指令遵循和对 JSON 模式的支持。另外,引入了带有种子参数的可重复输出、对数概率输出等功能。此外,还发布了 GPT-3.5 Turbo 模型,支持 16K 上下文窗口和其他改进。在多模态方面,平台支持 GPT-4 Turbo 模型中的图像,DALL·E 3 集成和文本转语音 API。还计划提供 GPT-4 的微调访问程序以及为组织提供的定制模型计划。此外,还降低了输入和输出代币的价格,推出了"版权之盾"来协助客户处理版权侵权索赔,发布了更新的 Whisper large-v3 ASR 模型,以及一致性解码器,为各种图像相关任务提供显着改进。

ChatGPT 的定制版本 🔗 Twitter

OpenAI 的 ChatGPT 不断发展,为用户提供更多个性化和强大的功能。用户可以通过自定义指令来设置 ChatGPT 的首选项,还可以在 GPT 商店中浏览各种自定义 GPT 模型。这些模型将根据用户未来几个月的使用情况来获取收益。隐私和安全得到加强,用户拥有更多控制权,而举报功能也可用于报告问题。此外,ChatGPT 逐渐成为处理现实世界任务的"代理",开发人员可以通过 API 集成将其连接到各种应用程序。企业客户也可以创建适合其特定用例的自定义 GPT 版本。OpenAI 还鼓励更多社区参与,通过 ChatGPT Plus 提供最新信息和改进的模型选择流程。最重要的是,所有这些功能都集中在一个访问点,包括 DALL·E、浏览、数据分析和文件附件,同时搜索功能也得到改进,支持 PDF 和其他文档类型的搜索,为用户提供更便捷的使用体验。

◇ 最强开源大模型刚刚易主!40 万文本处理破纪录 🔗 News

由李开复博士创办的 AI 2.0 公司零一万物公司介绍了 Yi 系列大型模型,其中 Yi-34B 和 Yi-6B 是首款开源的大型模型。Yi-34B 在英语测试和中文语言能力排行榜上表现卓越,超越了其他开源模型,展示了综合能力。这一成功归功于零一万物公司自主研发的训练基础设施和高效训练平台,以及 Infra 团队的关键作用。公司的长期目标是在“AI 2.0”愿景下,成为人工智能领域的全球领导者,团队拥有多领域专业知识,计划在不同应用领域发布更多版本的 Yi 模型,加剧大型 AI 模型领域的竞争。此系列模型的名字“一”象征着人类与人工智能的合作,专注于为社会创造价值。

◇ 北大具身智能新成果:无需训练,听指令就能灵活走位 🔗 News

北京大学团队开发的 DiscussNav 导航系统使机器人能够通过自然语言导航指令进行操作,无需额外的绘图或训练。该系统依赖于与大语言模型和多模态大模型的互动,形成了一个专门针对视觉语言导航任务的专家团队,包括指令分析、视觉感知、任务完成估计和决策测试。DiscussNav 利用 LLM 和 MLM 的专业知识,通过讨论机制,使机器人可以在每一步运动中与视觉导航专家进行讨论,从而理解指令、感知环境、估计任务完成情况,并做出运动决策。系统还展示了零样本学习的能力,优于传统方法,甚至优于经过训练的方法。通过真实实验,DiscussNav 在模拟和真实环境中表现出强大的性能和迁移能力,具备识别物体、导航地标、纠正错误以及解决不一致的移动决策等四种强大能力。

◇ 国内最大开源模型来了,高性能无条件免费商用 🔗 News

元象 XVERSE 发布了一款名为 XVERSE-65B 的大型、开源、高性能通用模型,拥有 650 亿个参数,免费商用。该模型预计将在研究、商业和开发者领域产生积极影响,提供了强大的研发工具,特别是在新技术、工具和模型安全方面。它经过性能优化,解决了小型模型中的常见问题,并支持 40 多种语言。XVERSE-65B 模型系列是完全自主研发的,经过多项权威评测,性能相当于 GPT3.5,并超越了其他基准模型。此外,XVERSE 还推出了升级型号 XVERSE-13B-2,提供更多功能。模型可在多个平台下载并免费商业使用,XVERSE 还提供各种技术服务。XVERSE 旨在推动大型模型开发,并与企业和开发者合作,开创大模型应用的新时代。作为一家中国 AI 和 3D 技术服务公司,XVERSE 成立于 2021 年,已获得超过 2 亿美元的融资,由腾讯前副总裁兼腾讯 AI Lab 创始人姚星创立。

AMD MI300 绝杀英伟达 H100? AI 芯片大决战一触即发 🔗 News

在即将到来的 AI 芯片竞争中,许多初创芯片公司试图挑战 NVIDIA 的主导地位,专注于 AI 应用的硬件。Tenstorrent 首席执行官 David Bennett 建议这些初创公司保持灵活性,不受狭窄用例的限制,因为 NVIDIA 在图形 GPU 领域的成功打开了机会。一些先进的芯片,如 AMD 的 MI300 和 NVIDIA 的 Grace Hopper,集成了 GPU 和 CPU 来加速模型训练,打破了传统分离。AMD 的 MI300 在性价比方面预计将超越 NVIDIA 的 H100,尤其在部署 32K 上下文窗口的 GPT-4 模型时性能优势达到 20%至 25%。大公司如微软、Meta、甲骨文、谷歌和亚马逊已订购了 AMD 的 MI300,预计将增加 AMD 在 AI 硬件市场的份额。尽管面临竞争,AMD 致力于 AI 硬件市场的增长,数据中心 GPU 收入预计将在 2024 年第四季度超过 40 亿美元,其中 MI300 将成为最快达到 10 亿美元销售额的产品之一。

◇ 谷歌 DeepMind 力证: GPT-4 终局是人类智慧总和! 🔗 News

Transformer 模型是否能够泛化出新的认知和能力?最近,谷歌的研究人员进行了有关实验,实验证明模型可以在情境学习中选择并预测来自预先训练的功能类别,而不需要额外统计成本,但没有足够的证据表明模型的情境学习能够扩展到其预训练数据之外。研究还发现,当预训练数据包含各种线性函数稀疏程度时,模型可以近似最佳预测,但在处理不同类别的函数时,特别是那些在预训练数据中罕见的函数时,模型的预测可能会失败。实验使用了类似 GPT-2 的模型,结果表明模型在分布外泛化方面存在一些限制,可能存在归纳偏差,而模型的预测受上下文示例与学习功能类别的接近程度影响。

GPU 推理提速 4 倍,256K 上下文全球最长 🔗 News

OpenAI 的 GPT 模型支持 GitHub Copilot,但运营成本高昂,特别是 ChatGPT 服务每天接收 1000 万次查询,每日计算硬件成本高达 700 万美元。为了进一步解决问题,由无问芯穹、清华大学和上海交通大学的联合团队开发的"FlashDecoding++"方法提供强大的加速能力,可以将 LLM 的 GPU 推理速度提高 2-4 倍,支持 NVIDIA 和 AMD GPU。该方法通过异步方法实现注意力计算的并行性,优化 Decode 阶段的矩阵计算,引入固定最大值减少了同步开销,采用双缓冲机制来加速解码阶段,并根据模型需求提供最佳的矩阵乘法实现。无问芯穹已将"FlashDecoding++"集成到其"Infini-ACC"模型计算引擎中,并正在开发一系列集成解决方案,包括能够处理大量标记的"Infini-Megrez"模型。

AI 大佬 Wolfram 最新演讲,宇宙尽头是「计算」! 🔗 News

Stephen Wolfram 认为宇宙是一个计算模型,由离散元素遵循简单规则构成。Wolfram 引入了“ruliad”概念,代表计算复杂性。他的 50 年研究发现宇宙的“机器代码”是可计算的,强调计算思维的重要性。还提出空间由“空间原子”组成,可通过简单规则构建宇宙结构,讨论了宇宙中的分支概念,确定了科学历史的四个范式,强调计算思维的作用。还强调了 Wolfram Language 的开发,支持用计算术语表达人类知识。他看到人工智能探索计算规则的潜力,但也提到了计算不可约性的挑战和人工智能目标的定义。他建议关注“什么”而非“如何”,强调全面知识和计算思维在未来学习中的作用。

OpenAI 【机器人商店】的功能 🔗 Twitter

  • 沙盒:用于导入、测试和修改聊天机器人的环境。
  • 自定义操作:根据 OpenAPI 规范定义聊天机器人的附加功能。
  • 知识文件:为聊天机器人附加的参考文件。
  • 工具:提供基本工具,如网络浏览、图像生成等。
  • 分析:查看和分析聊天机器人的使用数据。
  • 草稿:保存和分享聊天机器人的草稿。
  • 发布:公开分发完成的聊天机器人。
  • 分享:设置和管理聊天机器人的分享权限。
  • 市场:搜索和部署其他用户创建的聊天机器人。

◇ YouTube 将测试生成式人工智能功能 🔗 News

YouTube 正在为其高级订阅者测试新的生成人工智能功能,包括对话工具,用于回答问题和提供内容推荐,以及一个评论摘要工具,用于总结视频评论的主题。这些工具旨在增强用户体验,最初将在美国和 Android 设备上的视频观看页面上提供,供 YouTube Premium 会员参与测试。对话工具使用大型语言模型实时响应用户查询,而不中断视频播放,而评论摘要工具旨在帮助用户和内容创作者理解评论部分的主要讨论主题。这些功能是实验性的,YouTube 将收集用户反馈以改进它们,目前仅提供英文版本,并在有限数量的视频上进行测试。

「 融资快讯 」

◇ 「Aleph Alpha」 在 B 轮融资中筹集了超过 5 亿美元资金 🔗 News

德国人工智能公司 Aleph Alpha 在 B 轮融资中获得了超过 5 亿美元的资金,来自七个新投资者和现有投资者的财团,包括人工智能创新园、Bosch Ventures、Schwarz Group、Berlin Christ&Company Consulting、HP Enterprise、SAP 和 Burda Primary Investments。这笔资金将帮助 Aleph Alpha 巩固其在欧洲生成人工智能应用程序领域的地位,并加速产品开发和规模化。Aleph Alpha 专注于为企业和政府提供可解释且可靠的生成人工智能解决方案,资金将用于基础模型研究、关键任务环境的高级产品功能以及与合作伙伴的商业化。该投资还将支持学术合作,进一步促进创新、开放性和可重复性。

「 早点趣玩 」

◇ E4S:一个精细化的面部 换脸技术 🔗 Twitter

E4S 是一种先进的换脸技术,与传统方法不同,它以更高精度处理脸部细节,确保在照片或视频中进行换脸后的脸部形状、纹理、光照等方面看起来非常自然和逼真。这项技术利用"区域 GAN 反演"(Regional GAN Inversion)将脸部的形状和纹理分离处理,使用预先训练的模型和特殊编码器对脸部各个部分进行多层面处理,最终实现精确的脸部换脸。此外,它还包括光照调整和后处理修复步骤,以确保换脸效果更加自然和完美。

「 技术阅读 」

◇ 探索理解 AI 的 10 个关键术语 🔗 Link