👉👉原文链接👈👈
阅读详细图文,可访问知识库
「 行业动态 」
◇ Sam Altman 放豪言: OpenAI 训 GPT-5 不差钱,人类已接近 AGI 阈值 🔗 News
OpenAI 的 CEO Sam Altman 和 CTO Mira Murati 在《华尔街日报》采访中强调了他们的最终目标是实现 AGI,认为这将有深远的积极影响。他们也提到 AGI 的定义和标准不断演变,对 AGI 何时到来的确定具有挑战性。OpenAI 已发布多个版本的 GPT,包括最新的 GPT-4,并正在开发 GPT-5 以解决模型幻觉等问题。数据版权和所有权问题仍然存在争议,OpenAI 在探索新方法来处理这些问题。人工智能与人类关系不断演变,OpenAI 强调了将人工智能与人类区分开来的重要性。尽管人工智能带来机遇,但也引发了担忧,特别是滥用和风险问题。技术进步一直扰乱着就业市场,挑战在于管理这些变化并确保人们能够参与塑造未来。
◇ OpenAI 开发者日公告和对开源 AI 开发的影响 🔗 Twitter
- GPT-4 Turbo 的价格下调和更大上下文长度:价格下调虽然有吸引力,但开源微调模型仍然是更经济的选择,特别是对于简单用例。长上下文输入在 LLM 中会导致信息遗忘,效率不高。
- 自定义 GPT 商店:对于构建付费开发者生态系统似乎为时过早,需要大量订户支持,而竞争对手如 Bard 尚未广泛采用。
- 基于 NLP 的自定义 GPT:理论上有趣,但在实践中可能仅适用于最基本的用例,因为 GPT-4 在生成代码方面存在许多错误。
- 助手 API:具有一定的兴趣和实用性,可能适用于简单用例,但在复杂用例上的性能尚不确定。
总体而言,OpenAI 的重点似乎有些不合适,如果他们能推出 GPT-5 并大幅降低 GPT-4 的价格,将会更加领先。此外,对于构建通用人工智能,实施与 Azure 直接竞争的功能似乎不是正确的方向。
◇ 三星自研大模型 Gauss( 高斯 )公布 🔗 News
在三星人工智能论坛 2023 上,三星正式发布了其自家研发的生成式 AI 产品,命名为 Gauss(高斯)。这一大模型包括 Samsung Gauss Language、Samsung Gauss Code 和 Samsung Gauss Image,覆盖了 AI 聊天、AI 代码和 AI 图像等领域。Samsung Gauss Language 用于提高工作效率,支持电子邮件撰写、文档总结和内容翻译等任务。Samsung Gauss Code 则针对内部软件开发,旨在帮助开发者更轻松地编写代码,支持代码描述和测试用例生成。而 Samsung Gauss Image 用于生成和编辑创意图像,包括风格更改和添加,以及低分辨率图像转换为高分辨率图像。目前,Gauss 主要用于提高员工生产力,未来将扩展到各种三星官方应用程序,为用户提供新的体验。
◇ 大模型集体失控!主流 AI 无一幸免 🔗 News
MasterKey 是南洋理工大学等四所大学的研究人员开发的一种新方法,成功提高了大型语言模型“越狱”的成功率,从平均 7.3%提高到 21.5%。MasterKey 的过程包括逆向工程大语言模型的防御机制,创建“越狱”数据集,并微调“欺诈”语言模型,以有效诱导其他模型“越狱”,损害了商业模型如谷歌的 Bard 和微软的 Bing Chat。与其他 AI 技术不同,MasterKey 学习和应用各种“越狱脚本”,采用基于提示的攻击方法。强调了继续研究大型语言模型的必要性,解决安全问题,并探索它们在不同领域的潜力,包括安全代码生成应用程序,以改善其安全性和性能。
◇ 让大模型自主探索开放世界 🔗 News
北京大学和北京智源人工智能研究院合作推出了 LLaMA-Rider,这是一种旨在帮助 LLM 适应开放世界环境的方法,特别是在游戏“我的世界”中。LLaMA-Rider 采用环境反馈驱动的探索和学习方法,使法学硕士能够主动探索、收集数据,并学习策略,以提高他们的适应性和自主性。它使用预训练的技能和技能检索模块,将 LLM 的文本输出与环境中的动作空间匹配,以更有效地利用他们的能力。此方法还通过子任务重新标记来提高任务成功率,允许 LLM 专注于当前的子目标。LLaMA-Rider 在 Minecraft 环境中展现出比基于 ChatGPT 的任务规划器更好的性能,而与强化学习方法相比,它在采样效率和训练成本方面具有优势,尤其在复杂和大动作空间场景中。
- paper: arxiv.org/abs/2310.08…
- Github: github.com/PKU-RL/LLaM…
◇ OpenAI 发布会后,究竟带来什么影响? 🔗 Twitter
◇ Figma 增添新的 AI 功能 🔗 News
初创公司 Figma,正在等待监管机构批准 Adobe 的 200 亿美元收购,加强了其在线协作白板工具 FigJam 的功能。这款工具广泛应用于设计和项目管理,现引入了三项生成式 AI 功能,以帮助用户更轻松创建图板、整理想法和任务,并简化审查会议或头脑风暴笔记的过程。这些 AI 功能借助 OpenAI 的大型语言模型实现,但同时进行了测试以防止有害或不适当内容的出现。Figma 的目标是帮助用户更有效地协作和组织,特别是那些在协作方面遇到困难的用户,这些新功能将从今天开始作为公共测试版本发布。
◇ 严格的人工智能监管如何伤害中国企业 🔗 News
2023 年 7 月,中国国家互联网信息办公室(CAC)发布了人工智能生成内容(AIGC)暂行规定。这些法规相对宽松,着重于面向公众的服务,并强调 AIGC 的发展和安全。它对 AIGC 内容施加了严格的限制,并规定了服务提供商的责任,包括数据培训、输出标签、数据保护、解决非法内容和用户透明度。法规要求进行安全评估和算法注册,适用于拥有“舆论属性或社会动员能力”的服务,但一些人认为这可能成为商业用户的逃避途径。此外,法规也豁免了内部使用的 AIGC 工具的组织。不过,这些规定可能会对创新产生阻碍,尤其对初创企业和小型企业而言。与西方同行相比,中国的监管环境可能对中国人工智能模型的发展和质量产生负面影响,而欧盟和拜登政府则在探寻更多基于风险的人工智能监管方法,对采用的限制性影响相对较小。
「 融资快讯 」
◇ 「阿加犀」完成 Pre-A+轮近亿元融资 🔗 News
成都阿加犀智能科技成功完成近亿元人民币的 Pre-A+轮融资,本轮融资由申能诚毅领投,川发展院士基金跟投。该公司是一家专注于 AIoT 领域的人工智能平台和产品服务提供商。他们的 AI 工具链帮助实现 AI 模型在不同边缘端芯片上的应用,而 AidLux 平台则覆盖了 AI 项目的全过程。阿加犀在智能机器人、工业 AI 质检、边缘计算等领域提供技术创新和产品升级,降低开发成本,提高 AI 能力,以 1/3 的综合成本优势实现工业 AI 质检方案的应用。他们的视觉 AI 质检方案在多个企业中得到采用,满足工业 AI 质检场景需求。此外,阿加犀在智慧城市、智慧农业、智慧零售和智慧工厂等领域推动边缘计算的应用,率先在终端上实现大模型运行,为 AIoT 生态的连接和发展搭建桥梁,支持芯片厂商和行业应用产品的顺畅发展。
「 早点趣玩 」
◇ Gsplat.js : JavaScript 高斯渲染库 🔗 Twitter
这个库专注于高斯渲染,一种 3D 图形渲染技术,类似于 three.js,但专门用于创建和操作 3D 场景中的点云数据,使点云看起来更平滑,减少锯齿感。它采用 WebGL 技术,实现硬件加速,能高效处理大规模点云数据,支持实时渲染和动态数据更新。这个库还与 three.js 项目紧密集成,扩展了三维渲染的能力,同时提供了灵活的参数设置,允许自定义点云的大小、颜色、透明度等,简化了集成流程,可快速嵌入到现有的 Web 应用中。
- Github: github.com/dylanebert/…
- demo: huggingface.co/spaces/dyla…
- jsfiddle example: jsfiddle.net/e52x4m9z/
「 技术阅读 」
◇ 构建生产级 RAG 系统的路线图 🔗 Twitter
从一个简单的 RAG(Retrieval-Augmented Generation)系统开始。
调整你的分块方式,包括分割、块大小,以及检索多于嵌入的小到大策略。暂时不要费力微调嵌入模型。
重新排列你的检索结果。
进行分类。将问题分为关于一个文档某个部分的问题、整个文档的问题以及多个文档的问题等。
进行提示工程,并添加主动流程以扩展查询并使用工具。
- 调整分块选项和从小到大策略:docs.llamaindex.ai/en/stable/e…
- 重新排列策略:blog.llamaindex.ai/using-llms-…
- 基于分类的路由查询:replit.com/@LlamaIndex…
- 数据代理和 SubQuestionQueryEngine:gpt-index.readthedocs.io/en/latest/e…