「 行业动态 」
◇ 大模型的最大 bug, GPT 到 Llama 无一幸免 🔗 News
大型语言模型(LLM)存在“逆转诅咒”问题,无法正确处理“A 是 B”和“B 是 A”类型的问题。研究者发现,LLM 在颠倒问题时表现不佳,即使在训练集中包含了相关例子。逆转诅咒不受模型大小或数据集内容的影响,表明这是一种泛化问题。大模型的逻辑推理困难可能与梯度更新的短视性有关,需要更多研究来解释。尽管研究者尝试不同方法来避免逆转诅咒,但效果有限,问题仍然存在。
- paper: arxiv.org/abs/2309.12…
- Github: github.com/lukasberglu…
◇ DevFest 2023 即将到来 🔗 Twitter
DevFest 是由世界各地的 Google 开发者社区 (GDG) 举办的本地会议。每场 DevFest 活动均由当地的组织者精心策划,旨在满足当地开发者社区的需求和兴趣。无论是实践式学习体验、专家以当地语言提供的技术讲座,还与当地开发者同行进行的会面交流,DevFest 参与者都可以学习如何利用 Google 的开发者工具进行协作和创新。DevFest 2023 将于 2023 年 10 月 2 日开放报名。
◇ DALL·E 3 内部实测效果惊人!50 个物体一图全包 🔗 News
OpenAI 的 DALL·E 3 与 ChatGPT 结合,降低了用户使用文生图的门槛,成为强大的图像生成工具。相比竞争对手 Midjourney,DALL·E 3 通过多轮对话和 AI 生成 Prompt 的方式更灵活,更容易实现用户需求。DALL·E 3 能够准确还原细节并为图片添加文字,一位 AI 绘画界老兵通过结合 DALL·E 3 和 ChatGPT 生成了一个包含 50 个日常生活物体的图片,显示其准确认知物体的能力。DALL·E 3 的多轮对话功能被称为「图像的人类反馈强化学习」,进一步强化了图像生成功能。虽然 DALL·E 3 在画质方面并没有明显领先 Midjourney v5,但它更好地遵循提示,并且能够渲染文本。
◇ 百度发布首个量子领域大模型 🔗 News
2023 量子产业大会在安徽合肥成功举行,百度量子计算研究所发布了一系列重要成果,其中包括首个量子领域大模型和 AI 原生应用。百度的量子领域大模型基于文心一言,经过高质量的训练和优化,能够执行专业的量子任务。百度还提供了量子助手和写作助手等工具,降低了门槛,提高了科研效率。此外百度发布了量子领域大模型白皮书,探讨了量子科技与大模型的重要性和潜在机制,同时还宣布了在量子芯片和软硬一体化解决方案领域的最新进展。
◇ 首个千亿生物医药 ChatGPT 来了! 🔗 News
ChatDD 是水木分子公司开发的首个千亿参数的多模态生物医药对话大模型,可为制药行业提供专业知识和多模态对话能力。它能自动分析分子作用、计算亲和力等任务,拥有丰富的医药专业知识,覆盖制药的各个环节。这一创新将专家知识与大模型能力融合,虽需时间发挥潜力,但为制药行业带来巨大潜力,公司计划不断优化模型,创建医药行业的“Killer APP”,打破研发领域的“双十定律”。
◇ 用 AI 拭去岁月蒙尘,重现中国亚运首金记忆 🔗 News
在杭州亚运会首日,中国选手邹佳琪和邱秀萍赢得了赛艇女子轻量级双人双桨决赛的首枚金牌,标志着本届亚运会的首金诞生。同时回顾了 1974 年德黑兰亚运会上中国运动员苏之渤赢得的首枚中国亚运首金的故事。通过阿里云先进的 AI 技术对珍贵史料的修复,让我们能够更好地回顾历史,感受中国体育的崛起历程。这些珍贵史料将在杭州亚运会博物馆对外展出。
◇ MathGLM:无需计算器, 大模型也能做数学题 🔗 News
MathGLM 是一个针对 NLP 领域下游任务中的数学推理难题的新模型。通过精确计算算术运算和提升中文数学解决能力,MathGLM 取得了显著进展,准确率几乎达到了 100%。训练数据集包含了各种运算符和数字格式的算术运算,从 2 到 10 个运算步骤不等。实验结果显示,MathGLM 在算术任务上显著优于 GPT-4 和 ChatGPT,分步计算策略有助于 MathGLM 学习复杂算术运算,提高性能。MathGLM-GLM-10B 在解决数学应用题上的性能接近于 GPT-4,而在解决更高级别的数学问题上,MathGLM 表现出了更强的能力。
- paper: arxiv.org/abs/2309.03…
- Github: github.com/THUDM/MathG…
- 模型下载:modelscope.cn/models/Zhip…
◇ 与 LangSmith 一起探究人工智能决策的灵魂 🔗 Link
LangSmith 是建立在 LangChain 平台上的一个框架,旨在深入追踪 LLM 和人工智能代理在产品中的内部运作,分为调试、测试、评估和监控四大功能类别。用户可以通过 LangSmith 深入研究代理的行为,测试 LLM 应用程序,评估性能细微差别,并实时监控,类似于人工智能的保姆,提供实时报告和警报。这个框架的痕迹功能类似于编程时的日志,用于查看 LLM 进出的文本和决策过程,有助于微调和优化聊天机器人的功能,提高 LLM 应用程序的质量和可信度,尤其在用户反馈方面。
◇ GitWit Agent 开源了! 🔗 Twitter
GitWit 是一个基于容器的代理,专门用于向 git 存储库进行有用的提交。给定描述(即“实现暗模式”),它要么检查存储库,要么创建一个新存储库,进行这些更改,然后将更改推送到 master。GitWit 在临时沙箱中与文件系统交互,因此可以运行任何 shell 命令,这使得它非常灵活并且可用于许多有趣的用例。该代理也在 app.gitwit.dev 上进行测试,并已生成超过 1000 个存储库!
- Github: github.com/jamesmurdza…
◇ 新开源库“Agents”,可以在任何地方构建和部署自治代理 🔗 Twitter
Agents 是一个用于构建自主语言代理的开源库/框架。该库经过精心设计,可支持重要功能,包括长短期记忆、工具使用、网络导航、多代理通信以及包括人机交互和符号控制在内的全新功能。使用 Agents,只需用自然语言填写配置文件,然后将语言代理部署在终端、Gradio 界面或后端服务中,即可定制语言代理或多代理系统。与其他现有语言代理框架的一个主要区别是允许用户通过 SOP(标准操作流程)为语言代理提供细粒度的控制和指导。SOP 定义了整个任务的子目标/子任务,并允许用户为语言代理定制细粒度的工作流程。
- Github: github.com/aiwaves-cn/…
「 机器人领域 」
◇ 特斯拉人形机器人再进化,仅靠视觉自主分类物体 🔗 News
特斯拉的人形机器人 Optimus 展示了新的能力,能够通过神经网络训练自主分类物体,并使用视觉和关节位置编码器准确定位自身肢体。它还可以根据颜色对物体进行分类,即使有干扰也能准确分类。此外 Optimus 具备自主纠正歪倒物体的能力,并且可以通过输入指令来执行任务。Optimus 是特斯拉 Bot 项目的一部分,最终目标是要成为拥有「大脑」的类人机器人。
「 融资快讯 」
◇ 「前晨汽车」半年再获超亿元融资,推动全新电动轻卡大规模量产 🔗 News
前晨汽车是一家新能源商用车品牌,由前蔚来高级副总裁黄晨东创立,已发布 EC1 和 iC1 两款产品,EC1 销量已超千台,iC1 致力于做 3.0 产品。近日完成新一轮融资,规模超亿元,投资方为核聚资本。本轮融资资金将用于全新一代商用纯电轻卡车 iC1 的市场推广、换电业务布局、国内营销渠道建设及海外业务拓展,此外还将进行新一代 VAN 车型的研发及量产。公司采用"车电分离"的换电模式,降低购车门槛,并提供多样金融方案。
「 技术阅读 」
◇ 如何构建多文档聊天机器人 🔗 Twitter
◇ 如何使用 Langchain 和 Matplotlib 构建知识图 🔗 Twitter
最近 Langchain Ai 已经添加了对图形数据结构的支持。那么什么是知识图谱?简单地说,知识图谱组织来自各种来源的数据,获取特定领域(例如人物或地点)的实体信息,并在它们之间创建连接,以使数据能够被理解。
◇ 使用交叉编码器进行搜索重新排名 🔗 Twitter
交叉编码器在特定领域的应用中表现出优势,虽然成本较高,但可以增加结果的相关性。在语义搜索中,问题在于使用嵌入生成句子表示时结果可能不够准确,而交叉编码器相对更准确,但不适合大规模应用。为了权衡成本和质量,常见方法是使用嵌入迅速识别候选项,然后利用交叉编码器对候选项进行精确的重新排名。最后通过构建提示来评估相关性,返回分类结果以及 logprobs,并展示了查询的相关性演示,包括模型输出和 logprobs。
◇ 如何提高 RAG 性能 🔗 Twitter
提取元数据对于改进 RAG 非常重要,但使用单独的 LLM 调用进行元数据提取效率低下。现在可以使用一个 LLM 调用从任何文档中提取完整的 Pydantic 对象。增强嵌入/响应生成,或者与矢量数据库元数据过滤器一起使用
◇ 大型语言建模到 计算机视觉 研究论文(2023 年 8 月至 9 月) 🔗 Link
「 课程推荐」
◇如何使用 Llama Index 构建 GenAI 应用程序 🔗 Twitter
- LlamaIndex 的基础:了解 LlamaIndex 的核心原理和功能以及它如何与大型语言模型集成。
- 实践应用程序构建:使用 LlamaIndex 构建 GenAI 应用程序(从数据摄取到查询)的分步指南。
- 使用 LlamaIndex 优化 LLM:学习最佳实践和技术,以使用 LlamaIndex 增强 LlamaIndex 的 LLM 应用程序的性能和功能。Madhukar Kumar, SingleStore 首席开发人员传播者
- 地址:t.co/C61EM97rc1