👉👉原文链接👈👈
「 行业动态 」
◇ ChatGPT 再迎重大升级:必应联网功能正式上线 🔗 Twitter
OpenAI 在 2023 年 9 月 27 日宣布扩展了 ChatGPT 的数据访问功能,允许其浏览互联网,提供最新的权威信息,不再仅限于 2021 年 9 月之前的数据。初始阶段,该功能仅对订阅 Plus 和 Enterprise 的用户开放,计划扩展到所有用户。用户可以在 GPT-4 的选择器中启用“使用 Bing 浏览”选项,即可启动。
◇ 碾压 H100,英伟达下一代GPU曝光! 🔗 News
NVIDIA 计划于 2024 年推出新一代 GPU 芯片 B100,采用台积电的 3nm 工艺制程,面向人工智能和高性能计算应用。这款 GPU 采用多芯片模块(MCM)设计,与 Hopper/Ada 架构不同,扩展到数据中心和消费级 GPU 市场。虽然核心数量不变,但底层架构将有重大调整,利用先进的封装技术,将 GPU 组件分成独立的芯片,提供更大的定制灵活性。具体的制程类型尚未确定,但考虑到 NVIDIA 过去的制造技术定制,Blackwell 可能采用定制节点。
◇ 世界第一 ERP 厂商 SAP,推出类 ChatGPT 产品—Joule 🔗 News
全球排名第一的 ERP 厂商 SAP 宣布推出生成式 AI 助手 Joule,将其整合到多个产品矩阵中,以协助企业实现成本降低和效率提升。Joule 类似于 ChatGPT,通过文本问答方式生成内容和分析数据,结合 SAP 的云平台和 Business AI,提供跨平台的个性化 AI 服务。Joule 将逐步集成到多个 SAP 产品中,覆盖人力资源、供应链、ERP、财务管理、客户体验等领域,SAP 承诺严格遵守 AI 指导原则和道德手册,确保用户隐私和数据安全。 SAP 首席执行官 Christian Klein 表示,Joule 将提高企业效率和商业价值,成为一位聪明的“同事”。
◇ 小扎深夜炸场!Meta 版 ChatGPT 搬进「 元宇宙 」 🔗 News
Meta 昨夜的发布会揭开了多项令人震撼的新产品:Meta Quest 3,Llama 2 加持的 Meta AI ,以及 Ray-Ban Meta 智能眼镜等。这一系列的硬件和 AI 整合,展示了 Meta 在虚拟现实、混合现实和人工智能领域的巨大进展。
- Meta Quest 3,首款混合现实(MR)头显,具备卓越的视觉效果和性能,采用全新的骁龙 XR2 Gen 2 平台,图形处理性能是前代的两倍,内置特征检测和 6DoF 跟踪功能,分辨率大幅提升,采用 4K+无限显示技术。此外 Xbox Cloud Gaming 计划将于 12 月登陆 Quest 3,提供 100+款游戏。
- Emu,一款 AI 图像生成模型,可通过简单文本描述生成图片和表情包,增加虚拟交流的趣味性。
- Meta AI,基于 Llama2 开发的聊天机器人,将与 WhatsApp、Messenger、Instagram 等整合,支持实时信息获取和角色扮演。
- AI Studio,是一个支持人工智能开发的平台,允许企业和创作者构建元宇宙的 AI 应用和体验。
- Ray-Ban Meta,具备通话和视频拍摄功能,支持手机和眼镜摄像头之间的无缝切换。
◇ AI 的大模型时代 ≠ 只有大模型的 AI 时代 🔗 News
AI 技术经历了兴起、发展、大规模应用的三个阶段,不仅仅局限于大语言模型(LLM)时代,还包括传统深度学习和老一代机器学习应用。AI 已被广泛应用于各领域,如物流、交通和机场安全,其中 OCR 技术提高了物流行业效率,AI 视频分析技术实时监测交通路况,AI 摄像头提高了机场飞行区域的安全性。AI 的主要目标是提高效率,而英特尔的至强®️ 处理器和软件通过优化 AI 应用性能并提供更多计算能力,以支持大模型,并且英特尔的 Habana®️ Gaudi®️2 加速芯片提供高内存带宽。英特尔的可信执行环境(TEE)提供安全的 AI 运行环境,这些举措旨在推动 AI 技术的广泛应用,促进“芯经济”的崛起。
◇ AI 已经卷到面试界了? 🔗 News
百度搜索在"金九银十"求职季推出求职助手类 BOT,旨在为应届生和求职者提供全流程求职支持。百度 AI 求职 BOT 能够帮助用户优化简历、提供面试指导,甚至协助谈薪资。通过个性化建议,根据用户的性格、兴趣和经历,提供专业的职业推荐,帮助求职者找到适合自己的职业道路。此外该 BOT 还模拟面试过程,帮助用户快速提升面试技巧,解决各种面试难题,从而助力求职者更从容地应对秋招挑战。
◇ 复旦大学发布中文智慧法律系统 DISC-LawLLM,构建司法评测基准 🔗 News
复旦大学发布了 DISC-LawLLM,一款基于大型语言模型的中文智慧法律系统,可为法律专业人员、法学学生和普通民众提供多样的法律服务,包括法律文本摘要、司法事件检测、法律问题咨询等。该系统使用高质量数据集 DISC-Law-SFT 进行微调,具备法律文本处理、法律推理和知识检索能力,还提供评测基准 DISC-Law-Eval 用于评估性能。这一研究有望推动智慧司法领域的发展,为法律资源平衡问题提供更多前景和可能性,并开源了相关数据集和模型权重。
- 官网:law.fudan-disc.com
- Github: github.com/FudanDISC/D…
- paper: arxiv.org/abs/2309.11…
◇ 微调多模态大模型会「灾难性遗忘」,性能大减 🔗 News
马毅教授团队最新研究发现,微调多模态大语言模型(MLLM)存在潜在的灾难性遗忘问题。他们采用名为 EMT 的评估框架,揭示了多数模型在微调后无法保持与其基础视觉编码器相似的分类性能,并且在微调后会在其他数据集上出现遗忘现象。研究还指出,这种遗忘现象受到三大因素的影响,包括错误预测、内在幻觉和外在幻觉。虽然微调 MLLM 可以提高微调数据集上的分类性能,但会导致其他数据集上的灾难性遗忘,而线性微调具有通用性,而 Lora 微调则不具备通用性。这项研究对于理解大型语言模型在多模态任务中微调效果及潜在问题的重要性不可忽视。
- paper: arxiv.org/abs/2309.10…
◇ Mistral 7B 出炉,性能优于 Llama 2 13B 🔗 Twitter
Mistral AI 团队发布了 Mistral 7B,这是迄今为止尺寸最小但性能最强大的语言模型,拥有 73 亿参数。该模型在各种基准测试中都表现优于 13 亿参数版本的 Llama 2,以及 34 亿参数版本的 Llama 1。Mistral 7B 不仅在英语任务上表现出色,还在处理代码时接近 CodeLlama 7B 的性能。它采用了 Grouped-query attention (GQA)来提高推理速度,使用 Sliding Window Attention (SWA)来处理较长序列并降低成本。此模型以 Apache 2.0 许可证发布,可在任何地方自由使用,也可轻松部署在各种云平台上。
- blog: mistral.ai/news/announ…
- huggingface: huggingface.co/mistralai
◇ 解决 Terraform Cloud 项目和工作区访问控制的复杂性 🔗 Twitter
Terraform Cloud (TFC) 用于管理企业的基础设施即代码 (IaC) 开发,特别解决了访问控制、资源管理和安全性方面的挑战。随着 Google Cloud 项目数量的增长,访问控制变得复杂,而 TFC 提供了更安全的解决方案,适用于大规模的 Google Cloud 项目和 TFC 工作区。该解决方案解决了资源创建限制、资源冲突防止以及 TFC 配置最佳实践等关键挑战,同时还整合了 Terraform Cloud 工作区与 Google Cloud 的 Workload Identity Federation,提高了资源管理的安全性。
- blog: goo.gle/3ZupE3j
◇ DALLE 3 和 MJ 的解读对比图 🔗 Twitter
DaLLE 3 的优势:
- 上手更加简单,出图分辨率更高,Prompt 更加简单
- 用户基础 1 个亿,大于 MJ 的 1600 万,无需和公众曝光自己产出,有 API 提供。
缺点:
- 风格有所限制,以及缺乏高级自定义参数
◇ 向 ChatGPT 提供白板会话图片,并编写代码 🔗 Twitter
◇ Llama 生态系统:过去、现在和未来 🔗 Twitter
Llama 社区取得巨大成功,Hugging Face 的 Llama 模型已下载超过 3000 万次,主要云平台如 AWS、Google Cloud 和 Microsoft Azure 广泛采用。初创公司也在使用 Llama 模型进行创新,社区发布了 7000 多个性能提升高达 46%的衍生模型。在 GitHub 上有 7000 多个基于 Llama 的项目,硬件平台提升了 Llama 性能。大型语言模型展示潜在好处,Meta 致力于开放 AI。未来,Llama 关注多模式生成、安全与责任以及支持开发者社区。
◇ 人工智能终于可以让我们与动物对话 🔗 Twitter
鲸类翻译计划(CETI)正在运用机器学习来理解抹香鲸的声音,这一技术的发展对于解码动物声音、保护物种以及深入理解动物行为至关重要。机器学习模型不仅可以用于识别和解释动物行为,如鸟类的声音,还有助于评估动物情感状态,改善它们的福祉。然而破译动物的意义和验证成果仍然存在挑战。虽然人工智能有望用于翻译宠物的面部表情和吠叫声,但担心伦理问题和社会后果。因此建立最佳实践和适当的法规框架以规范这一领域至关重要。动物交流研究需要超越人类的偏见和期望,尝试理解不同物种的语言。
◇ OpenAI 可能不值 900 亿美元的 5 大原因 🔗 News
- OpenAI 今年的预测收入为 10 亿美元,但利润仍不明确,因为高昂的模型训练成本。
- OpenAI 面临多起未决诉讼,包括艺术家和作家的侵权诉讼,可能面临高额罚款。
- 模型需要不断升级,导致进一步的训练和运营成本增加,影响潜在利润。
- OpenAI 面临激烈竞争,其核心技术大型语言模型容易被模仿,可能丧失市场份额。
- 品牌价值不明确,大客户对数据泄露和可靠性担忧。
◇ OpenAI 计划扩展到人工智能硬件领域 🔗 News
OpenAI 计划扩展到硬件领域,与前苹果产品设计师 Jony Ive 以及潜在的合作伙伴讨论人工智能硬件项目,尽管细节尚未确定。OpenAI 的硬件工作仍处于早期阶段,尚未确定硬件的功能、外观、特性或目标市场。作为一家备受瞩目的人工智能公司,OpenAI 以其 ChatGPT 和 GPT-4 语言模型而闻名,目前拥有总计 113 亿美元的风险投资。预计 OpenAI 今年的收入将达到 10 亿美元,并且正在考虑出售股票以提高估值。
「 融资快讯 」
◇ 「燧原科技」完成 D 轮融资 20 亿 🔗 News
燧原科技完成 20 亿元人民币的 D 轮融资,由上海国际集团旗下子公司及产业基金国际资管等联合领投,腾讯、美图公司等多家新老股东跟投。旨在加强其人工智能云端算力产品的发展。该公司已开发 3 代 AI 训练和推理产品,并推出 MaaS 服务平台,构建全栈生态,以适应生成式大模型浪潮,助力通用人工智能时代的算力设施。多个投资机构表示看好其在 AI 算力芯片领域的领先地位和未来发展潜力,将为其提供支持和赋能。燧原科技将继续坚持原始创新和开放开源技术路线,提升产品竞争力,积极参与 AI 芯片标准和生态建设。
「 早点趣玩 」
◇ 免费开源的公司知识问答 SlackBot 🔗 Twitter
Danswer 是一款开源的企业问答系统,用户可以用自然语言提出问题并获取可靠答案,同时支持引用和参考文献。该系统还能与常用工具如 Slack、GitHub、Confluence 等集成,提供 Web UI 和管理控件,方便用户使用。Danswer 支持本地测试和虚拟机部署,还可以在 Kubernetes 上进行部署。它具备生成式人工智能模型、智能文档检索、深度学习模型助手等特点,同时提供用户身份验证和文档级访问管理功能。
- Github: github.com/danswer-ai/…
- 官网:www.danswer.ai/
「 课程推荐」
◇ 微型 机器学习 (TinyML)与高效 深度学习 计算 🔗 YouTube
麻省理工学院的新 YouTube 讲座涵盖了微型机器学习和高效深度学习计算,包括模型压缩、分布式训练等主题。