240819-240823 早早聊 AI 资讯| Ideogram 2.0;微软「小而美」系列三连发!视觉小钢炮PK GPT-4o,MoE新秀力压Llama 3

288 阅读9分钟

👉👉原文链接👈👈

阅读详细图文,可访问知识库


◇ Ideogram 2.0 🔗 News

我们很高兴发布 Ideogram 2.0,这是我们的全新前沿文本转图像模型,具有业界领先的生成逼真图像、图形设计、排版等功能。与所有 Ideogram 模型一样,Ideogram 2.0 也是从头开始训练的,在许多质量指标方面都明显优于其他文本转图像模型,包括图像文本对齐、总体主观偏好和文本渲染准确性。

今天的里程碑发布还包括 Ideogram iOS 应用程序、Ideogram API 的测试版和 Ideogram Search 的发布。一年前,我们宣布成立 Ideogram AI,以推进让每个人都变得更有创造力的使命。在过去的一年里,我们的用户生成了超过 10 亿张图片。现在可以通过 Ideogram Search 公开访问这个庞大的集合,为所有用户提供了丰富的灵感来源。此外,Ideogram iOS 应用程序将我们尖端的平台带给移动用户,而 Ideogram API 则以最具竞争力的价格将我们的技术带给希望增强其应用程序和工作流程的开发人员。

◇ 星辰 Astribot S1 机器人正式发布可以通过VR眼镜远程操控手臂非常灵活,可以执行非常多的任务 🔗 News

国产人形机器人 Astribot S1 由星尘智能开发,将于 8 月 21 日至 25 日在北京世界机器人大会上亮相。Astribot S1 技能多样,能弹琴、泡功夫茶、颠勺、做华夫饼、用吸尘器、喂猫和逗猫等。它采用人形上半身加轮式底盘的设计,上肢操作能力强,头、手、躯干模块化,单臂自由度和运动负载能力优秀。在数据采集上具备优势,能从海量数据中学习并收集多维度高质量数据,算法上加载大模型,具备多种能力。其独特的刚柔耦合传动机构设计使操作精度高且安全。Astribot S1 的研发团队经验丰富,来自顶尖企业和高校。公司愿景是让数十亿人拥有 AI 机器人助理,该机器人将于 2024 年内商业化,具有成本和价格优势。创始人欢迎大家提需求,以促进其能力提升。

◇ 微软「小而美」系列三连发!视觉小钢炮PK GPT-4o,MoE新秀力压Llama 3.1 🔗 News

微软 Phi 3.5 版本一口气连发的三款模型:

Phi - 3.5 - mini - instruct:拥有 38.2 亿参数,支持 128k token 上下文长度,在内存或算力受限的设备上表现出色,在多语言和多轮对话任务中性能优秀,能执行长上下文任务。

Phi - 3.5 - MoE - instruct:是微软 Phi 模型中的首个 MoE 模型,采用混合专家架构,在代码、数学和多语言理解方面性能强大,能处理不同种类的专业任务,在专业学科领域表现出色。

Phi - 3.5 - vision - instruct:多模态模型,集成了文本和图像处理功能,适用于多帧图像理解和推理等任务,在大多数图像基准测试性能上有所提升。

这三个模型都可供开发人员在 Hugging Face 上下载、使用和微调,并获得了微软的 MIT 许可证,可以进行不受限制的商业应用和修改。它们在很多第三方基准测试中性能表现不错,甚至在某些情况下击败了其他领先大模型。

OpenAI 正在与康泰纳仕合作,进一步将优质新闻报道融入 ChatGPT 和 SearchGPT 原型中 🔗 News

OpenAI 宣布与康泰纳仕(Condé Nast)建立合作伙伴关系,将在其产品(包括 ChatGPT 和 SearchGPT 原型)中展示来自 Vogue、The New Yorker 等顶级品牌的内容。SearchGPT 原型正在测试新的搜索功能,能更快、更直观地查找信息和可靠内容来源,并提供新闻故事的直接链接。OpenAI 计划未来将这些功能的精华直接整合到 ChatGPT 中,且正在与新闻合作伙伴合作收集反馈和见解,以确保这些整合能增强用户体验并为 ChatGPT 的未来更新提供信息。康泰纳仕加入了越来越多的出版商行列,与 OpenAI 共同致力于将新闻业与 AI 服务更深入地融合,确保 AI 在新闻发现和传递中发挥更大作用时,保持准确性、完整性和对优质报道的尊重。

◇ 佩洛西团队公开发表反对 SB 1047 的声明!影响巨大!加州政策制定者的明智科技政策姿态正在显现! 🔗 News

国会女议员南希·佩洛西发表声明,表示反对 SB 1047,这是一项旨在监管人工智能的加州法案。国会中许多人认为,SB 1047 是出于好意,但缺乏根据。来自湾区的其他国会议员——佐伊·洛夫格伦、安娜·艾舒和罗·卡纳——对该法案表示担忧,称该法案“弊大于利”。“人工智能源自加州,”她说。“我们必须制定出一个能为国家和世界树立榜样的立法。我们有机会和责任让小企业家和学术界——而不是大型科技公司——占据主导地位。”发起该法案的州参议员斯科特·维纳(Scott Wiener)发表了自己的声明作为回应,他说,虽然他“非常尊重”佩洛西,但“我尊重并强烈反对她的声明。”“该法案只要求最大的人工智能开发商做他们每个人一再承诺要做的事情:对功能强大的人工智能模型进行基本的安全测试,”维纳补充道。


◇ 国产机器人黑马首次登场,打螺丝堪比擎天柱!国家队全栈自主研发 🔗 News

在 2024 世界机器人大会上亮相的领航者 2 号 NAVIAI 人形机器人由浙江人形机器人创新中心全栈自主研发,外观类人,身高 1.65 米,体重约 60 公斤。其作业智能,能完成多种任务,如演讲、泡茶、下棋等,还能在展会售卖,在工业场景中进行高精度作业。它具备高学习能力和快速反应速度,AI 算力达 275Tops。创新中心以自主研发实力领先,团队汇聚顶尖人才。领航者 2 号已在工业场景应用,并有望大规模落地。人形机器人行业蓬勃发展,2024 年是落地元年,其技术向多领域转变。中国独居人口和老龄化问题使该机器人成为人们的希望,它体现了科技与人文的融合。领航者 2 号的出现代表了 “国家队” 的成果,未来期待创新中心能在人形机器人领域取得更大成就。

◇ 豆包版《Her》升级上新!随时打断,交流自然,还是开箱即用的那种 🔗 News

火山引擎发布的豆包大模型的升级情况。新版豆包大语言模型综合能力提升,包括角色扮演和语言理解等能力。同时,豆包大模型的语音能力也进行了升级,整合 RTC 技术发布对话式 AI 实时交互解决方案,用户能随时打断或插话,AI 声音更具表现力,对话更自然流畅。此外,火山引擎还携手多点 DMALL 成立零售大模型生态联盟,打造零售 AI 解决方案。该对话式 AI 实时交互服务方案具有开箱即用、随时打断、实时秒回、全球畅聊、产品融合等特点,还提供了灵活多样的接入方案,包括一站式解决方案、自集成方案和 WebRTC 传输网络方案。目前,AI 实时语音能力已在国内 TOP 级的 AI 虚拟人物聊天产品中应用落地。网页还提供了 Seed - TTS 及 Seed - ASR 技术的详情链接。总之,豆包大模型的升级将为用户带来更自然、高效的交互体验。

◇ Vercel升级v0:可视化的前端对话编程 🔗 News

Vercel 升级了 V0,加入对话式 UI 界面。集成了最新的 Next.js、React 和 Web 开发知识。能够运行 framer-motion 等 npm 包。实现了更快速、更可靠的流式处理功能。

◇ 代码编辑工具 Zed 与 Anthropic 合作推出了 Zed AI ****🔗 News

在 Zed,我们致力于掌握文本处理艺术。从制作解析器生成器到设计编程语言,再到发布两个生产级文本编辑器,我们一直被文字和符号的表达能力所吸引。因此,当大型语言模型出现并彻底改变文本解释和生成时,我们知道我们必须探索它们的潜力。

自 LLM 进入我们的视野以来的两年里,我们一直专注于构建 Zed 的核心:一个快速、可靠的文本编辑器,具有开发人员需要的功能。与此同时,我们一直在悄悄尝试将 LLM 集成到我们自己的工作流程中。不是作为一种华而不实的噱头,而是一种实用的工具,可以提高我们在复杂的现实世界代码库上工作的效率。

随着我们完善 AI 集成,我们引起了一些意想不到的盟友的注意。世界领先的 AI 公司之一 Anthropic 的工程师发现了 Zed,并很快看到了我们原始的以文本为中心的界面的价值,该界面将用户和语言模型之间的分离降到最低。他们的热情得到了证实,我们的对话引发了一场对话,并迅速发展成为合作。

现在,我们准备推出 Zed AI,这是一项托管服务,为 Zed 中的 AI 编码提供方便且高效的支持,由 Anthropic 的 Claude 3.5 Sonnet 提供支持,只需登录即可访问。我们还与 Anthropic 合作优化 Zed 以实施其新的 Prompt Caching 测试版,即使在上下文窗口中包含数千行代码,也能实现闪电般的快速响应,同时降低成本。

获取更多全球最新 AI 动态、AI 提效工具,知识题,加入早早聊 AI 咨资讯圈,访问 原文链接 加群备注「 资讯 」...