今日 AI 简报|个人 AI 助手、实时 AI 语音助手、高清视频生成、虚拟试穿及模块化智能体系统等

435 阅读3分钟

❤️ 如果你也关注大模型与 AI 的发展现状,且对大模型应用开发非常感兴趣,我会快速跟你分享最新的感兴趣的 AI 应用和热点信息,也会不定期分享自己的想法和开源实例,欢迎关注我哦!

🥦 微信公众号|搜一搜:蚝油菜花 🥦


Olly.bot:集成多种通用 AI 能力的个人 AI 助手

olly.png

Olly.bot 是集成于 iMessage 和 SMS 的个人 AI 助手,基于 OpenAI 大模型,提供网络搜索、文档分析、图片生成等功能。无需下载注册,支持 iOS、macOS、Android 和 Windows 平台,保护用户隐私。

资源

  1. 产品官网:olly.bot
  2. GitHub 仓库:github.com/ollybot/oll…

CogVideoX v1.5:智谱最新开源的 AI 视频生成模型

cogvideo-v1.5.png

CogVideoX v1.5 是智谱最新开源的 AI 视频生成模型,支持生成 5 至 10 秒、768P 分辨率、16 帧的视频,结合即将开放内测的 CogSound 音效模型能自动生成匹配的 AI 音效。在图生视频质量、美学表现、运动合理性及复杂语义理解方面有显著提升。

资源

  1. GitHub 仓库:github.com/THUDM/CogVi…
  2. HuggingFace 模型库:huggingface.co/THUDM/CogVi…

AdaCache:Meta 推出加速 AI 视频实时高质量生成的开源项目

adacache.png

AdaCache 是 Meta 推出的开源技术,通过自适应缓存机制和运动正则化策略优化计算资源分配,显著提升 AI 视频生成速度,适用于多 GPU 环境。

资源

  1. 项目官网:adacache-dit.github.io
  2. GitHub 仓库:github.com/AdaCache-Di…
  3. arXiv 技术论文:arxiv.org/pdf/2411.02…

Fashion-VDM:谷歌和华盛顿大学联合推出的虚拟试穿技术

Fashion-VDM.png

Fashion-VDM 是谷歌和华盛顿大学共同推出的基于视频扩散模型的虚拟试穿技术,生成高质量的虚拟试穿视频,保持人物身份和动作,解决服装细节和时间一致性的挑战。

资源

  1. 项目官网:johannakarras.github.io/Fashion-VDM
  2. arXiv 技术论文:arxiv.org/pdf/2411.00…

AgentSquare:清华推出模块化智能体系统设计和搜索新框架

AgentSquare.png

AgentSquare 是清华大学团队推出的新框架,自动在模块化设计空间中搜索大型语言模型代理,支持智能体的高速自我演化和自适应演进,显著提升智能体性能。

资源

  1. 项目官网:tsinghua-fib-lab.github.io/AgentSquare…
  2. GitHub 仓库:github.com/tsinghua-fi…
  3. arXiv 技术论文:arxiv.org/pdf/2410.06…

Ichigo:开源的多模态 AI 语音助手

ichigo.png

Ichigo 是开源的多模态 AI 语音助手,采用混合模态模型,实时处理语音和文本的交织序列,实现首令牌生成的平均延迟仅为 111 毫秒,提供接近实时的语音交互体验。

资源

  1. GitHub 仓库:github.com/homebrewltd…
  2. HuggingFace 模型库:huggingface.co/collections…
  3. arXiv 技术论文:arxiv.org/pdf/2410.15…

❤️ 如果你也关注大模型与 AI 的发展现状,且对大模型应用开发非常感兴趣,我会快速跟你分享最新的感兴趣的 AI 应用和热点信息,也会不定期分享自己的想法和开源实例,欢迎关注我哦!

🥦 微信公众号|搜一搜:蚝油菜花 🥦