今日 AI 简报｜个人 AI 助手、实时 AI 语音助手、高清视频生成、虚拟试穿及模块化智能体系统等

2024-11-08 561 阅读3分钟

❤️ 如果你也关注大模型与 AI 的发展现状，且对大模型应用开发非常感兴趣，我会快速跟你分享最新的感兴趣的 AI 应用和热点信息，也会不定期分享自己的想法和开源实例，欢迎关注我哦！

🥦 微信公众号｜搜一搜：蚝油菜花 🥦

Olly.bot：集成多种通用 AI 能力的个人 AI 助手

Olly.bot 是集成于 iMessage 和 SMS 的个人 AI 助手，基于 OpenAI 大模型，提供网络搜索、文档分析、图片生成等功能。无需下载注册，支持 iOS、macOS、Android 和 Windows 平台，保护用户隐私。

资源

产品官网：olly.bot
GitHub 仓库：github.com/ollybot/oll…

CogVideoX v1.5：智谱最新开源的 AI 视频生成模型

cogvideo-v1.5.png

CogVideoX v1.5 是智谱最新开源的 AI 视频生成模型，支持生成 5 至 10 秒、768P 分辨率、16 帧的视频，结合即将开放内测的 CogSound 音效模型能自动生成匹配的 AI 音效。在图生视频质量、美学表现、运动合理性及复杂语义理解方面有显著提升。

资源

GitHub 仓库：github.com/THUDM/CogVi…
HuggingFace 模型库：huggingface.co/THUDM/CogVi…

AdaCache：Meta 推出加速 AI 视频实时高质量生成的开源项目

AdaCache 是 Meta 推出的开源技术，通过自适应缓存机制和运动正则化策略优化计算资源分配，显著提升 AI 视频生成速度，适用于多 GPU 环境。

资源

项目官网：adacache-dit.github.io
GitHub 仓库：github.com/AdaCache-Di…
arXiv 技术论文：arxiv.org/pdf/2411.02…

Fashion-VDM：谷歌和华盛顿大学联合推出的虚拟试穿技术

Fashion-VDM 是谷歌和华盛顿大学共同推出的基于视频扩散模型的虚拟试穿技术，生成高质量的虚拟试穿视频，保持人物身份和动作，解决服装细节和时间一致性的挑战。

资源

项目官网：johannakarras.github.io/Fashion-VDM
arXiv 技术论文：arxiv.org/pdf/2411.00…

AgentSquare：清华推出模块化智能体系统设计和搜索新框架

AgentSquare 是清华大学团队推出的新框架，自动在模块化设计空间中搜索大型语言模型代理，支持智能体的高速自我演化和自适应演进，显著提升智能体性能。

资源

项目官网：tsinghua-fib-lab.github.io/AgentSquare…
GitHub 仓库：github.com/tsinghua-fi…
arXiv 技术论文：arxiv.org/pdf/2410.06…

Ichigo：开源的多模态 AI 语音助手

Ichigo 是开源的多模态 AI 语音助手，采用混合模态模型，实时处理语音和文本的交织序列，实现首令牌生成的平均延迟仅为 111 毫秒，提供接近实时的语音交互体验。

资源

GitHub 仓库：github.com/homebrewltd…
HuggingFace 模型库：huggingface.co/collections…
arXiv 技术论文：arxiv.org/pdf/2410.15…

❤️ 如果你也关注大模型与 AI 的发展现状，且对大模型应用开发非常感兴趣，我会快速跟你分享最新的感兴趣的 AI 应用和热点信息，也会不定期分享自己的想法和开源实例，欢迎关注我哦！

🥦 微信公众号｜搜一搜：蚝油菜花 🥦