❤️ 如果你也关注大模型与 AI 的发展现状,且对大模型应用开发非常感兴趣,我会快速跟你分享最新的感兴趣的 AI 应用和热点信息,也会不定期分享自己的想法和开源实例,欢迎关注我哦!
🥦 微信公众号|搜一搜:蚝油菜花 🥦
Olly.bot:集成多种通用 AI 能力的个人 AI 助手
Olly.bot 是集成于 iMessage 和 SMS 的个人 AI 助手,基于 OpenAI 大模型,提供网络搜索、文档分析、图片生成等功能。无需下载注册,支持 iOS、macOS、Android 和 Windows 平台,保护用户隐私。
资源
- 产品官网:olly.bot
- GitHub 仓库:github.com/ollybot/oll…
CogVideoX v1.5:智谱最新开源的 AI 视频生成模型
CogVideoX v1.5 是智谱最新开源的 AI 视频生成模型,支持生成 5 至 10 秒、768P 分辨率、16 帧的视频,结合即将开放内测的 CogSound 音效模型能自动生成匹配的 AI 音效。在图生视频质量、美学表现、运动合理性及复杂语义理解方面有显著提升。
资源
- GitHub 仓库:github.com/THUDM/CogVi…
- HuggingFace 模型库:huggingface.co/THUDM/CogVi…
AdaCache:Meta 推出加速 AI 视频实时高质量生成的开源项目
AdaCache 是 Meta 推出的开源技术,通过自适应缓存机制和运动正则化策略优化计算资源分配,显著提升 AI 视频生成速度,适用于多 GPU 环境。
资源
- 项目官网:adacache-dit.github.io
- GitHub 仓库:github.com/AdaCache-Di…
- arXiv 技术论文:arxiv.org/pdf/2411.02…
Fashion-VDM:谷歌和华盛顿大学联合推出的虚拟试穿技术
Fashion-VDM 是谷歌和华盛顿大学共同推出的基于视频扩散模型的虚拟试穿技术,生成高质量的虚拟试穿视频,保持人物身份和动作,解决服装细节和时间一致性的挑战。
资源
- 项目官网:johannakarras.github.io/Fashion-VDM
- arXiv 技术论文:arxiv.org/pdf/2411.00…
AgentSquare:清华推出模块化智能体系统设计和搜索新框架
AgentSquare 是清华大学团队推出的新框架,自动在模块化设计空间中搜索大型语言模型代理,支持智能体的高速自我演化和自适应演进,显著提升智能体性能。
资源
- 项目官网:tsinghua-fib-lab.github.io/AgentSquare…
- GitHub 仓库:github.com/tsinghua-fi…
- arXiv 技术论文:arxiv.org/pdf/2410.06…
Ichigo:开源的多模态 AI 语音助手
Ichigo 是开源的多模态 AI 语音助手,采用混合模态模型,实时处理语音和文本的交织序列,实现首令牌生成的平均延迟仅为 111 毫秒,提供接近实时的语音交互体验。
资源
- GitHub 仓库:github.com/homebrewltd…
- HuggingFace 模型库:huggingface.co/collections…
- arXiv 技术论文:arxiv.org/pdf/2410.15…
❤️ 如果你也关注大模型与 AI 的发展现状,且对大模型应用开发非常感兴趣,我会快速跟你分享最新的感兴趣的 AI 应用和热点信息,也会不定期分享自己的想法和开源实例,欢迎关注我哦!
🥦 微信公众号|搜一搜:蚝油菜花 🥦