今日 AI 简报|微软推出多智能体角色模拟库、法律 AI 基础设施发布、高效视频理解模型、小型多模态模型、Logo 生成工具等

187 阅读2分钟

❤️ 如果你也关注大模型与 AI 的发展现状,且对大模型应用开发非常感兴趣,我会快速跟你分享最新的感兴趣的 AI 应用和热点信息,也会不定期分享自己的想法和开源实例,欢迎关注我哦!

🥦 微信公众号|搜一搜:蚝油菜花 🥦


TinyTroupe:微软多智能体角色模拟库

TinyTroupe

TinyTroupe 是微软推出的一个实验性 Python 库,用于模拟具有特定个性、兴趣和目标的人工代理(TinyPersons),在模拟环境(TinyWorld)中进行互动。借助大型语言模型(如 GPT-4),TinyTroupe 支持多智能体互动,提供广泛的应用场景,包括广告评估、软件测试、数据训练和市场机会分析等。

资源

  1. GitHub 仓库:github.com/microsoft/T…

法信法律基座大模型:最高法发布的法律行业通用大模型

法信法律基座大模型

法信法律基座大模型是由最高人民法院发布的基于清华大学与面壁智能科研成果转化的千亿参数通用大模型,定位为国家级法律 AI 基础设施。该模型提供生成式 AI 底层能力,配套安全治理机制,广泛应用于智能辅助审判、行政执法辅助、公共法律服务等多个领域。

资源

  1. 项目官网:www.court.gov.cn/zixun/xiang…

FreeVideoLLM:无需训练的高效视频语言模型

FreeVideoLLM

FreeVideoLLM 是一个无需训练的高效视频语言模型,基于提示引导的视觉感知技术,实现对视频内容的高效理解。该模型通过减少视频帧生成的视觉标记数量,显著降低了计算成本,同时在多个视频问答基准测试中表现出色。

资源

  1. GitHub 仓库:github.com/contrastive…
  2. arXiv 技术论文:arxiv.org/pdf/2410.10…

LogoCreator:开源 AI Logo 生成器

LogoCreator

LogoCreator 是一个开源的 Logo 生成器,基于 Together AI 提供的 Flux Pro 1.1 技术,能够在几秒内生成专业风格的 Logo。该工具适合初创企业、个人品牌、教育机构等多种应用场景,提供免费的使用和修改源代码的支持。

资源

  1. GitHub 仓库:github.com/Nutlope/log…
  2. 在线体验 Demo:www.logo-creator.io/

OmniVision:最小参数多模态模型

OmniVision

OmniVision 是一个专为边缘设备优化的紧凑多模态模型,拥有 968M 参数。该模型能处理视觉和文本输入,基于 LLaVA 架构改进,显著减少图像 token 数量,降低延迟和计算成本。OmniVision 适用于视觉问答、图像描述等多个任务。

资源

  1. 项目官网:nexa.ai/blogs/omni-…
  2. HuggingFace 模型库:huggingface.co/NexaAIDev/o…

❤️ 如果你也关注大模型与 AI 的发展现状,且对大模型应用开发非常感兴趣,我会快速跟你分享最新的感兴趣的 AI 应用和热点信息,也会不定期分享自己的想法和开源实例,欢迎关注我哦!

🥦 微信公众号|搜一搜:蚝油菜花 🥦