今日 AI 简报| AI 图像编辑、聊天机器人、数学推理、网页问答、视觉语言模型及音乐转谱等

94 阅读3分钟

❤️ 如果你也关注大模型与 AI 的发展现状,且对大模型应用开发非常感兴趣,我会快速跟你分享最新的感兴趣的 AI 应用和热点信息,也会不定期分享自己的想法和开源实例,欢迎关注我哦!

🥦 微信公众号|搜一搜:蚝油菜花 🥦


MagicQuill:AI 互动式图像编辑工具

MagicQuill

MagicQuill 是香港科技大学、蚂蚁集团、浙江大学和香港大学共同推出的开源 AI 互动式图像编辑工具。它基于用户友好的界面和 AI 支持的智能建议,实现精确的局部图像编辑,支持像素级别的精确编辑和多种魔法笔刷。

资源

  1. GitHub 仓库:github.com/magic-quill…
  2. arXiv 技术论文:arxiv.org/pdf/2411.09…
  3. 在线体验 Demo:magicquill.art/demo/

ai-chatbot:开源 AI 聊天机器人模板

ai-chatbot

ai-chatbot 是 Vercel 推出的开源项目,基于 Next.js 框架和 Vercel AI SDK 构建。它提供一个功能完备、易于定制的 AI 聊天机器人模板,支持多种大语言模型,具备灵活的模型切换能力,提供出色的 UI 设计和数据管理功能。

资源

  1. GitHub 仓库:github.com/vercel/ai-c…

k0-math:数学推理模型

k0-math.png

k0-math 是月之暗面推出的最新数学推理模型,主打深入思考能力。该模型在 MATH、中考、高考、考研等数学基准测试中表现出色,基于不断探索和试错解决数学问题,即将上线 Kimi 网页版和 Kimi 智能助手 APP。

资源

暂无

WebChat:网页内容增强问答 AI 助手

WebChat.png

演示视频:github.com/user-attach…

WebChat 是一个基于 Chrome 扩展开发的 AI 助手,能够帮助用户理解和分析当前网页的内容,支持自定义 API 和本地大模型,消息渲染支持 Markdown 格式。

资源

  1. 项目官网:github.com/Airmomo/Web…
  2. Ollama 官网:ollama.ai

Florence-2:多功能视觉语言模型

Florence-2

Florence-2 是微软 Azure AI 团队推出的多功能视觉模型,能够执行图像描述、目标检测、视觉定位和图像分割等多种计算机视觉任务。它基于 Transformer 架构,训练使用大规模数据集,实现多模态信息的融合。

资源

  1. GitHub 仓库:github.com/retkowsky/f…
  2. HuggingFace 模型库:huggingface.co/microsoft/F…
  3. arXiv 技术论文:arxiv.org/pdf/2311.06…

Audio Decomposition:开源音乐转谱工具

Audio Decomposition

Audio Decomposition 是一款开源音乐转谱工具,基于傅里叶变换和信封匹配将音乐中的各个音符和乐器分离,实现音乐到乐谱的转换。它支持用户自由使用和修改代码,适应不同的需求。

资源

  1. 项目官网:matthew-bird.com/blogs/Audio…
  2. GitHub 仓库:github.com/mbird1258/A…

Thinking Claude:深度思考提示工具

Thinking Claude

Thinking Claude 是一款基于深度思考协议和浏览器扩展工具的项目,增强 AI 模型 Claude-3.5 的“深度思维”能力,让其思考逻辑更接近人类。它提供更易于阅读和管理的界面,使 AI 对话更加有趣和富有洞察力。

资源

  1. GitHub 仓库:github.com/richards199…

❤️ 如果你也关注大模型与 AI 的发展现状,且对大模型应用开发非常感兴趣,我会快速跟你分享最新的感兴趣的 AI 应用和热点信息,也会不定期分享自己的想法和开源实例,欢迎关注我哦!

🥦 微信公众号|搜一搜:蚝油菜花 🥦