云行 AI 开发周刊 - 第 10 期

66 阅读2分钟

云行AI

最近在项目中使用了 MyBatis-flex,与 MyBatisPlus 相比,flex 主要优势在于支持多表关联查询。它不仅能自动映射,还支持手动关联查询,既灵活又性能极佳。后续计划抽时间将项目中的 plus 替换为 flex。

开源推荐

  1. Trae Agent

地址: github.com/bytedance/t…

Trae Agent 是一个基于 LLM 通用软件工程任务的代理。它提供了一个强大的 CLI 界面,可以理解自然语言指令,并使用各种工具和 LLM 提供商执行复杂的软件工程工作流。

  1. WebAgent

地址: github.com/Alibaba-NLP…

阿里开源,专门执行复杂信息搜索的WebAgent,WebSailor-72B版本目前是开源最佳Web Agent,能力接近豆包Search。

  1. OmniAvatar

地址: github.com/Omni-Avatar…

音频驱动生成虚拟人视频,基于Wan 2.1模型,通过音频生成虚拟人说话视频,嘴型匹配,有表情有动作。

  1. OCRFlux

地址: github.com/chatdoc-com…

OCRFlux 是一个多模态大型语言模型工具包,用于将 PDF 和图像转换为干净、易读的纯 Markdown 文本。它旨在将当前最先进的技术水平提升到一个显著更高的层次。

  1. ThinkSound

地址: github.com/FunAudioLLM…

ThinkSound 是一个统一的 Any2Audio 生成框架,通过链式思维(Chain-of-Thought, CoT)推理进行流匹配指导。

基于 PyTorch 的多模态音频生成与编辑实现:可基于视频、文本、音频及其组合,生成或编辑音频,底层由多模态大语言模型(MLLMs)逐步推理驱动。

  1. Hands-On Large Language Models

地址: github.com/HandsOnLLM/…

O'Reilly 书籍《Hands-On Large Language Models》的官方代码库,旨在帮助读者动手实践和深入理解大型语言模型。

  1. GenAI Agents

地址: github.com/NirDiamant/…

当今最广泛和最具活力的生成式人工智能(GenAI)代理教程和实现集合之一。这个资源库是一个全面的学习、构建和分享 GenAI 代理的资源,从简单的对话机器人到复杂的、多代理系统。

  1. MCP Toolbox for Databases

地址: github.com/googleapis/…

数据库 MCP 工具箱是一个开源的数据库 MCP 服务器。它通过处理连接池、身份验证等复杂问题,使您能够更轻松、更快、更安全地开发工具。

  1. Machine Learning for Beginners

地址: github.com/microsoft/M…

微软开源,面向所有人的经典机器学习入门课程 (ML-For-Beginners)。