首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
大语言模型
深度学习机器
创建于2023-11-21
订阅专栏
大语言模型相关的算法、工程实现及优秀项目
等 14 人订阅
共54篇文章
创建于2023-11-21
订阅专栏
默认顺序
默认顺序
最早发布
最新发布
Embedding Gemma,谷歌发布的小而精向量模型,仅需0.3B|附RAG实战代码
EmbeddingGemma是Google发布的开源小规模多语言文本嵌入模型,旨在常见设备上高效运行,同时在 MTEB / MMTEB 等评测任务中保持与同类模型相当的性能
UltraRAG:一个基于MCP协议,完全模块化的RAG框架
UltraRAG作为一个RAG框架,比较适合RAG科研人员使用,可以快速实验各种复杂的 RAG 策略,而无需重写大量代码,只需修改 YAML 文件。
aisuite:统一的大模型SDK,简化LLM开发流程
aisuite作为一个开源的Python库,通过提供统一的接口和灵活的模型切换机制,简化了跨多个LLM提供商的集成过程。对于经常使用不同LLM的开发者来说,可以显著降低开发门槛,提高开发效率.
Deep Research的架构演进:从Multi Agent到Supervisor-Researcher模式的技术实践
随着LLM的能力越来越强,Agent设计中更多决策权会交给模型,但是在Deep Research这种场景下,好像还是以工作流作为基本实现思路会更加合适一些,用于确保生成研究内容的质量下限。
Gemini CLI源码解析:深入工具系统的实现细节
之前的文章介绍过主控Agent以及上下文实现的细节,除了主控Agent和上下文管理外,工具实现也是Agentic的一个重要环节。
GLM-4.5系列模型导读,综合能力更强的高性价比模型
在沉寂了半年之后,智谱推出了新一代开源模型GLM-4.5系列,采用MOE架构并使用混合推理模式。模型统一提升了在推理、代码与智能体等多方面的能力,专为复杂智能体应用打造。
Gemini CLI源码解析:Agent与上下文管理实现细节
gemini-cli 从开源至今仅一个多月,已经收获接近65K Star,作为第一个开源的通用命令行智能体工具,现如今功能已经非常完善。本文将对源码进行解析,学习其中优秀Agent设计思路
构建AI智能体的“上下文工程”方法论:Manus团队的实战经验
上下文工程已成为现代AI Agent系统不可或缺的一部分。无论模型本身如何进化,对上下文的建模、维护、裁剪与反馈机制的设计,将决定一个智能体是否稳健、高效、可扩展。
Kimi k2:最大开源Agentic LLM,Claude开源平替
月之暗面发布的Kimi K2,具有目前开源模型中最大的参数量,具备非常强的coding能力。该模型从一开始就清晰地把Agentic作为该模型的核心能力,包括模型训练的整个过程都蕴含对该能力的重视
OCRFlux-3B:开源 OCR + LLM 模型的新标杆,支持跨页表格合并
OCRFlux-3B 是目前业内首个开源支持跨页结构智能合并的模型,不仅精度高,而且支持关键的结构化能力,并且能够在消费级硬件上运行,实用性极高。
Prompt Engineering vs Context Engineering:我们与LLM交互方式的演变
Prompt Engineering 是我们与 LLM 交互的原始技巧,但随着智能体的开发,我们需要的不再是简单的文本生成器,而是一个智能助手。
Nanonets-OCR:Qwen2.5VL-3B的微调模型 更强大的文档解析能力|附效果实测
Nanonets-OCR不再满足于单纯提取文本,它能智能解析图像中的公式、表格、水印、签名、图表、复选框等复杂结构,并输出格式清晰的 Markdown。
MonkeyOCR:用三元组范式重构文档解析与识别
MonkeyOCR提出一种新的SRR三元组架构,结合传统两种文档解析方式的优化,在精度和效率上都有不错的表现。
Mem0:新一代AI Agent的持久化记忆体系
Mem0 是一个轻量级、可扩展的长期记忆框架,支持本地部署和云端使用。其设计初衷是为 LLM 提供结构化的记忆支持,帮助智能体记住用户偏好、背景信息等,从而提供更个性化、更连贯的回答
AI Agent的记忆体系与架构设计
LLM本质上是无状态的模型,每次调用都像一次“短暂失忆”。为了让 AI Agent真正理解上下文、具备个性化交互和任务持续性,引入记忆系统至关重要。
Ollama-OCR:基于Ollama多模态大模型的端到端文档解析和处理
Ollama-OCR是一个Python的OCR解析库,结合了Ollama的模型能力,可以直接处理 PDF 文件无需额外转换,轻松从扫描版或原生 PDF 文档中提取文本和数据。
MCP原理解析与效果实测|附实用MCP推荐
MCP是由Anthropic推出的开源协议,目的是通过统一的连接方式,让大型语言模型(LLM)与外部数据源和工具无缝集成,减少重复造轮子的过程。
PandaAI:使用自然语言进行数据分析的利器
PandaAI是一个开源的大模型智能体,主要利用自然语言进行数据处理和分析,能够将简单的自然语言输入转换为可执行代码,生成可视化图表。
图解大模型注意力计算过程以及KV Cache原理
Decoder-only 架构的大模型,其任务是根据历史信息逐步预测下一个词。若使用双向注意力,在训练时模型能看到完整序列,但推理时还是只能看到历史部分,这会导致训练和推理不一致
下一页