首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
大语言模型
深度学习机器
创建于2023-11-21
订阅专栏
大语言模型相关的算法、工程实现及优秀项目
等 12 人订阅
共43篇文章
创建于2023-11-21
订阅专栏
默认顺序
默认顺序
最早发布
最新发布
Nanonets-OCR:Qwen2.5VL-3B的微调模型 更强大的文档解析能力|附效果实测
Nanonets-OCR不再满足于单纯提取文本,它能智能解析图像中的公式、表格、水印、签名、图表、复选框等复杂结构,并输出格式清晰的 Markdown。
MonkeyOCR:用三元组范式重构文档解析与识别
MonkeyOCR提出一种新的SRR三元组架构,结合传统两种文档解析方式的优化,在精度和效率上都有不错的表现。
Mem0:新一代AI Agent的持久化记忆体系
Mem0 是一个轻量级、可扩展的长期记忆框架,支持本地部署和云端使用。其设计初衷是为 LLM 提供结构化的记忆支持,帮助智能体记住用户偏好、背景信息等,从而提供更个性化、更连贯的回答
AI Agent的记忆体系与架构设计
LLM本质上是无状态的模型,每次调用都像一次“短暂失忆”。为了让 AI Agent真正理解上下文、具备个性化交互和任务持续性,引入记忆系统至关重要。
Ollama-OCR:基于Ollama多模态大模型的端到端文档解析和处理
Ollama-OCR是一个Python的OCR解析库,结合了Ollama的模型能力,可以直接处理 PDF 文件无需额外转换,轻松从扫描版或原生 PDF 文档中提取文本和数据。
MCP原理解析与效果实测|附实用MCP推荐
MCP是由Anthropic推出的开源协议,目的是通过统一的连接方式,让大型语言模型(LLM)与外部数据源和工具无缝集成,减少重复造轮子的过程。
PandaAI:使用自然语言进行数据分析的利器
PandaAI是一个开源的大模型智能体,主要利用自然语言进行数据处理和分析,能够将简单的自然语言输入转换为可执行代码,生成可视化图表。
图解大模型注意力计算过程以及KV Cache原理
Decoder-only 架构的大模型,其任务是根据历史信息逐步预测下一个词。若使用双向注意力,在训练时模型能看到完整序列,但推理时还是只能看到历史部分,这会导致训练和推理不一致
让浏览器AI起来:基于大模型Agent的浏览器自动化工具
最近有个非常火的项目,利用大模型Agent驱动浏览器完成各种操作,如网页搜索、爬虫分析、机票酒店预定、股票监控等,号称全面替代所有在浏览器上的操作,试用方式还是比较简单的,以下将进行简单介绍。
推理模型时代:大语言模型如何从对话走向深度思考?
对话模型是专门用于问答交互的语言模型,符合人类的聊天方式,返回的内容可能仅仅只是一个简短的答案,一般模型名称后面会带有「chat」字样。
DeepSeek系列模型完全使用手册|附安装教程
DeepSeek系列模型在去年12月发布以来引起了不少关注,而推理模型R1的发布则进一步点燃了国内外用户的热情。
Qwen2.5-VL:更强大的多模态大模型|附实测结果
通义千问更新了最新的多模态大模型Qwen2.5-VL,拥有包含 3B、7B 和 72B 在内的 3 个模型尺寸,同时完全开源
DeepSeek-R1:开源Top推理模型的实现细节、使用与复现
直接用强化学习就可以让模型获得显著的推理能力,说明并不一定需要SFT才行。 强化学习并不一定需要复杂的奖励模型,使用简单的规则反而取得意想不到的效果。 通过知识蒸馏让小模型一定程
AI实现个人阅读网页插件
日常工作中经常需要浏览各种Github项目或者一些网页,逐字逐句看总觉得不够效率,如果在每次打开一个新的页面时就能够掌握大概的内容,然后再决定是否深入阅读就方便多了。
仅需一个插件让关系型数据库实现图数据存储与检索
Apache AGE是一个PostgreSQL数据库的扩展插件,使得在关系型数据库中也可以使用openCypher查询语言进行图查询。
GitHub Copilot免费上线!快速上手指南与功能解析
GitHub Copilot在12月宣布免费订阅,不再限制学生和开源项目的维护者了,对于习惯白嫖的开发者来说无疑多了一个选择。
LangGraph:基于图结构的大模型智能体开发框架
LangGraph 是LangChainAI开发的一个工具库,用于创建代理和多代理智能体工作流。它提供了以下核心优势:周期、可控性和持久性,对于Agent智能体开发者来说无疑减少了许多工作量。
轻量高效的知识图谱RAG系统:LightRAG
LightRAG是港大Data Lab提出一种基于知识图谱结构的RAG方案,相比GraphRAG具有更快更经济的特点。
PostgreSQL 数据库向量化的核心:pgvector
pgvector是一款开源的向量搜索引擎,除了具备所有Postgres数据库的特性外,最主要的特点是能在Postgres数据库存储和检索向量数据,支持向量的精确检索和模糊检索。
下一页