人工智能 - 掘金

🔥 10分钟搭建你的AI知识库！让ChatGPT不再"胡说八道"的秘密武器

## 🤔 Why - 为什么我们需要RAG？ ### 痛点一：LLM的"健忘症" 你有没有遇到过

土豆1250
24
点赞

为什么说CLIP是多模态大模型的基石？

引言在DeepSeek-OCR的编码器架构中，CLIP被作为关键组件引入。多模态模型的核心挑战之一在于视觉信息的语义理解，即完成语言与图像在共享语义空间中的对齐映射。本文将系统解析OpenAI于

智泊AI
10
点赞

说人话，查数据：构建一个自然语言驱动的 SQLite 后台

本文通过 DeepSeek 大模型与 SQLite 构建了一个自然语言操作数据库的原型，利用动态 Schema 注入和强约束 Prompt，实现从口语化指令到可执行 SQL 的端到端生成。

有意义
53
27

说人话，查数据：构建一个自然语言驱动的 SQLite 后台

【从零开始】19. 模型实测与验证

在真正开讲之前需要补充一下“16. 基于 CPU 的转换、量化实现”和“18. 持续优化模型微调”中遗漏的信息。 “基于 CPU 的转换、量化实现”内容补充在这章我通过 Python 导出基于 Op

LLM 扫盲：什么是 Tokens？

重新梳理 LLM 的 Token 概念，解析 GPT-5.1 的多语言编码优化、计费与上下文窗口限制，并给出本地用 tiktoken 预估 Token 的实践方案。

mCell
146
1

LLM 扫盲：什么是 Tokens？

震惊！Open AI把Transformer训练成了“几乎全部归零”！

OpenAI 挑战了一项被视为不可能的任务：通过将Transformer的权重在训练过程中压缩至接近绝对零值，强制模型仅依赖极少数连接执行全部计算。这一极端条件下，模型内部负责逻辑推理的"计算电路"

智泊AI
48
点赞

从 0 到 1，微调一个自己专属的大模型

使用LLaMA Factory框架加载此数据集对大模型进行微调，并借助SwanLab等工具实时监控训练过程，从而训练出一个能理解特定领域知识的垂直领域大模型。

开源大模型全维度详解+实操部署（Mistral-、Gemma（Google）、Llama、Qwen），小白必看

本文聚焦这5个「小白友好型」标杆模型，从通俗案例→核心原理（含深度公式）→零门槛服务器实操→5维性能对比全方位拆解，附带自动下载数据集的Python项目（无需翻墙、无GUI也能跑），让你半小时吃透

AI大模型
57
点赞

Prompt 提示词技巧

LLM 原理是根据前面的 token 预测后面的 token，Prompt 是最早输入的 token。 LLM 有一些配置也能影响模型输出。参数温度 Temperature 温度是 softmax

小兵张健
248
1

不再害怕数学，给开发者的 AI 向量 (Vector) 入门课，看完秒懂！

在学习 AI (尤其是大模型和 RAG) 的过程中, 我发现向量 (Vector) 是理解这一切的基础为了帮助大家跨越数学门槛, 我整理了这份指南

印刻君
662
7

不再害怕数学，给开发者的 AI 向量 (Vector) 入门课，看完秒懂！

最好用的开源AI智能体（Agent）开发框架对比：LangChain-AutoGen-LlamaIndex等

下面我以一名 AI 大模型开发专家的视角，列出目前市面上比较受欢迎且成熟的开源框架，说明它们的定位、核心优势、局限，并给出选型建议与对比表，帮助你快速判断哪个最适合你的项目。

AI大模型
31
点赞

开源大模型不求人！一文带你全面入门《开源大模型食用指南》

这是一套面向中国开发者、初学者友好、Linux平台优先适配的实用教程体系。它深入浅出地拆解了从环境配置、模型部署，到全参数微调与LoRA调教的完整过程，为大模型技术的大众普及铺设了一条康庄大道。

大模型教程
51
点赞

刚入门AI大模型？这6个GitHub开源教程，连微软都忍不住推荐

今天我就从专业角度出发，给大家精挑细选了 6 个在 GitHub 上“狂飙”的 AI 教程项目，不仅实用、完整、还都是免费开源的！

AI大模型
37
点赞

RAG + Agent + Prompt工程上

RAG + Agent + Prompt工程上首先介绍一下rag是什么吧相信你们在日常使用ai中，都会遇到ai胡说八道的情况，特别是当提问一些比较专业的问题时，而rag的作用就是解决这个问题，本质

SCALE | 2025 年 11 月《大模型 SQL 能力排行榜》发布

发版核心内容为 Gemini 3 Pro 和 DeepSeek-V3.2-Exp 两大顶尖模型的首次《深度测评报告》，旨在为用户提供最前沿、最可靠的技术选型依据。

SCALE | 2025 年 11 月《大模型 SQL 能力排行榜》发布

Agno开发教程系列（六）：工具系统详解教程

📚 目录引言：工具系统在 AI Agent 中的核心价值第一部分：搜索类工具详解第二部分：SQL 工具详解第三部分：文件工具与 Python 执行第四部分：MCP 工具详解第五部分：最佳实

思想的光芒
36
点赞

Agno开发教程系列（六）：工具系统详解教程

RAG + Agent + Prompt工程中

RAG + Agent + Prompt 工程中：搭建本地向量数据库Qdrant、文档处理与多语言支持国际化前言：为什么向量数据库如此重要？在 RAG（检索增强生成）系统中，向量数据库是连接“用

何恺明新作：扩散模型+Transformer才是王炸！

何恺明团队再次推出创新成果，延续其"回归本质"的研究理念，提出"Just image Transformers"（JiT）框架。该技术突破性地使扩散模型能够直接生成清晰图像，而非传统噪声或含噪量预测

智泊AI
96
点赞

不愧是GitHub排名第一的大模型课！我还翻译成了中文版

它提供了一套完整的学习路线图和可以直接上手的 Colab 笔记，目标就是带你从入门到精通，无论你有没有基础或是想深入研究模型、开发应用，都能找到清晰的路径。

AI领域名家名作，大模型学习书籍推荐-关于大模型的教科书（附pdf）

AI领域名家名作，目前大模型的教科书已经至少有三本了，且均已提供公开的PDF版本。对于高年级本科生、低年级研究生以及从事人工智能领域的技术人员和爱好者来说，本书都是一本不可多得的参考资料。

AI大模型
49
点赞