唐山环境科学院AI之路系列

唐山环境科学院AI之路系列

唐山环境科学院AI之路系列

AI

等 11 人订阅共20篇文章创建于2025-02-19

LLM这个谎话精！给你的究竟是解释，还是推理？——CoT的局限与陷阱

引言想象一下，你在调试一个大语言模型LLM，输入一句指令，却发现模型的回答似乎在“掩饰”什么。比如，你问：“达拉斯所在州的首府是哪座城市？”模型回答：“达拉斯在得克萨斯州，首府是奥斯汀。

9月前
195
1
评论

LLM这个谎话精！给你的究竟是解释，还是推理？——CoT的局限与陷阱

带你从本质上理解RAG的哲学，思考为什么有了RAG依然需要SFT

为何有了RAG还需要微调 RAG技术实现了基于外部知识库的问答，还需要对大语言模型进行微调吗？首先要理解RAG固有局限性，本质就是把自然语言变为向量，那就得知道变成向量的两种方式：稀疏表示 or 稠

9月前
252
3
评论

带你从本质上理解RAG的哲学，思考为什么有了RAG依然需要SFT

【AI】A2A vs MCP：智能体协作的“分层协议栈”如何重构AI基础设施？

序言大家好！今天我们来深入聊聊谷歌最近在Cloud Next大会上发布的那个热门话题——A2A协议。你可能听说了，它是关于“智能体之间无缝协作”的，但心里或许会犯嘀咕：“这听起来和我用过的LangC

10月前
804
9
评论

【AI】A2A vs MCP：智能体协作的“分层协议栈”如何重构AI基础设施？

【AI的基建】 8卡 GPU 服务器与 NVLink/NVSwitch 互联技术

🟡🔘🔴 🟡 PCIe的意义 PCIe是GPU与CPU通信的必备通道，负责系统管理、任务调度和数据传输基础功能；而NVLink是专为GPU间高速通信设计的专用通道，能大幅提升大模型训练效率，但技术上可以

10月前
1.4k
1
评论

【通往AGI之路】大模型部署框架Ollma的深度解析（及Langserver发布Agent服务）

🟡 Ollma出现之前对于大多数开发者和企业而言，将这些强大的LLM集成到实际应用中，并非易事。横亘在理论与实践之间的，是一道复杂的“部署鸿沟”。因为传统的LLM部署，通常需要深入理解深度学习框架（

11月前
745
1
评论

【通往AGI之路】大模型部署框架Ollma的深度解析（及Langserver发布Agent服务）

【AI】MercuryCoder与LLaDA? 自回归模型与扩散模型的碰撞，谁才是未来的LLM答案？

🟡扩散模型 vs 自回归模型 🔘生成逻辑：从"线性雕刻"到"全局雕塑" 自回归模型：像陶艺师傅用拉坯机逐层盘绕泥土制作花瓶——必须从底部开始，每层高度依赖前一层的结果。例如生成句子"春天来了，花儿开了

11月前
319
1
评论

【AI】MercuryCoder与LLaDA? 自回归模型与扩散模型的碰撞，谁才是未来的LLM答案？

【Langchian】一个基础案例手把手带你上线自己的Langchian专属智能体

🟡 一：任务分解与LangChain思想理解用户需求，分解任务。灌输LangChain的核心思想，明确为何用它。搭建框架基础，准备工具集。 🔘 步骤1：理解与分解用户需求你的任务是：“把202

11月前
288
1
评论

【Langchian】一个基础案例手把手带你上线自己的Langchian专属智能体

【📛MCP】从GUI到API，AI驱动软件自动化的演进之路之“MCP协议”

🟡 GUI迈向API（MCP协议诞生前） GUI：直观界面，面向人类，封装好每次交互背后的路径。 API：抽象代码，面向机器，提供API接口，供程序调用。对于非计算机专业的朋友，你平时使用的软件（如

11月前
938
4
1

【📛MCP】从GUI到API，AI驱动软件自动化的演进之路之“MCP协议”

【🟡Langchian】Prompt与chian的设计

🟡 Prompt的设计 🔘 Prompt面向谁？假设你正在开发一个智能客服系统，用户输入了一个问题：“帮我查询2023年销售额最高的产品是什么？” 这是一个看似简单的问题，但要回答它，系统需要完成多

11月前
226
1
评论

【🟡Langchian】Prompt与chian的设计

【🟡Langchian】Agent的策略是什么

🟡Agent Agent 是一个基于大语言模型（LLM）的任务执行系统，能够根据用户输入完成推理、工具调用、记忆管理等任务。具备推理、工具调用、记忆、等能力。既然是基于自然语言分析后进行某些行动(L

11月前
635
1
评论

【🟡Langchian】Agent的策略是什么

【🔴Langchian】——爆肝半个月的Langchian框架开发全景手册

🟡 Langchian生态全景 🔘各版块生态位 LangChain是构建基于大型语言模型应用的框架，它提供了工具、组件和库，支持从chain、到agent、引入RAG。具体到AI程序构建的的两种模式：

11月前
1.8k
9
评论

【🔴Langchian】——爆肝半个月的Langchian框架开发全景手册

【AI】大语言模型处理长文本：附件上传为何能突破Token限制？

一、传统Token限制的本质困境直接粘贴就是全量处理输入的每一个token，确保信息完整，但受限于上下文窗口（通常4k-32k tokens），无法扩展到更大规模。当您将一段3000个tokens

11月前
1.8k
1
评论

【AI】大语言模型处理长文本：附件上传为何能突破Token限制？

【Langchian】Runnable是什么？以及Langchian记忆管理的不同方式。

Runnable 是啥？ Runnable 是 LangChain 的基类（langchain_core.runnables.Runnable），规定所有“可执行”对象的标准。让 LangChain

11月前
310
1
评论

【Langchian】Runnable是什么？以及Langchian记忆管理的不同方式。

【Langchian】Langchian的核心概念串联

🟡 LangChain 高频用法 🔘语言模型调用（LLM）：让 AI 开口说话假设你要做一个问答助手，用户问“你好”，AI 得回答“こんにちは”。这需要调用外部 LLM，比如 OpenAI 的 GP

11月前
272
2
评论

【Langchian】Langchian的核心概念串联

大模型框架的主流云端低代码、本地低代码，全代码平台对比

在低代码 AI 平台中，Dify 和 Coze 是两个备受关注的工具。它们都旨在降低 AI 应用开发的技术门槛，但在设计理念、核心功能和适用场景上存在显著差异。以下将详细解析 Dify 的核心概念、使

11月前
929
1
评论

大模型框架的主流云端低代码、本地低代码，全代码平台对比

【AI】你必须得了解的向量数据库

🟡 SQL 是什么？ SQL 的设计初衷是为了处理结构化数据，它的全称就是SQL（Structured Query Language，结构化查询语言）是专门用于操作关系型数据库的语言。非关系型数据库（

11月前
155
1
评论

【AI】你必须得了解的向量数据库

【AI】 Text-to-SQL：后端男孩儿的数据驱动新纪元？

1. “Text-to-SQL是本地化部署大模型接入私域知识库的核心” 未经微调的通用大模型（如LLaMA）只具备通用知识，无法回答“唐山某企业2023年碳排放是多少”这种具体问题，企业的数据存储在结

11月前
503
3
评论

【AI】 Text-to-SQL：后端男孩儿的数据驱动新纪元？

【AI】别想了，企业AGent落不了地，老老实实做RAG就行

一个强大的大型语言模型（LLM）的能力，不仅体现在它能否精准理解用户意图并解析任务，更在于它是否具备对自身能力边界的清晰认知。这种自我认知使模型能够在面对复杂或超出自身能力范围的任务时，识别出需要外部

1年前
354
3
1

【AI】别想了，企业AGent落不了地，老老实实做RAG就行

【AI】DeepSeekV3R1拆解系列（持续更新）

标准 Transformer 层输入：一系列标记嵌入 (token embeddings)，每个标记代表输入序列中的一个单词或子词。多头注意力 (Multi-Head Attention, MH

12月前
233
1
评论

【AI】DeepSeekV3R1拆解系列（持续更新）

【AI】大语言模型的“调音旋钮”：解读“温度”在生成与蒸馏中的双重身份

🟡生成时的温度在物理学中，“温度”是衡量系统混乱程度的一个指标，而“熵”则描述了系统的无序性或随机性。当温度升高时，分子运动加剧，系统的熵也随之增加，表现出更高的混乱度；而当温度降低时，分子运动减缓

11月前
220
1
评论

【AI】大语言模型的“调音旋钮”：解读“温度”在生成与蒸馏中的双重身份