首页
首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
唐山环境科学院AI之路系列
moonless
创建于2025-02-19
订阅专栏
AI
等 9 人订阅
共21篇文章
创建于2025-02-19
订阅专栏
默认顺序
默认顺序
最早发布
最新发布
LLM这个谎话精!给你的究竟是解释,还是推理?——CoT的局限与陷阱
引言 想象一下,你在调试一个大语言模型LLM,输入一句指令,却发现模型的回答似乎在“掩饰”什么。比如,你问:“达拉斯所在州的首府是哪座城市?”模型回答:“达拉斯在得克萨斯州,首府是奥斯汀。
带你从本质上理解RAG的哲学,思考为什么有了RAG依然需要SFT
为何有了RAG还需要微调 RAG技术实现了基于外部知识库的问答,还需要对大语言模型进行微调吗? 首先要理解RAG固有局限性,本质就是把自然语言变为向量,那就得知道变成向量的两种方式:稀疏表示 or 稠
【AI】A2A vs MCP:智能体协作的“分层协议栈”如何重构AI基础设施?
序言 大家好!今天我们来深入聊聊谷歌最近在Cloud Next大会上发布的那个热门话题——A2A协议。你可能听说了,它是关于“智能体之间无缝协作”的,但心里或许会犯嘀咕:“这听起来和我用过的LangC
【AI的基建】 8卡 GPU 服务器与 NVLink/NVSwitch 互联技术
🟡🔘🔴 🟡 PCIe的意义 PCIe是GPU与CPU通信的必备通道,负责系统管理、任务调度和数据传输基础功能;而NVLink是专为GPU间高速通信设计的专用通道,能大幅提升大模型训练效率,但技术上可以
【通往AGI之路】 大模型部署框架Ollma的深度解析(及Langserver发布Agent服务)
🟡 Ollma出现之前 对于大多数开发者和企业而言,将这些强大的LLM集成到实际应用中,并非易事。横亘在理论与实践之间的,是一道复杂的“部署鸿沟”。因为传统的LLM部署,通常需要深入理解深度学习框架(
【AI】MercuryCoder与LLaDA? 自回归模型与扩散模型的碰撞,谁才是未来的LLM答案?
🟡扩散模型 vs 自回归模型 🔘生成逻辑:从"线性雕刻"到"全局雕塑" 自回归模型:像陶艺师傅用拉坯机逐层盘绕泥土制作花瓶——必须从底部开始,每层高度依赖前一层的结果。例如生成句子"春天来了,花儿开了
【Langchian】 一个基础案例手把手带你上线自己的Langchian专属智能体
🟡 一:任务分解与LangChain思想 理解用户需求,分解任务。 灌输LangChain的核心思想,明确为何用它。 搭建框架基础,准备工具集。 🔘 步骤1:理解与分解用户需求 你的任务是:“把202
【📛MCP】从GUI到API,AI驱动软件自动化的演进之路之“MCP协议”
🟡 GUI迈向API(MCP协议诞生前) GUI:直观界面,面向人类,封装好每次交互背后的路径。 API:抽象代码,面向机器,提供API接口,供程序调用。 对于非计算机专业的朋友,你平时使用的软件(如
【🟡Langchian】Prompt与chian的设计
🟡 Prompt的设计 🔘 Prompt面向谁? 假设你正在开发一个智能客服系统,用户输入了一个问题:“帮我查询2023年销售额最高的产品是什么?” 这是一个看似简单的问题,但要回答它,系统需要完成多
【🟡Langchian】Agent的策略是什么
🟡Agent Agent 是一个基于大语言模型(LLM)的任务执行系统,能够根据用户输入完成推理、工具调用、记忆管理等任务。具备推理、工具调用、记忆、等能力。 既然是基于自然语言分析后进行某些行动(L
【🔴Langchian】——爆肝半个月的Langchian框架开发全景手册
🟡 Langchian生态全景 🔘各版块生态位 LangChain是构建基于大型语言模型应用的框架,它提供了工具、组件和库,支持从chain、到agent、引入RAG。具体到AI程序构建的的两种模式:
【AI】大模型上云,速速了解Linux与Windows的差异!
🟡权限管理 方式一: sudo 临时提升权限至管理员 方式二:su 直接切换到root用户,不用频繁临时sudo提升。 Windows需要显式启动管理员模式,右键点击“命令提示符”或“PowerShe
【AI】大语言模型处理长文本:附件上传为何能突破Token限制?
一、传统Token限制的本质困境 直接粘贴就是全量处理输入的每一个token,确保信息完整,但受限于上下文窗口(通常4k-32k tokens),无法扩展到更大规模。 当您将一段3000个tokens
【Langchian】Runnable是什么?以及Langchian记忆管理的不同方式。
Runnable 是啥? Runnable 是 LangChain 的基类(langchain_core.runnables.Runnable),规定所有“可执行”对象的标准。让 LangChain
【Langchian】Langchian的核心概念串联
🟡 LangChain 高频用法 🔘语言模型调用(LLM):让 AI 开口说话 假设你要做一个问答助手,用户问“你好”,AI 得回答“こんにちは”。这需要调用外部 LLM,比如 OpenAI 的 GP
大模型框架的主流云端低代码、本地低代码,全代码平台对比
在低代码 AI 平台中,Dify 和 Coze 是两个备受关注的工具。它们都旨在降低 AI 应用开发的技术门槛,但在设计理念、核心功能和适用场景上存在显著差异。以下将详细解析 Dify 的核心概念、使
【AI】你必须得了解的向量数据库
🟡 SQL 是什么? SQL 的设计初衷是为了处理结构化数据,它的全称就是SQL(Structured Query Language,结构化查询语言)是专门用于操作关系型数据库的语言。非关系型数据库(
【AI】 Text-to-SQL:后端男孩儿的数据驱动新纪元?
1. “Text-to-SQL是本地化部署大模型接入私域知识库的核心” 未经微调的通用大模型(如LLaMA)只具备通用知识,无法回答“唐山某企业2023年碳排放是多少”这种具体问题,企业的数据存储在结
【AI】别想了,企业AGent落不了地,老老实实做RAG就行
一个强大的大型语言模型(LLM)的能力,不仅体现在它能否精准理解用户意图并解析任务,更在于它是否具备对自身能力边界的清晰认知。这种自我认知使模型能够在面对复杂或超出自身能力范围的任务时,识别出需要外部
【AI】DeepSeekV3R1拆解系列(持续更新)
标准 Transformer 层 输入: 一系列标记嵌入 (token embeddings),每个标记代表输入序列中的一个单词或子词。 多头注意力 (Multi-Head Attention, MH
下一页