首页
沸点
课程
数据标注
HOT
AI Coding
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
确定删除此收藏集吗
删除后此收藏集将被移除
取消
确定删除
确定删除此文章吗
删除后此文章将被从当前收藏集中移除
取消
确定删除
编辑收藏集
名称:
描述:
0
/100
公开
当其他人关注此收藏集后不可再更改为隐私
隐私
仅自己可见此收藏集
取消
确定
大模型
订阅
wen酱110586
更多收藏集
微信扫码分享
微信
新浪微博
QQ
545篇文章 · 0订阅
大模型工具调用输出JSON:凭什么能保证不出错?
大模型工具调用(Tool Calling)的核心依赖是结构化JSON输出,但大模型本质是概率性文本生
人人都能懂的大模型 · 第9期:预训练:AI 的九年义务教育
1. 引子:数据清洗是开学第一课 想象一下,你打算招聘一个员工。如果这个候选人连话都不会说、字都不认识,你会直接教他怎么写代码或者写公关稿吗?当然不会。他得先接受十几年的学校教育,学会认字、造句、逻辑
人人都能懂的大模型 · 第8期:Transformer:一条高效的知识流水线
1. 引子:给大脑装上一条流水线 “嘿,小明!”阿模(那个方头方脑的机器人)推了推正在发呆的小明,“还记得上期咱们聊的‘注意力’吗?就是给句子里的词画重点。” 小明点点头:“记得啊,就像用荧光笔在满篇
详解大模型与 Agent 面试高频题:不背答案,建立工程化表达框架
详解大模型与 Agent 面试高频题:不背答案,建立工程化表达框架 很多人准备 AI 面试时,刷了大量题目,却很难把知识讲成一套完整、有层次的工程表达。这篇文章基于 AgentInterview 项目
GEO 实战落地:评估指标、监测脚本与技术健康度全解析
GEO 实战落地:评估指标、监测脚本与技术健康度全解析 很多团队做 GEO 时,最痛的不是不会做,而是不知道是否做对了。本文结合 GEO-Resources 的方法论,拆解一套可执行的 GEO 评估体
AI大模型限速怎么办?智能Fallback方案实战
头部AI大模型厂商 Claude 的 Thinking 模式遇到限速怎么办?TheRouter的智能Fallback方案 DeepSeek-R1 的 Extended Thinking 模式出来之后,
美团在 GitHub 上悄悄开源 AI 大模型?8 个大脑并行
2026 年,可能是会自己深思熟虑的智能体模型正式登场的一年。 美团 LongCat 团队刚刚开源的 LongCat-Flash-Thinking-2601,就是这一波浪潮中的标志性模型。
Prompt Engineering第一个实战应用:为PM写一个SQL语句小助手
Prompt 大模型的“启动密码”。语言模型(LLM)的一段文本输入,用于引导和约束模型的输出。LLM本质上是一个基于海量数据训练的概率模型。Prompt的作用是激活和引导模型内部的相关知识分布
基于BERT的情感分析模型的微调训练0x00-数据集
前置条件 上一篇 入坑大模型微调第一个Hugging Face程序 主要介绍了 Hugging Face及其使用方式。是我们后续做大模型微调训练的基础。不了解的可以再回顾一下。
大模型原理探究0x04:全链路回顾Transformer整个流程
回顾 前面已经用了4篇文章讲了大模型原理,这一篇整体全链路回顾一下。github也供了了一个Transformer可视化的Web页面。在整体理解了Transformer原理后可以打开这个网站看看流程。