首页
AI Coding
AIDP
NEW
沸点
课程
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
木昆子
掘友等级
一个对技术、产品和业务都有所感悟的老炮儿
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
32
文章 31
沸点 1
赞
32
返回
|
搜索文章
赞
文章( 31 )
沸点( 1 )
Streamable HTTP流式传输在LLM+MCP场景中的应用
本文深入分析Streamable HTTP协议的技术特性,说明其在大模型LLM+MCP调用场景中的应用实践,并分析该场景中选择Streamable HTTP作为基础通讯协议的优势。
大模型流式输出:七大底层传输技术对比探究
本文以大模型流式输出为起点,深入对比几种流式传输机制,从轮询机制、WebSocket长连接、SSE再到Streamable HTTP等,从延迟、带宽效率、实现复杂度、浏览器兼容性等维度进行对比分析。
智能NL2SQL实践:Vanna踩坑探索和改进思考
本文基于开源框架Vanna,模拟电商业务表结构,验证NL2SQL实际效果,针对生成SQL错误的情况,深入分析其源码,挖掘其在表结构知识存储与检索机制上的缺陷,通过初步调整效果来说明可以改进的方向。
Vanna AI通过openai规范接入deepseek
1. 自定义 Vanna 对象 2. 配置模型 3. 创建vanna对象 绑定模型 4.连接数据库 5.训练ddl, 训练question ,sql 6.启动flask web
落地视角:大模型分类体系与应用场景选择
本文从落地使用角度,按用途对大模型做个梳理和分类,方便大家对号入座,对照自己的业务场景,能明确落地时应该选择哪类模型。
大模型落地基础技术体系LLM<RAG<AI Agent<Training
笔者结合实际项目落地经验,从信息化视角梳理AI基础技术体系,对应投入成本和落地难度从小到大分别是LLM对话<RAG<AI Agent<Training。
字节终于开源“扣子”同款引擎了!FlowGram:AI 时代的可视化工作流利器
大家好,我是你们的AI圈老伙计!最近技术圈最令人兴奋的消息之一,莫过于字节跳动正式对外开源了 FlowGram 工作流编排引擎。如果你对字节跳动旗下的 AI Bot 开发平台“扣子”(Coze)有所了
[一文解决大模型微调+部署+RAG] LLamaFactory微调模型后使用Ollama + RAGFlow在Windows本地部署
LLM从数据集选择、数据集加载、llamaFactory微调、RAGFlow的docker部署全流程解决你的问题,
提示词工程、RAG之后,LangChain:上下文工程开始火了!
AI 时代,你可能听说过提示词工程、RAG、记忆等术语。但是很少有人提及上下文工程(context engineering)。 其实,这一术语并不新鲜,近两年很多智能体构建者一直在关注这个事情。至于重
从零教你微调一个专属领域大模型,看完小白也能学会炼丹!
这份教程全文共 3W+ 字,用一个微调 Web 安全领域专家模型的例子进行串联,讲解了关于模型微调的基础理论、LLaMA Factory 微调工具的使用、微调过程中各种参数的配置经验、微调过程效果观察
下一页
个人成就
文章被点赞
26
文章被阅读
6,051
掘力值
359
关注了
28
关注者
7
收藏集
0
关注标签
13
加入于
2025-03-16