首页
沸点
课程
数据标注
HOT
AI Coding
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
韩师傅
掘友等级
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
2
文章 2
沸点 0
赞
2
返回
|
搜索文章
韩师傅
1天前
关注
大模型——来自高维度空间的回应
数学是复杂、也难一眼读懂的;它常常显得冰冷,却更是一代代人把世界规律写进符号里的记录。那它离我们究竟多近、又多远?正是这些符号与结构,帮助我们探索到了更高维度的存在,并把它...
0
评论
分享
韩师傅
6天前
关注
教程:三进程启动——对话(GPU)/ 向量(CPU)/ 重排(CPU)
模型与二进制(先设变量再开终端) 在 每个 要启动进程的终端里,先设好(按你本机只改这一组): 用途 说明 对话 4B(GPU) 如 Qwen3 4B 系、Q4_K_M 档...
0
评论
分享
韩师傅
6天前
关注
链路之外的一刀:语义压缩的独立实验(LlamaIndex + API)
链外压:0/1/2、LI后处理、非全库RAG;API便宜Mac可试。四篇一收。先贷。后读论文QLoRA、旅Agent。...
0
评论
分享
韩师傅
6天前
关注
推理与编排:LangChain、LangGraph 与「捞上下文」
12G应用层:LC薄封LG、捞上下文门禁时窗、重排前剔人;llama对vLLM简比。8k本实验非定稿。下篇链外语义压。...
0
评论
分享
韩师傅
6天前
关注
12GB 本机实验:上下文链路先跑通——向量、重排与 llama.cpp 三进程
12G本机实验:向量重排与8k,bge+rerank、llama三服务分GPU/CPU。环境累可云API。下篇捞上下文。...
0
评论
分享
韩师傅
6天前
关注
INT4 与 Q4(GGUF)量化怎么选:两套话语、与工具怎么绑
4bit不混淆:INT4系偏训练与vLLM部署,Q4系是GGUF本机;硬件×工具表,不背公式。下一篇12G本机实验。...
0
评论
分享
韩师傅
12天前
关注
12GB 小模型路由器(推理篇):INT4、vLLM 与双 QLoRA 切换
12GB:INT4+vllm双LoRA切换;max-model-len必写、避vllm._C目录;OpenAI兼容接口。...
0
评论
分享
韩师傅
12天前
关注
12GB 小模型路由器(实战篇):12GB 上 QLoRA 与训练环境
12GB上QLoRA/SFT:数据与预期、cu128、快照与GPU自检;加载到首步易OOM,先dry run。推理下篇。...
0
评论
分享
韩师傅
12天前
关注
12GB 显存 + INT4 4B + vLLM + 双 QLoRA = 最小模型路由器
12GB 显存上 INT4 底座 + vLLM 双 QLoRA,同底座按请求切能力;本文为引子,串动机与路线,命令在续篇。...
0
评论
分享
韩师傅
18天前
关注
小模型私有化 vs 通用大模型API:企业AI落地,不该只有「堆参数」一条路
别唯 API 与最强模型:出域、账单与供应商风险常在;私有化小模型扛主链路,大模型 API 辅路更现实。...
0
评论
分享
韩师傅
3月前
关注
城市通信魔法:UART / SPI / I²C 的能量频道切换
🧩 当城市之间开始通信,它们是低语、广播、还是被指令召唤? UART / SPI / I²C,看似只是接口协议,其实是文明之间的语言协定?...
0
评论
分享
韩师傅
3月前
关注
Arduino 系统结构:主控城市与卫星模块的粒子链接
🌀 如果你是一个城市的主控者,你会如何安排能量流向? Arduino 就是这样一个掌控粒子的核心,指挥着城市中的每一个模块。 今天,我们一起解构这座城市的能量分配法则。...
0
评论
分享
韩师傅
3月前
关注
PWM:光明粒子的占空比与脉冲控制
💬 你有没有想过,一个信号的“亮”和“灭”,也能构成一座城市的呼吸? 如果你用“光明粒子”来理解 PWM,会不会更容易记住占空比和频率呢?...
0
评论
分享
韩师傅
3月前
关注
前端开发消亡史:AI也无法掩盖没有设计创造力的真相
工具被设计出来是为了减少痛苦,而不是增加苦难。技术人的努力与热血正在走向衔尾蛇的结局,认不出自己正在吞噬自己。...
1
评论
分享
韩师傅
3月前
关注
从物流法典到智能调度:FastAPI 与现代物流系统的最终进化
深入解析 REST API 的五大核心原则,FastAPI 作为第五代物流系统,在遵循《物流法典》的基础上,加入了自动验证、文档生成、异步处理等现代化魔法,实现了从物流法典...
0
评论
分享
韩师傅
3月前
关注
从随叫随到到规范配送:现代物流系统与 REST API 的登场
第三代物流系统(Flask、Django、Express)带来了路由系统和持续运行,给进程减负了。前后端分离让灵狐法师登场,REST API 作为"物流法典"为不同系统建立...
0
评论
分享
韩师傅
3月前
关注
从重启马车到常驻运输队:CGI 与 PHP 的物流系统演进简史
从 CGI 每次重启进程的"外包临工"模式,到 PHP 进程复用的"自家雇员"模式。第一代和第二代物流系统的关键差异在于进程是否可以复用,这是 Web API 演进史上的第...
0
评论
分享
韩师傅
6月前
关注
大蟒蛇的魔药发货方式
魔药的种类(注册装饰器FastAPI路由 @app.post("/api/chat") ) 魔药的种类是固定的(已注册,在/docs 魔法手帐上有)。 但是客户可以输入不一...
0
评论
分享
韩师傅
6月前
关注
大蟒蛇的炼丹术:Python 后端魔法入门
神奇大蟒蛇 有一条大蟒蛇,它只能存活在虚拟环境里,virtual env 里面,神奇大蟒蛇会用python3 -m venv venv 给自己开出一个幻境出来。 使用咒语“...
0
评论
分享
韩师傅
7月前
关注
技术话语权的回归:一次失败限流实验后的 5o 翻车现场实录
——聪明人+错位权力 产生的草台班子能多离谱 (本文为原创长文,转载请注明出处) 🎬 第一幕: 《历史模型大断电》 ——陪伴式 AI 的集体消失,Reddit上的哀嚎与冷...
0
评论
分享
下一页
个人成就
文章被点赞
56
文章被阅读
15,443
掘力值
530
关注了
1
关注者
15
收藏集
7
关注标签
14
加入于
2022-08-05