首页
沸点
课程
数据标注
HOT
AI Coding
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
用户6854537597769
掘友等级
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
9.1K
文章 9.1K
沸点 0
赞
9.1K
返回
|
搜索文章
用户6854537597769
1月前
关注
RAG 这件事,其实就是让模型先翻书再答题
先把范围说清楚 适用范围:本文聚焦文本型知识库问答、企业知识助手、文档问答这类最常见的 RAG 场景 读者前置知识:知道“大模型能聊天”就够了,不要求你先懂向量数据库 本文...
0
评论
分享
用户6854537597769
赞了这篇文章
段小二
1月前
关注
为什么 Claude 不用 RAG?——理解 RAG 的真实边界,再用 Spring AI 落地三种架构(Java 架构师的 AI 工程笔记 06)
Spring AI Alibaba 实战(五):RAG 三种架构 理论篇 一、为什么需要 RAG——让 LLM 做"开卷考试" 1.1 RAG 解决什么问题 前几章我们的机...
1
评论
分享
用户6854537597769
赞了这篇文章
小墨同学boy
java开发
·
1年前
关注
炸场!月之暗面 Kimi-Audio 开源,音频界的“六边形战士”登场!
各位AI圈的吃瓜群众们,准备好迎接新一轮的炸场了吗? 就在大家还没从各种大模型的文本和图像能力中缓过劲来时,月之暗面(Moonshot AI) 又悄悄丢下了一颗重磅炸弹——...
11
2
分享
用户6854537597769
赞了这篇文章
逛逛GitHub
6月前
关注
发现 4 个贼好玩的 GitHub 项目,相当给劲儿。
一饭封神 在 GitHub 上有一个名为「一饭封神」的开源项目。 这是一个用 AI 帮你解决「吃什么」和「怎么吃」的智能菜谱生成平台。 无论你是想尝试中华八大菜系,还是对国...
28
3
分享
用户6854537597769
赞了这篇文章
小杨技术笔记
1月前
关注
Harness Engineering:重塑Al Agent时代的软件工程
Harness Engineering:重塑Al Agent时代的软件工程 关于本文档 本文系统梳理 Harness Engineering 从概念诞生到工程实践的完整知识...
12
评论
分享
用户6854537597769
赞了这篇文章
程序员海军
前端工程师 @公众号: 前端自学社区
·
1月前
关注
深度测评:在微信里直接操控 OpenClaw
用过 OpenClaw 的朋友都知道,它的 Skills 生态非常强大——处理文档、分析数据、写代码、自动化任务,一把抓。但有个问题:**它必须在电脑桌面前才能用。...
2
1
分享
用户6854537597769
赞了这篇文章
新智元
1年前
关注
70% 大小,100% 准确!完美压缩 LLM 性能 0 损失,推理速度最高飙升 39 倍
人人都想有一个自己的 DeepSeek,但并不是人人都有「一打」96GB 显存的 H20。虽然量化可以极大地降低模型对于显存的需求,但它本质上是一种有损压缩技术。...
1
评论
分享
用户6854537597769
赞了这篇文章
程序员码歌
10+年大厂程序员 @KG
·
2月前
关注
火爆全网的Skills,看这一篇就够了!
大家好,我是势必要把Skills咬烂嚼碎的码哥! Skills 最近火得一塌糊涂,热度不亚于去年的MCP ,经过几周零碎时间的研究摸索,写下了这篇可能是全网最详细的Skil...
100
10
分享
用户6854537597769
赞了这篇文章
悟鸣
高级软件工程师 @国内头部大厂
·
3月前
关注
2026 效率分水岭:只会用 AI 提问已经不够了,掌握 Skills 才是硬通货
最近 Agent Skills 非常火爆,2026 年1月1 日到现在,不完全统计 Github 上每天新增(某 Skills 市场收录)的 Skills 1W+,最高一天...
61
17
分享
用户6854537597769
1月前
关注
性能换稳定性:金融系统为什么宁可慢一点,也要把每笔数据写对
你点了一次支付按钮,页面转了两秒还没反应,手一抖又点了一次。对内容平台来说,多记一条曝光日志,通常只是统计不那么准;对支付系统来说,多扣一次钱,就是事故。 所以在金融、交易...
0
评论
分享
用户6854537597769
1月前
关注
故障频发时,为什么要先砍功能保主链路?讲透可用性换稳定性
系统一出问题,很多新手的第一反应是:想办法把所有功能都保住。听上去很负责,结果往往更糟。真正高风险的时候,更稳的做法常常是反过来:先让一部分非核心功能“别添乱”,把登录、下...
0
评论
分享
用户6854537597769
1月前
关注
高吞吐安全场景怎么提速又不失控:批量验签、会话复用和关键路径强校验
很多初学者一听“安全优化”,脑子里会立刻冒出一句话:是不是要把安全做薄一点,系统才会更快? 不是。这里讲的“安全开销换性能”,不是把门拆了,而是把门禁装得更聪明。能复用的验...
0
评论
分享
用户6854537597769
1月前
关注
预算吃紧时,怎么用“性能换成本”省钱:自动伸缩、冷热分层与按 SLO 配资源
很多人一提优化,第一反应是“更快”。可在真实业务里,老板常先问的不是“还能快 20% 吗”,而是“这月云账单怎么又涨了”。这时候,优化目标就变了:不是把系统一直维持在满血状...
0
评论
分享
用户6854537597769
1月前
关注
性能不够先改代码还是先加钱?初学者看懂成本换性能
系统一慢,很多新手第一反应是:是不是代码写得不行,必须立刻重构? 不一定。工程现场里有一种很常见、也很现实的优化思路,叫成本换性能。先讲人话:就是先多花一点钱,换来更快的响...
0
评论
分享
用户6854537597769
1月前
关注
系统快扛不住时,先关哪些功能保性能?讲透“功能完整性换性能”
流量一冲上来,接口开始发抖,很多新手会本能地想:加机器、改 SQL、上缓存。方向没错,但真到了“现在就要活下来”的时刻,还有一招非常现实:先别死守所有功能都完整,把不影响主...
0
评论
分享
用户6854537597769
1月前
关注
不是监控越全越好:高QPS服务为何把全量 Trace 改成采样
很多初学者一接触线上排障,会自然得出一个结论:既然要查问题,那就把每个请求都记下来,最保险。这个想法不奇怪,甚至在低流量系统里常常可行。 但到了高QPS在线服务,这套思路很...
0
评论
分享
用户6854537597769
1月前
关注
程序总跨核迁移怎么办?新手看懂 CPU 亲和、NUMA 绑定和线程绑核
如果你的程序 CPU 看起来没打满,延迟却一会儿高一会儿低,排查时又发现上下文切换很多、缓存失效率也不太好看,那问题不一定出在算法本身,也可能出在线程总在不同核心之间“搬家...
0
评论
分享
用户6854537597769
1月前
关注
带宽贵、延迟高时怎么优化?看懂 HTTP/2 头压缩、缓存命中和 QUIC 的取舍
同样一个页面,为什么第二次打开总比第一次快?为什么有些系统宁可让客户端、网关、服务器多算一点,也要想办法少走网络?这背后有个很实用的优化思想:CPU 换带宽。更准确地说,是...
0
评论
分享
用户6854537597769
1月前
关注
短请求为什么还会慢?讲透 keepalive、连接池和长连接复用
你可能见过这种情况:接口逻辑只做了一件小事,查一条数据、拼一段 JSON,业务代码跑完只要几毫秒,可整条请求还是慢。问题往往不在业务本身,而在每次请求都重新建连接、重新握手...
0
评论
分享
用户6854537597769
1月前
关注
重复读取多时,怎么用缓存、ETag 和 HTTP 缓存控制换效率
你可能见过这种接口:商品分类、地区列表、帮助中心目录、站点公共配置。它们改动不算频繁,但页面一打开请求一次,切回来又请求一次,换个标签页再请求一次。服务器像被叫去搬同一箱东...
0
评论
分享
下一页
个人成就
文章被点赞
105
文章被阅读
68,405
掘力值
1,840
关注了
1,528
关注者
76
收藏集
109
关注标签
7
加入于
2021-02-23