首页
沸点
课程
数据标注
HOT
AI Coding
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
歌南
掘友等级
普普通通,想变得不普通
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
21
文章 21
沸点 0
赞
21
返回
|
搜索文章
赞
文章( 21 )
沸点( 0 )
你的 nginx 在扼杀 AI 服务——为什么需要重新设计流量层
四个数字,定义了这篇文章要讨论的问题: 这四个数字的张力,就是 AI 基础设施最核心的工程问题:用户要求即时响应,模型需要漫长思考,算力必须精确调度,而传统流量层对这一切一无所知。 目录 一个请求的生
为什么不建议基于Multi-Agent来构建Agent工程?
背景 在LLM涌现的早期已经有大量的研发人员开始思考、讨论和推广Multi-Agent的概念。它的基本实现逻辑就是:利用LLLM的归纳推理能力,通过为不同的Agent分配角色与任务,并配合相应的工具(
谈谈上下文工程(Context Engineering)
大模型发展这两年,应用型 AI 的焦点一直在 “提示工程”(prompt engineering),但随着更强大的大语言模型(LLM)走向多轮、长时间的自主行动,一个更关键的概念开始走到台前:上下文工
5小时整理60页《Google Agent指南》,不懂Agent的包教包会
Google最近发布了一篇关于Agent长达60页的文件: 《初创公司技术指南:AI Agents》 ,这份报告从宣传来说表达了自己与之前偏理论的文章不一样,他还是暴露了不少细节技巧,对正在做Agen
有了免费的Kiro,这次真的可以把Cursor扔了!
Claude的金主爸爸亚马逊(AWS)偷偷发布了一款AI编程工具,Kiro。 我用它做了三个公司的生产级项目需求,深度体验3天后发现: Kiro现在完全免费,可以免费使用Claude-Sonnet-4
《HelloGitHub》第 115 期
简介 HelloGitHub 分享 GitHub 上有趣、入门级的开源项目。 这里有实战项目、入门教程、黑科技、开源书籍、大厂开源项目等,涵盖多种编程语言 Python、Java、Go、C/C++、S
一次数据库权限小改动,如何拖垮半个互联网?——Cloudflare 2025-11-18 大故障复盘
2025 年 11 月 18 日,Cloudflare 发生了 2019 年以来最严重的一次全球网络故障。大批依赖 Cloudflare 的网站和服务(包括 ChatGPT、X、游戏、各类 SaaS)
大模型知识蒸馏入门简介
模型蒸馏是一种模型压缩技术,就像把一个大厨的精湛厨艺教给一个学徒,让学徒也能做出差不多的美味佳肴,但学徒需要的食材和工具都更少,速度也更快。 具体来说,就是用一个已经训练好的大模型(称为“教师模型”)
2024年总结:凡事全力以赴,而后顺其自然
现在仔细回想24年过往,忙忙碌碌,却想不出可以总结的话语,如果非要一个概括,我想那就是:"凡事全力以赴,而后顺其自然"
泛型擦除到底发生在哪个阶段?
最近在查阅泛型擦除文档时,发现有些文章中介绍泛型擦除发生在类加载的连接验证阶段,对此持怀疑态度并进行了本地验证,最终验证结果是:泛型擦除是发生在
下一页
关注了
11
关注者
0
收藏集
2
关注标签
4
加入于
2020-11-28