首页
沸点
课程
数据标注
HOT
AI Coding
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
mwq30123
掘友等级
Android工程师
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
46
文章 46
沸点 0
赞
46
返回
|
搜索文章
mwq30123
Android工程师
·
14天前
关注
anthropic-academy:RAG检索增强生成
检索增强生成简介 检索增强生成(RAG)是一种帮助你处理大型文档的技术,这些文档太大而无法放入单个提示中。RAG不是将所有内容塞进一个庞大的提示中,而是将文档分解成块,并在...
0
评论
分享
mwq30123
Android工程师
·
15天前
关注
anthropic-academy:工具使用(二)
批处理工具 在使用 Claude 的工具调用功能时,你可能会注意到 Claude 可以在单个助手消息中包含多个工具使用块。这使得 Claude 能够并行运行多个工具,而不是...
0
评论
分享
mwq30123
Android工程师
·
15天前
关注
anthropic-academy:工具使用(一)
工具使用介绍 没有工具的问题 当用户向 Claude 询问当前信息时,它会遇到障碍。例如,如果有人问"加利福尼亚州旧金山的天气怎么样?"Claude 只能回复类似"抱歉,我...
0
评论
分享
mwq30123
Android工程师
·
15天前
关注
Claude 完整代码教程(转载)
转载x上文章 Claude 完整代码教程 我做了 7 年软件工程师,先后在亚马逊、迪士尼和 Capital One 工作过。我发布的代码服务了数百万用户,我构建的系统不容有...
0
评论
分享
mwq30123
Android工程师
·
26天前
关注
anthropic-academy:提示词工程技巧
提示词工程 提示词工程是指对已编写的提示进行改进,以获得更可靠、更高质量的输出。这一过程涉及迭代优化——从基础词提示开始,评估其表现,然后系统性地应用工程技术来改进它。 迭...
0
评论
分享
mwq30123
Android工程师
·
28天前
关注
anthropic-academy:提示词评估系统完整指南
提示词评估系统完整指南 原文参考:https://anthropic.skilljar.com/claude-with-the-anthropic-api/287731 提...
0
评论
分享
mwq30123
Android工程师
·
1月前
关注
不再混淆:导数 (Derivative) 与微分 (Differential) 的本质对决
不再混淆:导数 (Derivative) 与微分 (Differential) 的本质对决 在微积分的入门阶段,很多同学会产生一种错觉:认为微分只是导数的另一种写法,或者觉...
0
评论
分享
mwq30123
Android工程师
·
3月前
关注
Anthropic 机械可解释性学习路线
Anthropic 机械可解释性学习路线 机械可解释性(Mechanistic Interpretability, MI)是一个门槛较高的领域,因为它不仅涉及代码,还涉及独...
0
评论
分享
mwq30123
Android工程师
·
3月前
关注
Cursor Tab 共享无限车
linux.do 大佬开发的,不知道啥时候就不能用了,且用且珍惜。 原文地址 Cursor 修改程序地址: Releases · wisdgod/cursor-rp 需要下...
0
评论
分享
mwq30123
Android工程师
·
3月前
关注
LLM 推理的“显存墙”与“通信墙”:从显存分布到部署原则
这是一篇基于我们之前的对话内容整合而成的深度技术文章。文章从你提供的关于“显存与带宽限制”的精辟论述出发,深入剖析了 Llama-3-70B 的实际数据,对比了 MHA 与...
0
评论
分享
mwq30123
Android工程师
·
3月前
关注
《前端项目技术文档生成器》Prompt(可复用模板)
下面提供你一份 专门为前端项目优化的《技术文档自动生成 Prompt 模板》 ,适用于: React / Vue / Angular / Svelte / Next.js ...
13
评论
分享
mwq30123
Android工程师
·
3月前
关注
揭秘 MoE 训练的“三驾马车”
揭秘 MoE 训练的“三驾马车”:一篇博客看懂 $L_{\text{main}}$, $L_{\text{balance}}$ 和 $L_{\text{router-z}}...
1
评论
分享
mwq30123
Android工程师
·
3月前
关注
MoE 负载均衡之争:为何 Mixtral 的“实用主义”胜过了“统计主义”?
MoE 负载均衡之争:为何 Mixtral 的“实用主义”胜过了“统计主义”? 在当今的大模型(LLM)领域,MoE(Mixture of Experts)架构已经成为实现...
0
评论
分享
mwq30123
Android工程师
·
3月前
关注
解密“混合专家模型” (MoE) 的全部魔法
解密“混合专家模型” (MoE) 的全部魔法 在当今大语言模型 (LLM) 的竞赛中,您一定听说过 GPT-4、Mixtral 8x7B 这样的“巨无霸”。它们之所以能在保...
1
评论
分享
mwq30123
Android工程师
·
3月前
关注
MiniMind 模型架构创新技术详解
MiniMind 模型架构创新技术详解 https://github.com/AlvinScrp/minimind/blob/master/model/model.py 一...
0
评论
分享
mwq30123
Android工程师
·
3月前
关注
从傅里叶时钟到混合尺度:解构 RoPE 位置编码的演进之路
从傅里叶时钟到混合尺度:解构 RoPE 位置编码的演进之路 摘要 自 Transformer 架构诞生以来,位置编码一直是其核心组件之一。旋转位置编码 (RoPE) 利用傅...
1
评论
分享
mwq30123
Android工程师
·
3月前
关注
从傅里叶变换到 RoPE:解构位置编码的数学灵魂
从傅里叶变换到 RoPE:解构位置编码的数学灵魂 旋转位置编码 (RoPE) 的天才之处,并不仅仅在于它使用了 sin 和 cos 函数。它真正的革命性在于,它将傅里叶变换...
0
评论
分享
mwq30123
Android工程师
·
3月前
关注
位置编码的技术演进线路:从绝对到相对,再到几何一致性
本文系统梳理了 Transformer 位置编码的技术演进路径: 从 正弦余弦绝对位置编码 到旋转位置编码...
0
评论
分享
mwq30123
Android工程师
·
3月前
关注
旋转位置编码RoPE:用旋转艺术,解开 Transformer 的位置之谜
位置编码RoPE:用旋转艺术,解开 Transformer 的位置之谜 在现代大型语言模型(LLM)的宏伟殿堂中,从 PaLM、Llama 到 GPT-NeoX,一个共同的...
0
1
分享
下一页
个人成就
文章被点赞
244
文章被阅读
152,775
掘力值
3,618
关注了
20
关注者
86
收藏集
2
关注标签
6
加入于
2017-10-23