mwq30123

Android工程师

赞

46

|

搜索文章

Android工程师

·

14天前

anthropic-academy：RAG检索增强生成

检索增强生成简介检索增强生成（RAG）是一种帮助你处理大型文档的技术，这些文档太大而无法放入单个提示中。RAG不是将所有内容塞进一个庞大的提示中，而是将文档分解成块，并在...

0

评论

Android工程师

·

15天前

anthropic-academy：工具使用（二）

批处理工具在使用 Claude 的工具调用功能时，你可能会注意到 Claude 可以在单个助手消息中包含多个工具使用块。这使得 Claude 能够并行运行多个工具，而不是...

0

评论

Android工程师

·

15天前

anthropic-academy：工具使用（一）

工具使用介绍没有工具的问题当用户向 Claude 询问当前信息时，它会遇到障碍。例如，如果有人问"加利福尼亚州旧金山的天气怎么样？"Claude 只能回复类似"抱歉，我...

0

评论

Android工程师

·

15天前

Claude 完整代码教程（转载）

转载x上文章 Claude 完整代码教程我做了 7 年软件工程师，先后在亚马逊、迪士尼和 Capital One 工作过。我发布的代码服务了数百万用户，我构建的系统不容有...

0

评论

Android工程师

·

27天前

anthropic-academy：提示词工程技巧

提示词工程提示词工程是指对已编写的提示进行改进，以获得更可靠、更高质量的输出。这一过程涉及迭代优化——从基础词提示开始，评估其表现，然后系统性地应用工程技术来改进它。迭...

0

评论

Android工程师

·

28天前

anthropic-academy：提示词评估系统完整指南

提示词评估系统完整指南原文参考：https://anthropic.skilljar.com/claude-with-the-anthropic-api/287731 提...

0

评论

Android工程师

·

1月前

不再混淆：导数 (Derivative) 与微分 (Differential) 的本质对决

不再混淆：导数 (Derivative) 与微分 (Differential) 的本质对决在微积分的入门阶段，很多同学会产生一种错觉：认为微分只是导数的另一种写法，或者觉...

0

评论

Android工程师

·

3月前

Anthropic 机械可解释性学习路线

Anthropic 机械可解释性学习路线机械可解释性（Mechanistic Interpretability, MI）是一个门槛较高的领域，因为它不仅涉及代码，还涉及独...

0

评论

Android工程师

·

3月前

Cursor Tab 共享无限车

linux.do 大佬开发的，不知道啥时候就不能用了，且用且珍惜。原文地址 Cursor 修改程序地址: Releases · wisdgod/cursor-rp 需要下...

0

评论

Android工程师

·

3月前

LLM 推理的“显存墙”与“通信墙”：从显存分布到部署原则

这是一篇基于我们之前的对话内容整合而成的深度技术文章。文章从你提供的关于“显存与带宽限制”的精辟论述出发，深入剖析了 Llama-3-70B 的实际数据，对比了 MHA 与...

0

评论

Android工程师

·

3月前

《前端项目技术文档生成器》Prompt（可复用模板）

下面提供你一份专门为前端项目优化的《技术文档自动生成 Prompt 模板》，适用于： React / Vue / Angular / Svelte / Next.js ...

13

评论

Android工程师

·

3月前

揭秘 MoE 训练的“三驾马车”

揭秘 MoE 训练的“三驾马车”：一篇博客看懂 $L_{\text{main}}$, $L_{\text{balance}}$ 和 $L_{\text{router-z}}...

1

评论

Android工程师

·

3月前

MoE 负载均衡之争：为何 Mixtral 的“实用主义”胜过了“统计主义”？

MoE 负载均衡之争：为何 Mixtral 的“实用主义”胜过了“统计主义”？在当今的大模型（LLM）领域，MoE（Mixture of Experts）架构已经成为实现...

0

评论

Android工程师

·

3月前

解密“混合专家模型” (MoE) 的全部魔法

解密“混合专家模型” (MoE) 的全部魔法在当今大语言模型 (LLM) 的竞赛中，您一定听说过 GPT-4、Mixtral 8x7B 这样的“巨无霸”。它们之所以能在保...

1

评论

Android工程师

·

3月前

MiniMind 模型架构创新技术详解

MiniMind 模型架构创新技术详解 https://github.com/AlvinScrp/minimind/blob/master/model/model.py 一...

0

评论

Android工程师

·

3月前

从傅里叶时钟到混合尺度：解构 RoPE 位置编码的演进之路

从傅里叶时钟到混合尺度：解构 RoPE 位置编码的演进之路摘要自 Transformer 架构诞生以来，位置编码一直是其核心组件之一。旋转位置编码 (RoPE) 利用傅...

1

评论

Android工程师

·

3月前

从傅里叶变换到 RoPE：解构位置编码的数学灵魂

从傅里叶变换到 RoPE：解构位置编码的数学灵魂旋转位置编码 (RoPE) 的天才之处，并不仅仅在于它使用了 sin 和 cos 函数。它真正的革命性在于，它将傅里叶变换...

0

评论

Android工程师

·

3月前

位置编码的技术演进线路：从绝对到相对，再到几何一致性

本文系统梳理了 Transformer 位置编码的技术演进路径：从正弦余弦绝对位置编码到旋转位置编码...

0

评论

Android工程师

·

3月前

旋转位置编码RoPE：用旋转艺术，解开 Transformer 的位置之谜

位置编码RoPE：用旋转艺术，解开 Transformer 的位置之谜在现代大型语言模型（LLM）的宏伟殿堂中，从 PaLM、Llama 到 GPT-NeoX，一个共同的...

0

1

个人成就

文章被点赞 244

文章被阅读 152,801

掘力值 3,618

加入于

2017-10-23