LLM

LLM

LLM

介绍大模型相关知识与自我思考

暂无订阅共4篇文章创建于2024-12-09

OpenClaw-RL 深度解析：像聊天一样，训练你的个性化 Agent 进化

为什么你的 AI 助手总是“教不会”？大多数 AI 系统的生命周期是：训练、部署、冻结。一旦上线，它的能力就固定了。

17天前
147
点赞
评论

谷歌Agent白皮书中文译文

本文翻译自2024年Google团队的Agents白皮书，近期，DeepSeek备受瞩目，其推理成本极低，为Agent的广泛普及奠定了极为坚实的技术基础，提供了强有力的支持。Agent时代已然来临。

1年前
589
点赞
评论

transformer中KV需要缓存而Q不需要缓存的看法？

在 Self-Attention 机制中，Q 是“即时生成”的，不需要缓存；而 K 和 V 在多个查询中会多次使用，因此需要缓存以减少重复计算

1年前
960
点赞
评论

transformer中KV需要缓存而Q不需要缓存的看法？

TF-IDF 到 BM25

本文介绍了从TF-IDF到BM25的进化过程。BM25通过引入非线性词频调整、文档长度归一化和改进的逆文档频率（IDF）机制，提升了信息检索的效果。相比于传统的TF-IDF，BM25能更好地平衡词频与

1年前
463
点赞
评论