首页
首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
LLM
Tsan1024
创建于2024-12-09
订阅专栏
介绍大模型相关知识与自我思考
暂无订阅
共3篇文章
创建于2024-12-09
订阅专栏
默认顺序
默认顺序
最早发布
最新发布
谷歌Agent白皮书中文译文
本文翻译自2024年Google团队的Agents白皮书,近期,DeepSeek备受瞩目,其推理成本极低,为Agent的广泛普及奠定了极为坚实的技术基础,提供了强有力的支持。Agent时代已然来临。
transformer中KV需要缓存而Q不需要缓存的看法?
在 Self-Attention 机制中,Q 是“即时生成”的,不需要缓存;而 K 和 V 在多个查询中会多次使用,因此需要缓存以减少重复计算
TF-IDF 到 BM25
本文介绍了从TF-IDF到BM25的进化过程。BM25通过引入非线性词频调整、文档长度归一化和改进的逆文档频率(IDF)机制,提升了信息检索的效果。相比于传统的TF-IDF,BM25能更好地平衡词频与