首页
AI Coding
数据标注
NEW
沸点
课程
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
seeksky
掘友等级
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
0
文章 0
沸点 0
赞
0
返回
|
搜索文章
seeksky
20天前
关注
令人深思,为什么需要 RAG ?
为什么需要 RAG 大型语言模型擅长生成,但它们的知识来自训练数据,存在时效性与覆盖面边界。RAG(Retrieval-Augmented Generation)把“检索”...
0
评论
分享
seeksky
24天前
举报
#新人报道#
喜欢开源,脸熟一下~
github.com
上班摸鱼
赞过
分享
评论
1
seeksky
24天前
关注
语义向量-Embeddings-生成与使用
语义向量 Embeddings 生成与使用 导读 Embeddings 的价值不在于“把文本变成数字”,而在于把语义关系映射到空间距离里:语义越近,向量越近。这让检索、聚类...
0
评论
分享
seeksky
25天前
关注
Transformer 注意力机制与序列建模基础
导读 Transformer 之所以重要,不只是“更强的模型”,而是它用注意力让序列计算可以并行化,并且把“依赖关系建模”变成了可解释、可控制的操作。本文从公式与结构讲清楚...
0
评论
分享
seeksky
26天前
关注
分词与 BPE 实现(tiktoken)
写分词器不是“把文本切成词”那么简单,而是一套关乎模型输入、计费、日志与安全的工程系统。tiktoken 采用字节级 BPE,并提供严格的特殊 token 管控与多种解码接...
0
评论
分享
seeksky
1月前
关注
搜索引擎设计与优化实践
深度拆解一套自研的极致本地搜索架构。通过双引擎隔离、数组化内存及虚拟切片等七大优化,成功将内存占用降低 70% 至 510MB,实现毫秒级零延迟响应。方案纯前端闭环、零成本...
0
评论
分享
个人成就
文章被阅读
238
掘力值
80
关注了
0
关注者
0
收藏集
0
关注标签
2
加入于
2024-03-26