首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
余磬TuT
掘友等级
LLM算法工程师
gogogo!!!
获得徽章 6
动态
文章
专栏
沸点
收藏集
关注
作品
赞
75
文章 59
沸点 16
赞
75
返回
|
搜索文章
余磬TuT
LLM算法工程师
·
1年前
举报
有没有推荐的眼药水啊,眼睛好干
赞过
分享
3
3
余磬TuT
赞了这篇沸点
汪汪队长
狗头协会CEO @狗头协会
·
1年前
举报
都没人点赞了
上班摸鱼
等人赞过
分享
6
30
余磬TuT
赞了这篇沸点
卓越山姆会员
1年前
举报
打工就是当狗的过程。区别就是工资高点吃进口狗粮,能力差点的吃剩菜剩饭。
上班摸鱼
等人赞过
分享
19
22
余磬TuT
LLM算法工程师
·
1年前
关注
LLM常见问题(位置编码部分)
1. 什么是位置编码? 位置编码分为绝对位置编码和相对位置编码,绝对位置编码就是直接按照函数公式或者可学习参数得到每个 token 的位置编码加到 token 的输入表征上...
7
评论
分享
余磬TuT
LLM算法工程师
·
1年前
关注
LLM常见问题(Token 及模型参数部分)
1. 预训练模型表现影响因素有那些? 模型表现强依赖于模型规模(模型参数量 N、训练 Token 数 D、训练总计算量 C)。 平滑幂定律:模型表现与三个因子均遵循幂定律,...
5
评论
分享
余磬TuT
LLM算法工程师
·
1年前
关注
LLM常见问题(Agent 部分)
1. 什么是 LLM Agent? LLM Agent 是一种人工智能系统,它利用大型语言模型 (LLM) 作为其核心计算引擎,展示文本生成之外的功能,包括进行对话、完成任...
6
评论
分享
余磬TuT
赞了这篇文章
华科云商xiao徐
1年前
关注
提升爬虫IP时效:解决被封IP的难题
在进行数据采集时,经常会遇到被目标网站封禁IP的情况,这给爬虫系统带来了困扰。本文将介绍如何提升爬虫IP的时效,解决被封IP的难题,帮助您顺利进行数据采集,不再受限于IP封...
2
1
分享
余磬TuT
LLM算法工程师
·
1年前
关注
LLM常见问题(显存部分)
1. 大模型大概有多大,模型文件有多大? 大模型也分为不同的规格,一般模型的规格会体现在模型的名称上,例如 LLaMA2-13b,13b 就是其模型参数量的大小,意思是 1...
4
评论
分享
余磬TuT
LLM算法工程师
·
1年前
关注
LLM常见问题(训练集部分)
1. SFT(有监督微调)的数据集格式? 指令数据一般为 json 格式,包含 Instruction、Input、Output 三个字段(可以为空),每行一条样本。 In...
3
2
分享
余磬TuT
关注了
刘卡卡
LLM算法工程师
余磬TuT
LLM算法工程师
·
1年前
关注
LLM常见问题(强化学习部分)
1. 简单介绍强化学习 强化学习(Reinforcement learning)是一种机器学习技术,可以训练模型做出决策,以实现最佳结果。它模仿了人类为实现目标所采取的反复...
3
评论
分享
余磬TuT
赞了这篇文章
北岛贰
前端 @成都
·
1年前
关注
金九银十招聘季,IT 打工人,该怎么识别烂公司好公司?
选择公司,就是在选自己未来的命运。 遇到一家好公司,你未来的职业道路,生活水平,工作热情,技术提升都是积极生长的。 但遇到一家烂公司,你未来的一年甚至几年,都将处在水深火热...
174
69
分享
余磬TuT
赞了这篇文章
五阳
交易中台的拆台专家,爱吹牛 @互联网
·
1年前
关注
年底了,出了P0级故障,人肉运维不可靠
程序员一定要学会保护自己,对于高危的人肉运维,勇敢的说不!吾日三省吾身。1、这事能不能不干;2、这事能不能明天干;3、这事能不能推给别人干。...
223
100
分享
余磬TuT
LLM算法工程师
·
1年前
关注
LLM常见问题(测评部分)
1. 大模型怎么评测? 自动评测和人工评测。这两种方法在评测语言模型和机器翻译等任务时起着重要的作用。自动评测方法基于计算机算法和自动生成的指标,能够快速且高效地评测模型的...
3
评论
分享
余磬TuT
LLM算法工程师
·
1年前
关注
LLM常见问题(增量预训练部分)
1. 为什么要增量预训练? 预训练学知识,指令微调学格式,强化学习对齐人类偏好,所以要想大模型有领域知识,得增量预训练(靠指令微调记知识不靠谱,不是几十w条数据能做到的)。...
4
评论
分享
余磬TuT
赞了这篇文章
ali老蒋
钉钉工作台&动态技术Leader @阿里巴巴钉钉
·
1年前
关注
为什么我推荐技术同学多多申请专利
今天跟大家分享一下,从一名技术工程师(程序员)的角度,为什么要写专利以及如何去申请专利? 专利的本质 首先就是要科普一下,并不是说一定要做出来的某个东西,才能够申请专利,和...
202
98
分享
余磬TuT
LLM算法工程师
·
1年前
关注
LLM常见问题(推理部分)
1. 为什么大模型推理时显存涨的那么多还一直占着? 模型参数占用显存:大语言模型本身具有大量参数量,这些参数需要存储在显存中以供推理使用。不量化的情况下这部分显存占用和大模...
4
评论
分享
余磬TuT
赞了这篇沸点
修改昵称给钻石
1年前
举报
#新人报道#
首次成功发布有5000矿石
等人赞过
分享
20
19
余磬TuT
赞了这篇文章
Lorin洛林
Java 服务端高级开发工程师 公众号:Lorin 洛林
·
1年前
关注
索引下推 你不得不知的 MySQL 查询优化技术
索引下推(Index Condition Pushdown,简称ICP),是 MySQL5.6 版本提供的新特性,核心目标是减少回表查询次数,提高查询效率。...
18
评论
分享
下一页
个人成就
文章被点赞
178
文章被阅读
40,892
掘力值
969
关注了
7
关注者
40
收藏集
0
关注标签
12
加入于
2023-10-30