首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
余磬TuT
掘友等级
LLM算法工程师
gogogo!!!
获得徽章 6
动态
文章
专栏
沸点
收藏集
关注
作品
赞
75
文章 59
沸点 16
赞
75
返回
|
搜索文章
赞
文章( 59 )
沸点( 16 )
LLM常见问题(中文二次预训练部分)
1. 为什么需要进行继续预训练? 我们新增加了一些中文词汇到词表中,但是这些词汇是没有得到训练的,因此在进行指令微调之前我们要进行预训练。预训练的方式一般都是相同的,简单来说,就是根据上一个字预测下一
LLM常见问题(中文 Tokenization 部分)
1. 为什么需要构建中文 tokenization? 2. 如何对原始数据预处理? 3. 如何构建中文的词库? 目前比较主流的是使用 sentencepiece 来训练中文词库。安装指令也很简单:pi
LLM常见问题(Tokenizer 部分)
1. Byte-Pair Encoding(BPE) 如何构建词典? 设定最大subwords个数。 将所有单词拆分为单个字符,并且在最后添加一个停止符,同时标记处该单词出现的次数。 统计每一个 连续
LLM常见问题(Token 及模型参数部分)
1. 预训练模型表现影响因素有那些? 模型表现强依赖于模型规模(模型参数量 N、训练 Token 数 D、训练总计算量 C)。 平滑幂定律:模型表现与三个因子均遵循幂定律,不受另外两个因子限制。 在给
LLM常见问题(位置编码部分)
1. 什么是位置编码? 位置编码分为绝对位置编码和相对位置编码,绝对位置编码就是直接按照函数公式或者可学习参数得到每个 token 的位置编码加到 token 的输入表征上。相对位置编码(Relati
LLM常见问题(训练集部分)
1. SFT(有监督微调)的数据集格式? 指令数据一般为 json 格式,包含 Instruction、Input、Output 三个字段(可以为空),每行一条样本。 Instruction(指令)
LLM常见问题(显存部分)
1. 大模型大概有多大,模型文件有多大? 大模型也分为不同的规格,一般模型的规格会体现在模型的名称上,例如 LLaMA2-13b,13b 就是其模型参数量的大小,意思是 130亿的参数量。大模型的文件
LLM常见问题(Agent 部分)
1. 什么是 LLM Agent? LLM Agent 是一种人工智能系统,它利用大型语言模型 (LLM) 作为其核心计算引擎,展示文本生成之外的功能,包括进行对话、完成任务、推理,并可以展示一定程度
提升爬虫IP时效:解决被封IP的难题
在进行数据采集时,经常会遇到被目标网站封禁IP的情况,这给爬虫系统带来了困扰。本文将介绍如何提升爬虫IP的时效,解决被封IP的难题,帮助您顺利进行数据采集,不再受限于IP封禁。 第一步:使用爬虫IP
LLM常见问题(强化学习部分)
1. 简单介绍强化学习 强化学习(Reinforcement learning)是一种机器学习技术,可以训练模型做出决策,以实现最佳结果。它模仿了人类为实现目标所采取的反复试验的学习过程。有助于实现目
下一页
个人成就
文章被点赞
182
文章被阅读
46,778
掘力值
1,002
关注了
7
关注者
40
收藏集
0
关注标签
12
加入于
2023-10-30