首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
余磬TuT
掘友等级
LLM算法工程师
gogogo!!!
获得徽章 6
动态
文章
专栏
沸点
收藏集
关注
作品
赞
75
文章 59
沸点 16
赞
75
返回
|
搜索文章
赞
文章( 59 )
沸点( 16 )
LLM常见问题(思维链部分)
1. 什么是思维链提示? 思维链(Chain-of-thought,CoT),指的是一系列有逻辑关系的思考步骤,形成一个完整的思考过程。人在日常生活中,随时随地都会用思维链来解决问题,比如工作、读书经
LLM常见问题(幻觉部分)
1. 什么是大模型幻觉(Hallucination)? 大语言模型的模型幻觉问题是指其可能生成看似合理但实际上不准确或不符合事实的内容。处理大语言模型的模型幻觉问题需要采取一些方法和策略,通过挂载文档
Bert-vits2新版本V2.1英文模型本地训练以及中英文混合推理(mix)
中英文混合输出是文本转语音(TTS)项目中很常见的需求场景,尤其在技术文章或者技术视频领域里,其中文文本中一定会夹杂着海量的英文单词,我们当然不希望AI口播只会念中文,Bert-vits2老版本
LLM常见问题(Attention 优化部分)
1. 传统 Attention 存在哪些问题? 传统的 Attention 机制忽略了源端或目标端句子中词与词之间的依赖关系。 传统的 Attention 机制过度依赖 Encoder-Decoder
LLM常见问题(优化加速部分)
1. 当前优化模型最主要技术手段有哪些? 当前优化模型最主要技术手段概括来说有以下三个层面: 算法层面:蒸馏、量化 软件层面:计算图优化、模型编译 硬件层面:FP8(NVIDIA H系列GPU开始支持
LLM常见问题(激活函数部分)
1. 介绍一下 FFN 块? FFN(Feed-Forward Network)块是 Transformer 模型中的一个重要组成部分,用于对输入数据进行非线性变换。它由两个全连接层(即前馈神经网络)
LLM常见问题(Layer normalization 部分)
1. Layer Norm 的计算公式是怎样的,如何使用代码实现? 其中 μ 为 x 的均值,σ 为 x 的方差,γ 和 β 是可训练的模型参数,γ 是缩放参数,新分布的方差 γ2 ; β 是平移系数
论文笔记:Llama 2: Open Foundation and Fine-Tuned Chat Models
导语 Llama 2 是之前广受欢迎的开源大型语言模型 LLaMA 的新版本,该模型已公开发布,可用于研究和商业用途。本文记录了阅读该论文的一些关键笔记。 链接:https://arxiv.org/a
LLM常见问题(中文指令微调部分)
1. 对模型进行指令微调需要注意什么? 在选择好需要微调的一个大语言模型之后。比如chatglm、llama、bloom等,要想使用它,得了解三个方面:输入数据的格式、tokenization、模型的
15岁女生的2022年年终总结|15岁啦,我也开始接触编程
高考上岸 2022年,15岁的我经历高考的磨砺,成功上岸。然而由于前期填志愿时我的迷茫再加上高考理科生的身份,因此收到录取通知书时我感到有些许疑惑但也有几分合理--自动化专业。
下一页
个人成就
文章被点赞
182
文章被阅读
46,775
掘力值
1,002
关注了
7
关注者
40
收藏集
0
关注标签
12
加入于
2023-10-30