首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
大语言模型
Q同学
创建于2023-04-21
订阅专栏
Large Language Model(LLM)相关的笔记、博客、代码资源整理
等 9 人订阅
共44篇文章
创建于2023-04-21
订阅专栏
默认顺序
默认顺序
最早发布
最新发布
论文笔记:LoRA: Low-Rank Adaptation of Large Language Models
导语 本文介绍了学术界在资源不富裕的情况下能够玩得起大模型的一种方式:LoRA,该技术可以大大优化大模型Fine-tune所需的算力资源,最近颇受关注。 会议:ICLR 2022 链接:https:/
论文笔记:Self-Instruct: Aligning Language Model with Self Generated Instructions
导语 本文介绍了如何使用LLM来大规模自动生成instruction。实验结果表明,这种数据增强方式非常有效,接下来就让我们看看具体是怎么做的吧。 会议:Arxiv 链接:https://arxiv.
Alpaca:一个健壮、可复现的指令调优模型
本文正在参加「金石计划」 导语 上篇博客介绍了Meta AI发布的开源大型语言模型LLaMA,本文介绍斯坦福的研究人员在LLaMA基础上基于指令微调(Instruction-tuning),仅使用约
论文笔记:LLaMA: Open and Efficient Foundation Language Models
导语 随着ChatGPT的爆火,大语言模型逐渐成为了研究热点,然而过去的大部分工作中的大语言模型LLM都是闭源的,仅提供API有偿调用,本文介绍了最近MetaAI开源的大语言模型LLaMA。 会议:A