首页
沸点
课程
数据标注
HOT
AI Coding
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
确定删除此收藏集吗
删除后此收藏集将被移除
取消
确定删除
确定删除此文章吗
删除后此文章将被从当前收藏集中移除
取消
确定删除
编辑收藏集
名称:
描述:
0
/100
公开
当其他人关注此收藏集后不可再更改为隐私
隐私
仅自己可见此收藏集
取消
确定
微调
订阅
WingDust
更多收藏集
微信扫码分享
微信
新浪微博
QQ
11篇文章 · 0订阅
小白也能训大模型!Hugging Face用「200页手册」亲自教学,连踩的坑都告诉你了...
无论你是初入人工智能(AI)领域的学生、希望了解全流程的工程师,还是正在规划下一个大模型项目的团队,这份手册都提供了可参考的实战经验。
何谓 DeepSeek “蒸馏”?
可以说 DeepSeek通过“大模型强化学习+小模型蒸馏”的技术路径,不仅能与OpenAI的正面竞争,更提供了一个新的大模型研发思路。本篇一起来深入了解一下:何谓 DeepSeek “蒸馏”?
【ERNIEKit】基于ERNIE4.5-0.3B大模型微调的心理咨询师大模型全流程
一、数据处理 1.原始数据情况 分析可见,数据为jsonl格式,每条记录含有id、prompt、response等3项 数据总共8775条 2.数据集比对 PaddleNLP 采用的 SFT 数据集(
从零开始训练26M参数的GPT模型,仅需3小时!——MiniMind项目详
近年来,大语言模型(LLM)如GPT、LLaMA、GLM等在自然语言处理领域取得了显著成果。然而,这
仅用200条样本,训出超越MiniGPT-4的模型!这款数据选择器值得拥有
在生成细节丰富和精确的图像描述方面,GPT-4 已经展现出了强大超凡的能力,其标志着一个语言和视觉处理新时代的到来。 因此,类似于 GPT-4 的多模态大型语言
LESS 实践:仅用少量的数据完成目标指令微调
之前的文章 LESS:仅选择5%有影响力的数据优于全量数据集进行目标指令微调 中详细讲述了LESS,本文对其进行实践。 LESS 核心思想 LESS 核心思想通过仅给出少数体现特定能力的示例,从大量指
LESS:仅选择5%有影响力的数据优于全量数据集进行目标指令微调
本文给大家分享一篇论文(LESS: Selecting Influential Data for Targeted Instruction Tuning)用于选择有影响力的少量数据进行目标指令调优。
港中文 & 苏大发布中文语法纠错大模型GrammarGPT | 仅用1K数据进行指令微调即可达到SOTA性能!
在本文中,我们介绍了GrammarGPT,这是一个专门用于母语中文语法错误纠正的开源大语言模型(LLM)。
基于 B 站评论区构建大语言模型微调数据集
基于B站视频评论区构建对话数据集,也就是根据大家的讨论,找出对话链,最终完成构建。产生的数据集样例如下:更多数据样例和源码,请移步文章最后的仓库源码查看
5分钟手把手系列(七):MAC本地微调大模型(MLX + Qwen2.5)
背景 如前作《5分钟手把手系列(四):如何微调一个大模型(Colab + Unsloth)》所言,截止至发稿日,huggingface上的各类模型已经突破百万(105w),基于各种最新基座模型进行微调