微调 - WingDust的收藏集 - 掘金

微调

更多收藏集

11篇文章 · 0订阅

小白也能训大模型！Hugging Face用「200页手册」亲自教学，连踩的坑都告诉你了...

无论你是初入人工智能（AI）领域的学生、希望了解全流程的工程师，还是正在规划下一个大模型项目的团队，这份手册都提供了可参考的实战经验。

AI大模型
6月前
259
点赞
评论

何谓 DeepSeek “蒸馏”？

可以说 DeepSeek通过“大模型强化学习+小模型蒸馏”的技术路径，不仅能与OpenAI的正面竞争，更提供了一个新的大模型研发思路。本篇一起来深入了解一下：何谓 DeepSeek “蒸馏”？

掘金安东尼
1年前
5.7k
31
9

何谓 DeepSeek “蒸馏”？

【ERNIEKit】基于ERNIE4.5-0.3B大模型微调的心理咨询师大模型全流程

一、数据处理 1.原始数据情况分析可见，数据为jsonl格式，每条记录含有id、prompt、response等3项数据总共8775条 2.数据集比对 PaddleNLP 采用的 SFT 数据集（

Livingbody
10月前
343
2
评论

【ERNIEKit】基于ERNIE4.5-0.3B大模型微调的心理咨询师大模型全流程

从零开始训练26M参数的GPT模型，仅需3小时！——MiniMind项目详

近年来，大语言模型（LLM）如GPT、LLaMA、GLM等在自然语言处理领域取得了显著成果。然而，这

小胖学前端
1年前
1.3k
点赞
评论

仅用200条样本，训出超越MiniGPT-4的模型！这款数据选择器值得拥有

在生成细节丰富和精确的图像描述方面，GPT-4 已经展现出了强大超凡的能力，其标志着一个语言和视觉处理新时代的到来。因此，类似于 GPT-4 的多模态大型语言

夕小瑶
2年前
1.6k
2
评论

LESS 实践：仅用少量的数据完成目标指令微调

之前的文章 LESS：仅选择5%有影响力的数据优于全量数据集进行目标指令微调中详细讲述了LESS，本文对其进行实践。 LESS 核心思想 LESS 核心思想通过仅给出少数体现特定能力的示例，从大量指

吃果冻不吐果冻皮
2年前
1.2k
点赞
评论

LESS：仅选择5%有影响力的数据优于全量数据集进行目标指令微调

本文给大家分享一篇论文（LESS: Selecting Influential Data for Targeted Instruction Tuning）用于选择有影响力的少量数据进行目标指令调优。

吃果冻不吐果冻皮
2年前
1.3k
1
评论

港中文 & 苏大发布中文语法纠错大模型GrammarGPT | 仅用1K数据进行指令微调即可达到SOTA性能！

在本文中，我们介绍了GrammarGPT，这是一个专门用于母语中文语法错误纠正的开源大语言模型（LLM）。

CVHub
2年前
1.7k
点赞
1

基于 B 站评论区构建大语言模型微调数据集

基于B站视频评论区构建对话数据集，也就是根据大家的讨论，找出对话链，最终完成构建。产生的数据集样例如下：更多数据样例和源码，请移步文章最后的仓库源码查看

FunnySaltyFish
2年前
2.5k
2
评论

5分钟手把手系列(七)：MAC本地微调大模型（MLX + Qwen2.5）

背景如前作《5分钟手把手系列(四)：如何微调一个大模型（Colab + Unsloth）》所言，截止至发稿日，huggingface上的各类模型已经突破百万（105w），基于各种最新基座模型进行微调

Batistuta
1年前
13k
13
22

5分钟手把手系列(七)：MAC本地微调大模型（MLX + Qwen2.5）