首页
AI Coding
数据标注
NEW
沸点
课程
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
小刘的大模型笔记
掘友等级
研究员
喜欢研究大模型,精准大模型
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
5
文章 5
沸点 0
赞
5
返回
|
搜索文章
小刘的大模型笔记
研究员
·
6小时前
关注
微调与安全隐私 —— 大模型定制化过程中的风险防控指南
一、引言 在大模型从通用走向场景化的过程中,微调已成为实现个性化需求的核心手段。企业通过微调将业务数据注入模型,打造专属客服、专业分析等定制化能力;个人开发者通过微调优化模...
0
评论
分享
小刘的大模型笔记
研究员
·
8小时前
关注
PPO 实战 —— 无代码落地大模型偏好优化全流程
一、引言 PPO 作为 RLHF 核心算法,是让大模型输出贴合人类偏好的关键技术,看似涉及复杂的强化学习知识,实则借助低代码平台,零基础也能完成全流程实战。本文抛开繁琐公式...
0
评论
分享
小刘的大模型笔记
研究员
·
8小时前
关注
微调与安全隐私 —— 大模型落地的合规必修课
一、引言**** 大模型微调是实现业务适配的核心手段,但在微调过程中,安全与隐私问题往往被忽视 —— 很多企业和开发者在微调时,直接使用含敏感信息的数据集(如用户隐私、企业...
0
评论
分享
小刘的大模型笔记
研究员
·
8小时前
关注
什么是向量数据库 —— 零基础也能懂的核心概念
一、引言**** 在大模型、RAG、智能推荐等领域,向量数据库早已成为核心工具,被频繁提及,但很多初学者被 “向量”“相似度检索”“向量化” 等术语劝退,觉得这是高难度的技...
0
评论
分享
小刘的大模型笔记
研究员
·
8小时前
关注
PPO 实战 —— 无代码落地大模型偏好优化全流程
一、引言 PPO 作为 RLHF 核心算法,是让大模型输出贴合人类偏好的关键技术,看似涉及复杂的强化学习知识,实则借助低代码平台,零基础也能完成全流程实战。本文抛开繁琐公式...
0
评论
分享
小刘的大模型笔记
研究员
·
1天前
关注
一文读懂显存:大模型训练的“专属内存”,决定你能否跑通微调
一、引言 “显存不足”是大模型新手最常遇到的报错,很多人疑惑:“我电脑有16G内存,为什么跑7B模型还提示显存不够?”“显存和内存到底有什么区别?”“多大显存才能跑大模型微...
0
评论
分享
小刘的大模型笔记
研究员
·
2天前
关注
多任务微调实战:一个模型搞定 N 个业务场景,效率翻倍还省成本
一、引言 为客服场景训练一个模型,为办公场景再训练一个,最后还要为内容生成单独搭模型 —— 传统单任务微调不仅重复劳动,还导致企业模型维护成本高、部署复杂。而多任务微调通过...
0
评论
分享
小刘的大模型笔记
研究员
·
3天前
关注
2026 主流大模型微调框架全解析:从选型到落地,新手也能快速上手
一、引言 想做大模型微调,却被市面上五花八门的微调框架搞得眼花缭乱?OpenLlama、LLaMA-Factory、PEFT、FastChat…… 不同框架各有优劣,有的适...
0
评论
分享
小刘的大模型笔记
研究员
·
4天前
关注
什么是数据集
什么是数据集 —— 稀土掘金 一、引言 在大模型的世界里,数据集是模型的 “粮食” —— 没有数据,再强大的模型也无法学习;数据质量差,模型的输出也会差。很多新手入门大模型...
0
评论
分享
小刘的大模型笔记
研究员
·
5天前
关注
量化评估微调效果——大模型微调的验收标准与实操方法
一、引言 很多开发者在完成大模型微调后,陷入“不知道如何判断效果”的困境,仅凭主观感受判断“回复是否好用”,缺乏科学的量化标准,导致微调后的模型无法稳定落地。其实大模型微调...
0
评论
分享
小刘的大模型笔记
研究员
·
6天前
关注
大模型微调显存优化 —— 新手必看的无代码优化技巧
一、引言 大模型微调过程中,显存不足是最常见的问题之一,很多开发者因显存限制,无法训练大模型、只能选择小参数量模型,甚至导致训练中断,严重影响微调效率。其实大模型微调的显存...
0
评论
分享
小刘的大模型笔记
研究员
·
7天前
关注
大模型微调参数设置 —— 新手必看的核心参数与优化技巧
一、引言 大模型微调的效果,不仅取决于高质量的数据集,更取决于合理的参数设置—— 很多初学者用相同的数据集微调,效果却天差地别,核心原因就是参数设置不当,要么过拟合,要么欠...
0
评论
分享
小刘的大模型笔记
研究员
·
8天前
关注
微调效果评估——大模型微调的“验收标准”
一、引言 很多开发者在大模型微调时,容易陷入“盲目训练”的误区——只关注“是否完成微调”,却忽略“微调效果好不好”,导致微调后的模型无法满足业务需求,浪费时间和资源。其实,...
0
评论
分享
小刘的大模型笔记
研究员
·
9天前
关注
多任务微调——大模型通用能力提升的核心方法
一、引言 多任务微调(Multi-Task Fine-Tuning)是让通用大模型同时掌握多种技能的核心方法,通过在多个相关任务的数据集上联合训练,提升模型的泛化能力和通用...
0
评论
分享
小刘的大模型笔记
研究员
·
10天前
关注
向量数据库优势和劣势 —— 不同场景下的选型参考
一、引言 向量数据库作为处理非结构化数据的核心工具,已广泛应用于 RAG、智能推荐、图像检索等场景,但并非 “万能工具”—— 不同类型的向量数据库在性能、成本、易用性上差异...
0
评论
分享
小刘的大模型笔记
研究员
·
11天前
关注
RAG 方案对比 —— 不同场景下的最优选择指南
一、引言 在大模型落地过程中,“知识时效性” 与 “事实准确性” 是两大核心痛点 —— 预训练模型的知识停留在训练数据截止日期,无法获取实时信息;同时,模型可能产生 “幻觉...
0
评论
分享
小刘的大模型笔记
研究员
·
14天前
关注
大模型微调显存优化 —— 告别 “显存不足” 的实用指南
一、引言 在大模型微调实践中,“显存不足” 是初学者最常遇到的问题 —— 动辄几十 GB 显存需求的大模型,让多数人手中的消费级 GPU(如 RTX 3080、RTX 40...
0
评论
分享
小刘的大模型笔记
研究员
·
15天前
关注
开源大模型微调对比:选对模型,事半功倍
引言 随着开源大模型生态的蓬勃发展,市面上涌现出了大量优秀的开源模型,比如 Llama 系列、Qwen 系列、Baichuan 系列、Mistral 系列等。这些模型各有特...
0
评论
分享
小刘的大模型笔记
研究员
·
16天前
关注
RAG性能瓶颈突破:文档切分的核心逻辑与最优实践
引言 在检索增强生成(RAG)系统中,有一个看似基础却能决定系统成败的关键环节——文档切分。很多开发者搭建的RAG系统,检索结果不准确、生成内容驴唇不对马嘴,究其原因,往往...
0
评论
分享
下一页
个人成就
文章被阅读
561
掘力值
196
关注了
1
关注者
0
收藏集
0
关注标签
3
加入于
2026-01-16