首页
AI Coding
数据标注
NEW
沸点
课程
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
小刘的大模型笔记
掘友等级
研究员
喜欢研究大模型,精准大模型
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
5
文章 5
沸点 0
赞
5
返回
|
搜索文章
最新
热门
微调与安全隐私 —— 大模型定制化过程中的风险防控指南
一、引言 在大模型从通用走向场景化的过程中,微调已成为实现个性化需求的核心手段。企业通过微调将业务数据注入模型,打造专属客服、专业分析等定制化能力;个人开发者通过微调优化模型输出风格,适配特定创作场景
PPO 实战 —— 无代码落地大模型偏好优化全流程
一、引言 PPO 作为 RLHF 核心算法,是让大模型输出贴合人类偏好的关键技术,看似涉及复杂的强化学习知识,实则借助低代码平台,零基础也能完成全流程实战。本文抛开繁琐公式,聚焦PPO 微调实操全步骤
微调与安全隐私 —— 大模型落地的合规必修课
一、引言**** 大模型微调是实现业务适配的核心手段,但在微调过程中,安全与隐私问题往往被忽视 —— 很多企业和开发者在微调时,直接使用含敏感信息的数据集(如用户隐私、企业机密、未授权内容),不仅可能
什么是向量数据库 —— 零基础也能懂的核心概念
一、引言**** 在大模型、RAG、智能推荐等领域,向量数据库早已成为核心工具,被频繁提及,但很多初学者被 “向量”“相似度检索”“向量化” 等术语劝退,觉得这是高难度的技术概念,不敢轻易尝试。其实向
PPO 实战 —— 无代码落地大模型偏好优化全流程
一、引言 PPO 作为 RLHF 核心算法,是让大模型输出贴合人类偏好的关键技术,看似涉及复杂的强化学习知识,实则借助低代码平台,零基础也能完成全流程实战。本文抛开繁琐公式,聚焦PPO 微调实操全步骤
一文读懂显存:大模型训练的“专属内存”,决定你能否跑通微调
一、引言 “显存不足”是大模型新手最常遇到的报错,很多人疑惑:“我电脑有16G内存,为什么跑7B模型还提示显存不够?”“显存和内存到底有什么区别?”“多大显存才能跑大模型微调?”。其实显存是大模型训练
多任务微调实战:一个模型搞定 N 个业务场景,效率翻倍还省成本
一、引言 为客服场景训练一个模型,为办公场景再训练一个,最后还要为内容生成单独搭模型 —— 传统单任务微调不仅重复劳动,还导致企业模型维护成本高、部署复杂。而多任务微调通过让一个模型同时学习多个相关任
2026 主流大模型微调框架全解析:从选型到落地,新手也能快速上手
一、引言 想做大模型微调,却被市面上五花八门的微调框架搞得眼花缭乱?OpenLlama、LLaMA-Factory、PEFT、FastChat…… 不同框架各有优劣,有的适合新手,有的适合企业级落地,
什么是数据集
什么是数据集 —— 稀土掘金 一、引言 在大模型的世界里,数据集是模型的 “粮食” —— 没有数据,再强大的模型也无法学习;数据质量差,模型的输出也会差。很多新手入门大模型时,容易忽略数据集的重要性,
量化评估微调效果——大模型微调的验收标准与实操方法
一、引言 很多开发者在完成大模型微调后,陷入“不知道如何判断效果”的困境,仅凭主观感受判断“回复是否好用”,缺乏科学的量化标准,导致微调后的模型无法稳定落地。其实大模型微调的效果评估并非“玄学”,而是
下一页
个人成就
文章被阅读
557
掘力值
196
关注了
1
关注者
0
收藏集
0
关注标签
3
加入于
2026-01-16