首页
沸点
课程
数据标注
HOT
AI Coding
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
大模型微调Online
掘友等级
九章云极科技有限公司
在线大模型训练与微调服务平台,提供开箱即用、低代码、全链路功能覆盖的大模型训练与微调服务。
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
0
文章 0
沸点 0
赞
0
返回
|
搜索文章
大模型微调Online
@九章云极科技有限公司
·
1天前
关注
别再死磕SFT了!用KTO微调Qwen3-14B,数据减半效果翻倍
摘要:传统SFT需构造问答对,RLHF需成对比较,成本高且繁琐。KTO受行为经济学启发,仅需单个回答的“好/差”标签即可实现偏好对齐,数据减半效果翻倍。本文以Qwen3-1...
0
评论
分享
大模型微调Online
@九章云极科技有限公司
·
2天前
关注
告别“令牌”与“智元”之争,“词元”定名背后的140万亿经济账
2026年3月国家数据局将Token正式定名“词元”,终结译名争议。其日均调用量达140万亿+,两年增超千倍,成为AI产业核心指标。定名推动产业标准化,大模型厂商、云厂商等...
0
评论
分享
大模型微调Online
@九章云极科技有限公司
·
9天前
关注
英伟达用AI智能体7天自主优化GPU内核,超越人类专家
英伟达推出 AVO 智能体,7 天无人工干预优化 B200 GPU 注意力内核,性能超 cuDNN 最高 3.5%、FlashAttention-4 最高 10.5%,30...
0
评论
分享
大模型微调Online
@九章云极科技有限公司
·
11天前
关注
阿里云突然宣布:最高涨34%!告别“价格战”,AI算力正式进入稀缺时代
2026年3月18日阿里云官宣AI算力、存储最高涨34%,百度智能云同日跟进,腾讯云此前已上调模型价格。受AI需求爆发、硬件成本上涨、Token消耗暴增影响,云计算行业告别...
0
评论
分享
大模型微调Online
@九章云极科技有限公司
·
16天前
关注
让AI学会“讨人喜欢”:用PPO-RW给Qwen3-1.7B装上“审美神经”
在大模型微调过程中,如何让模型不仅能生成正确的指令回复,还能在语气、逻辑结构和专业度上更贴近人类偏好?本文将基于LlamaFactory Online平台,详细展示如何利用...
0
评论
分享
大模型微调Online
@九章云极科技有限公司
·
17天前
关注
MiniMax M2.7开启“自我进化”:AI正从“被训练”走向“自己长大”
本文介绍MiniMax推出M2.7模型,开启AI自我进化新模式。该模型可自主生成数据、迭代优化,分担过半研发工作,实测表现位居行业前列。同时分析其在可控性、反馈质量与进化边...
0
评论
分享
大模型微调Online
@九章云极科技有限公司
·
25天前
关注
把历史模型当“乐高”拼:一种新的微调加速范式
算法工程师常闲置大量历史模型checkpoint,造成资源浪费。3月10日arXiv论文提出Mashup Learning混搭学习,通过检索、合并历史模型权重再微调,可使新...
0
评论
分享
大模型微调Online
@九章云极科技有限公司
·
27天前
关注
全民都在“养龙虾”,但你真的会“喂”吗?OpenClaw爆火背后的微调玄机
OpenClaw 凭借 “能干活” 的 AI 智能体能力迅速爆红,GitHub 星标近 30 万登顶榜首。它依托四层架构实现系统自动化,在苹果芯片支持端侧实时微调,同时也面...
1
评论
分享
大模型微调Online
@九章云极科技有限公司
·
1月前
关注
港科大这个AI突破,让大模型学会“偷懒”了
多模态大模型推理效率低?港科大最新研究MoDES,让AI学会“偷懒”——跳过88%冗余专家,保住97%性能,推理速度翻倍。这项被CVPR接收的突破,正在让大模型从“拼参数”...
0
评论
分享
大模型微调Online
@九章云极科技有限公司
·
1月前
关注
从“脸盲”到“火眼金睛”:我用Qwen3.5教会AI看懂春晚同款机器人
春晚人形机器人刷屏,你的 AI 能认出几个?基于 LlamaFactory Online 微调 Qwen3.5-35B-A3B,数百条数据一键训练,模型可精准识别宇树...
0
评论
分享
大模型微调Online
@九章云极科技有限公司
·
1月前
关注
只有2B参数,中文能力也能打架?手把手教你调教出更懂中文的“小钢炮”模型
本文在LlamaFactory Online平台微调Chinese Tiny LLM - 2B小模型,通过困惑度筛选高质量中文语料,并设计三组中英配比实验。结果显示:微调后...
0
评论
分享
大模型微调Online
@九章云极科技有限公司
·
1月前
关注
阿里除夕开源千问3.5:3970亿参数但只激活170亿,大模型部署成本砍半怎么做到的?
本文探讨 AI 落地深水区的成本与效率难题,解析阿里 Qwen3.5 通过混合注意力、稀疏 MoE 等技术实现性能跃升与降本增效,并对比 Prompt、RAG 与微调的适用...
0
评论
分享
大模型微调Online
@九章云极科技有限公司
·
2月前
关注
让AI听懂“宫商角徵羽”:基于Qwen2-Audio的传统音乐语义解析系统实战
本文基于 LLaMA-Factory Online 平台,详细介绍了如何通过对 Qwen2-Audio-7B-Instruct 模型进行LoRA微调,构建一个具备传统音乐解...
0
评论
分享
大模型微调Online
@九章云极科技有限公司
·
2月前
关注
Qwen3-4B-Instruct-2507微调实战——打造“快思考、强执行”的 ReAct IoT Agent
随着大模型与物联网的深度融合,传统“指令—执行”式的智能家居系统已难以应对真实场景中复杂、模糊的用户需求。为此,我们推出IoT Agent v3.2...
0
评论
分享
大模型微调Online
@九章云极科技有限公司
·
2月前
关注
告别“大模型恐惧症”:如何用1/10的成本,跑出企业级AI的顶级效果?
今天,我们将通过一场实战,展示如何将80亿参数的Qwen3-8B模型与LightLLM高效推理框架相结合,在LLaMA-Factory Online上,打造一个兼具深度理解...
0
评论
分享
大模型微调Online
@九章云极科技有限公司
·
2月前
关注
DeepSeek V4全网猜测汇总:四大焦点浮出水面
DeepSeek V4全网猜测汇总:四大焦点浮出水面 AI圈近期的热度,几乎全被DeepSeek V4的相关猜测承包了。今天我们梳理全网真实信息,聚焦大家最关心的四大核心焦...
0
评论
分享
大模型微调Online
@九章云极科技有限公司
·
3月前
关注
受够93道MBTI选择题?我调了一个测MBTI的专属AI,回答8个问题就出结果,准确率99%
厌倦了冗长又主观的MBTI选择题?我们开发了一个只需回答8个问题的AI模型,通过自然对话分析你的语言风格与思维模式,即可判断你的真实MBTI人格类型,准确率达99%。...
0
评论
分享
大模型微调Online
@九章云极科技有限公司
·
3月前
关注
当 AI 落地到了“深水区”:到底是 Prompt 不行、RAG 不够,还是该考虑微调了?
大模型效果不稳时,问题往往不在“模型不够强”,而在 Prompt、RAG 和微调怎么配合用。本文给出一套系统性判断思路,并介绍如何借助 LLaMA-Factory Onli...
0
评论
分享
大模型微调Online
@九章云极科技有限公司
·
4月前
关注
搞定300亿医疗多模态大模型微调!基于Qwen3-VL构建医学影像分析专家
仅用1.6万张医学影像,我们让大模型学会了“看片子”。即使是顶尖的通用大模型,在经过高质量的领域数据微调后,也能在高度专业的场景中展现出卓越性能。...
0
评论
分享
大模型微调Online
@九章云极科技有限公司
·
4月前
关注
PPO最强,DPO一般?一文带你了解常见三种强化学习方法,文末有大模型微调神器!
很多人第一次接触各家大模型时,都会觉得它们的回答能带来意想不到的惊喜,但有时,AI回答又怪怪的、啰嗦、甚至有点危险。 这背后,其实就是一个核心问题:对齐(Alignme...
1
评论
分享
下一页
个人成就
文章被点赞
4
文章被阅读
4,014
掘力值
340
关注了
0
关注者
1
收藏集
0
关注标签
5
加入于
2025-08-07