大模型微调Online

九章云极科技有限公司

在线大模型训练与微调服务平台，提供开箱即用、低代码、全链路功能覆盖的大模型训练与微调服务。

赞

0

|

搜索文章

@九章云极科技有限公司

·

22天前

AI当审稿人，得分比人类还高？AAAI-26的22,977篇论文实验

AAAI-26首次大规模部署AI审稿，处理22,977篇论文。调查显示，AI在技术错误识别等6项指标上获学者偏好评分高...

0

评论

@九章云极科技有限公司

·

24天前

平台上新！Gemma 4 全系模型正式上线：不止于迭代，更是架构新探索

谷歌开源Gemma 4全系模型，共四款：MoE架构26B（激活4B）、稠密31B及实验架构E2B/E4B。全系指令微调，支持高效推理、稳定性能与架构探索，已上线平台并支持任...

0

评论

@九章云极科技有限公司

·

28天前

从菜鸟到高手：LlamaFactory官方超参数终极指南（建议收藏）

大模型微调总是“炸炉”？LlamaFactory Online 官方专家带你拆解核心超参数。从“复习几轮”的 Epoch 到“带小抄考高分”的 LoRA，用最硬核的逻辑和最...

0

评论

@九章云极科技有限公司

·

29天前

中国AI音乐，全球登顶！Mureka V8击败Suno、Udio，拿下权威榜单双料冠军

中国AI音乐模型Mureka V8首次在全球权威评测Artificial Analysis中，同时斩获人声与器乐双料冠军，击败Suno、Udio等国际主流模型。其自研Mus...

0

评论

@九章云极科技有限公司

·

1月前

别再死磕SFT了！用KTO微调Qwen3-14B，数据减半效果翻倍

摘要：传统SFT需构造问答对，RLHF需成对比较，成本高且繁琐。KTO受行为经济学启发，仅需单个回答的“好/差”标签即可实现偏好对齐，数据减半效果翻倍。本文以Qwen3-1...

0

评论

@九章云极科技有限公司

·

1月前

告别“令牌”与“智元”之争，“词元”定名背后的140万亿经济账

2026年3月国家数据局将Token正式定名“词元”，终结译名争议。其日均调用量达140万亿+，两年增超千倍，成为AI产业核心指标。定名推动产业标准化，大模型厂商、云厂商等...

0

评论

@九章云极科技有限公司

·

1月前

英伟达用AI智能体7天自主优化GPU内核，超越人类专家

英伟达推出 AVO 智能体，7 天无人工干预优化 B200 GPU 注意力内核，性能超 cuDNN 最高 3.5%、FlashAttention-4 最高 10.5%，30...

0

评论

@九章云极科技有限公司

·

1月前

阿里云突然宣布：最高涨34%！告别“价格战”，AI算力正式进入稀缺时代

2026年3月18日阿里云官宣AI算力、存储最高涨34%，百度智能云同日跟进，腾讯云此前已上调模型价格。受AI需求爆发、硬件成本上涨、Token消耗暴增影响，云计算行业告别...

0

评论

@九章云极科技有限公司

·

1月前

让AI学会“讨人喜欢”：用PPO-RW给Qwen3-1.7B装上“审美神经”

在大模型微调过程中，如何让模型不仅能生成正确的指令回复，还能在语气、逻辑结构和专业度上更贴近人类偏好？本文将基于LlamaFactory Online平台，详细展示如何利用...

0

评论

@九章云极科技有限公司

·

1月前

MiniMax M2.7开启“自我进化”：AI正从“被训练”走向“自己长大”

本文介绍MiniMax推出M2.7模型，开启AI自我进化新模式。该模型可自主生成数据、迭代优化，分担过半研发工作，实测表现位居行业前列。同时分析其在可控性、反馈质量与进化边...

0

评论

@九章云极科技有限公司

·

1月前

把历史模型当“乐高”拼：一种新的微调加速范式

算法工程师常闲置大量历史模型checkpoint，造成资源浪费。3月10日arXiv论文提出Mashup Learning混搭学习，通过检索、合并历史模型权重再微调，可使新...

0

评论

@九章云极科技有限公司

·

2月前

全民都在“养龙虾”，但你真的会“喂”吗？OpenClaw爆火背后的微调玄机

OpenClaw 凭借 “能干活” 的 AI 智能体能力迅速爆红，GitHub 星标近 30 万登顶榜首。它依托四层架构实现系统自动化，在苹果芯片支持端侧实时微调，同时也面...

1

评论

@九章云极科技有限公司

·

2月前

港科大这个AI突破，让大模型学会“偷懒”了

多模态大模型推理效率低？港科大最新研究MoDES，让AI学会“偷懒”——跳过88%冗余专家，保住97%性能，推理速度翻倍。这项被CVPR接收的突破，正在让大模型从“拼参数”...

0

评论

@九章云极科技有限公司

·

2月前

从“脸盲”到“火眼金睛”：我用Qwen3.5教会AI看懂春晚同款机器人

春晚人形机器人刷屏，你的 AI 能认出几个？基于 LlamaFactory Online 微调 Qwen3.5-35B-A3B，数百条数据一键训练，模型可精准识别宇树...

0

评论

@九章云极科技有限公司

·

2月前

只有2B参数，中文能力也能打架？手把手教你调教出更懂中文的“小钢炮”模型

本文在LlamaFactory Online平台微调Chinese Tiny LLM - 2B小模型，通过困惑度筛选高质量中文语料，并设计三组中英配比实验。结果显示：微调后...

0

评论

@九章云极科技有限公司

·

2月前

阿里除夕开源千问3.5：3970亿参数但只激活170亿，大模型部署成本砍半怎么做到的？

本文探讨 AI 落地深水区的成本与效率难题，解析阿里 Qwen3.5 通过混合注意力、稀疏 MoE 等技术实现性能跃升与降本增效，并对比 Prompt、RAG 与微调的适用...

0

评论

@九章云极科技有限公司

·

3月前

让AI听懂“宫商角徵羽”：基于Qwen2-Audio的传统音乐语义解析系统实战

本文基于 LLaMA-Factory Online 平台，详细介绍了如何通过对 Qwen2-Audio-7B-Instruct 模型进行LoRA微调，构建一个具备传统音乐解...

0

评论

@九章云极科技有限公司

·

3月前

Qwen3-4B-Instruct-2507微调实战——打造“快思考、强执行”的 ReAct IoT Agent

随着大模型与物联网的深度融合，传统“指令—执行”式的智能家居系统已难以应对真实场景中复杂、模糊的用户需求。为此，我们推出IoT Agent v3.2...

0

评论

@九章云极科技有限公司

·

3月前

告别“大模型恐惧症”：如何用1/10的成本，跑出企业级AI的顶级效果？

今天，我们将通过一场实战，展示如何将80亿参数的Qwen3-8B模型与LightLLM高效推理框架相结合，在LLaMA-Factory Online上，打造一个兼具深度理解...

0

评论

@九章云极科技有限公司

·

3月前

DeepSeek V4全网猜测汇总：四大焦点浮出水面

DeepSeek V4全网猜测汇总：四大焦点浮出水面 AI圈近期的热度，几乎全被DeepSeek V4的相关猜测承包了。今天我们梳理全网真实信息，聚焦大家最关心的四大核心焦...

0

评论

个人成就

文章被点赞 4

文章被阅读 5,537

加入于

2025-08-07