获得徽章 0
赞了这篇文章
赞了这篇文章
赞了这篇沸点
看到一个如何训练领域特定模型的文章写得非常好,作者使用 GRPO 微调了 qwen2.5-coder-7B, 实现了一个生成日程表的大模型。并且不光有教程,还有代码,模型。感兴趣的同学可以参考这个学习
教程地址:huggingface.co/blog/anakin87/qwen-scheduler-grpo
代码地址:github.com/anakin87/qwen-scheduler-grpo
模型地址:huggingface.co/anakin87/qwen-scheduler-7b-grpo
教程地址:huggingface.co/blog/anakin87/qwen-scheduler-grpo
代码地址:github.com/anakin87/qwen-scheduler-grpo
模型地址:huggingface.co/anakin87/qwen-scheduler-7b-grpo
展开
评论
4
赞了这篇文章
赞了这篇文章
赞了这篇文章