今天介绍一下我的另外一个开源项目:Zero-Qwen-VL。
这个项目项目的初衷是想训练一个对中文支持更友好的图文多模态模型,所以挑了qwen-vl的图片编码器,语言模型选择了qwen2,做完之后才发现这不是和qwen-vl差不多嘛。不过大家可以学习这个思路和流程,可以组合不同的图片编码器和语言模型,再在自己的数据集上训练,看看是否有更好的结果。
这个项目提供了模型权重组合的方法,用中文数据集对模型进行训练,可以完成基本的中文图文问答。
今天介绍一下我的另外一个开源项目:Zero-Qwen-VL。
这个项目项目的初衷是想训练一个对中文支持更友好的图文多模态模型,所以挑了qwen-vl的图片编码器,语言模型选择了qwen2,做完之后才发现这不是和qwen-vl差不多嘛。不过大家可以学习这个思路和流程,可以组合不同的图片编码器和语言模型,再在自己的数据集上训练,看看是否有更好的结果。
这个项目提供了模型权重组合的方法,用中文数据集对模型进行训练,可以完成基本的中文图文问答。