火速整合Gitee AI,每天额度免费用

180 阅读2分钟

Gitee AI上线,不但支持Qwen2.5-72B-Instruct这样的文本模型,还支持whisper-large、ChatTTS等一众语音模型,最主要每天还有100次免费调用额度,我日常使用是足够了,不知道是不是以后一直都有这个活动。

马上动手把Gitee AI整合到自己开发的Local Agents中。下面就看看用Gitee AI的效果如何

加入模型支持

由于兼容OpenAI,我三下五除二就搞定了,其中最花时间的是居然是修改Gitee AI的svg图标😅,由于是新产品,网上没有现成的,只有自己动手了(时间花在临时学svg,这个AI真干不好)。

image.png

文本模型

来看看效果,首先看看Qwen2.5-72B-Instruct,现在Gitee AI正在做活动,每天都有100次免费调用机会,我试了一下,和我的刚刚购买的付费KEY的效果是一致的。

image.png

来看看Qwen2.5-72B-Instruct的代码能力如何,要求他设计个视频查看的界面,看上去还不错,我5秒钟可写不出来。

image.png

语音识别

看看语音识别功能,由于兼容OpenAI,我也一会儿就整合了进来,用前几天的例子,看看尹卡卡说了啥

image.png

如上图:我用Gitee AI的whisper-large做了语音识别,并用Qwen2.5-72B-Instruct进行翻译工作,相当的顺利,由于用的还是免费额度,这是相当的爽了。

可惜美中不足是目前whisper-large尚不支持response_format参数,无法生成verbose_json格式(每句话携带start、end的时间戳),这样就没办法制作精准字幕了,强烈希望Gitee AI能支持这一功能。

语音合成

再来把尹卡卡的讲话再转为播客,反正每天的免费额度不用白不用,ChatTTS、Fish Speech、CosyVoice、speecht5_tts每个模型都试试。

image.png

每个模型都测试了一下

  • ChatTTS语音生动
  • Fish Speech、CosyVoice语音品质高,Fish Speech的语调变化更丰富一些
  • speecht5_tts我就不评论了,免费的时候大家可以用一下

当然听感这个东西很主观,大家有兴趣可以自己评估一下。

总结

Gitee AI相比同类竞品来说文档齐全,简洁易用,我整个整合过程没有超过一小时,美中不足有2点,

  • 有部分模型的特色参数支持的还不完善,这个上面我已经提到了。
  • 模型库里面没有多模态的模型(也可能是我没看见)。