Pangea：卡内基梅隆大学开源的多语言多模态大语言模型Pangea是由卡内基梅隆大学团队开发的多语言多模态大型语言模型

❤️ 如果你也关注 AI 的发展现状，且对 AI 应用开发非常感兴趣，我会每日跟你分享最新的 AI 资讯和开源应用，也会不定期分享自己的想法和开源实例，欢迎关注我哦！

🥦 微信公众号｜搜一搜：蚝油菜花 🥦

🚀 快速阅读

多语言支持：能理解和生成39种不同语言的文本。
多模态理解：除文本外，能处理和理解图像。
跨文化覆盖：在训练中包含与文化相关的多模态任务。

Pangea是由卡内基梅隆大学团队推出的多语言多模态大型语言模型（LLM），旨在提升全球语言和文化多样性的覆盖。模型包含600万条指令的多样化数据集，支持39种语言，包含高质量英文指令、机器翻译指令及文化相关任务。

Pangea基于包含14个数据集、覆盖47种语言的PangeaABench评估套件进行性能评估。Pangea在多语言和文化背景下的性能超越现有开源模型（如Llava-1.5-7B、Llava-Next-7B）。研究发现英语数据比例、语言流行度和多模态训练样本数量对性能有显著影响。

公众号: 蚝油菜花 - Pangea

git clone https://github.com/neulab/Pangea.git

cd Pangea/train/LLaVA-NeXT
pip install -e ".[train]"

在安装了所需包后，可以运行示例Python代码来使用Pangea-7B。

cd Pangea/predict
python predict_all.py # 可以评估多模态输入和纯文本输入
python predict_multimodal.py # 可以评估多模态输入
python predict_text_only.py # 可以评估纯文本输入

🥦 微信公众号｜搜一搜：蚝油菜花 🥦