【大模型】大模型基础知识学习(二)

8 阅读3分钟

当前国内外最火的几个大模型,及其特点和所属公司:

🌟 国外最火大模型

1. OpenAI - ChatGPT(GPT-4系列)

  • 特点:通用能力最强,多模态(文本、图像识别)、推理能力强,生态应用最广泛
  • 火爆点:掀起AI浪潮的引领者,功能全面

2. Google - Gemini(原Bard)

  • 特点:原生多模态设计,支持超长上下文(百万token),深度集成谷歌搜索、YouTube等生态
  • 火爆点:Google全力打造,对标GPT-4

3. Anthropic - Claude

  • 特点:以“安全、对齐”著称,超长上下文(20万-100万token),擅长长文本处理,编程能力强
  • 火爆点:企业级应用首选,安全可靠

4. Meta - Llama系列(目前Llama 3)

  • 特点:开源模型代表,性能优异,社区生态丰富
  • 火爆点:开源社区最爱,开发者大量基于它微调

5. xAI(马斯克)- Grok

  • 特点:实时接入X平台数据,回答风格幽默、叛逆,可实时获取最新信息
  • 火爆点:马斯克效应+社交媒体实时性

6. Microsoft - Copilot

  • 特点:深度集成Windows、Office、Bing,生产力工具代表
  • 火爆点:办公场景普及最快

国内最火大模型

1. 深度求索 - DeepSeek

  • 特点:免费使用,上下文1M token(可处理《三体》三部曲体量),推理能力强,支持联网搜索、文件上传
  • 火爆点:国内技术领先,完全免费,体验出色

2. 百度 - 文心一言

  • 特点:国内最早发布,多模态理解,深度集成百度搜索生态
  • 火爆点:先发优势,用户基数大

3. 字节跳动 - 豆包

  • 特点:多端覆盖(App、Web、PC),语音交互流畅,集成抖音生态
  • 火爆点:年轻用户多,使用场景丰富

4. 阿里巴巴 - 通义千问

  • 特点:开源多个尺寸模型,电商场景优化,代码能力强
  • 火爆点:企业级应用多,开发者友好

5. 腾讯 - 混元(Hunyuan)

  • 特点

    • 多模态能力(文本、图像、视频理解与生成)
    • 深度集成微信、QQ、腾讯云等国民级生态
    • 企业级应用扎实(广告创意、游戏NPC、金融客服)
    • 腾讯生态内无处不在的“幕后功臣”
  • 火爆点:坐拥微信/QQ海量用户,场景覆盖最广,B端影响力深厚

6. 智谱AI - 智谱清言(ChatGLM)

  • 特点:开源较早,学术圈认可度高,中英双语表现均衡
  • 火爆点:技术社区口碑好

7. 月之暗面 - Kimi

  • 特点:超长上下文(最初200万tokens),专注长文本处理、文档分析
  • 火爆点:长文本处理能力突出

8. 科大讯飞 - 讯飞星火

  • 特点:语音技术强,多模态能力,教育医疗场景深耕
  • 火爆点:语音交互体验好

💡 简单总结

  • 国外三巨头:OpenAI(GPT-4)、Google(Gemini)、Anthropic(Claude)
  • 国内三强:DeepSeek(深度求索)、百度(文心)、字节(豆包)
  • 特色选手:Meta Llama 3(开源之王)、Kimi(长文本)、Grok(实时+幽默)