最近发布的grok 4相比于之前,有哪些创新之处?

255 阅读2分钟

Grok 4 的主要创新概述

最近发布的Grok 4 是xAI公司推出的最新AI模型,与之前的版本(如Grok 3)相比,在多个方面进行了显著创新。这些改进主要聚焦于推理能力、多模态处理、计算资源和专业工具支持,旨在提升模型在复杂任务中的表现。以下是关键创新点的详细说明。

1. 更大的上下文窗口和计算能力

  • Grok 4 的上下文窗口扩展至130K+ 或256K tokens,比前代模型翻倍,支持更长的对话和复杂数据分析
  • 训练使用xAI的Colossus超级计算机,计算资源提升约10倍,实现更高级的科学家级推理和逻辑处理。

2. 多模态能力和输入支持

  • 新增多模态功能,能处理文本、图像,并计划支持视频输入,这在前代模型中较为薄弱。
  • 引入Grok 4 Voice,提供更自然的语音交互,减少中断,提升用户体验。

3. 专业工具和编码支持

  • 内置Grok 4 Code变体,专为开发者设计,支持代码编写、调试和解释,可直接粘贴整个源代码文件进行修复。
  • 支持结构化输出和函数调用,便于集成到复杂工作流程中。

4. 多代理系统和性能优化

  • 推出Grok 4 Heavy版本,使用多代理系统进行并行推理,如“学习小组”般比较输出,提高准确性和问题解决能力。
  • 在基准测试中表现出色,例如在Humanity’s Last Exam上得分约38.6%,超越OpenAI的o3和Google的Gemini 2.5 Pro1。

5. 实时数据访问和安全增强

  • 集成DeepSearch工具,从网络(尤其是X平台)拉取实时数据,支持实时更新和互联网文化理解,如 meme 和俚语。
  • 提供企业级安全功能,确保数据保护和合规,适用于医疗、金融等行业。

这些创新使Grok 4 在推理、编码和多领域应用中更具竞争力,但也引入了更高的订阅费用,如SuperGrok Heavy计划每月300美元