AIT 轻量大模型服务测试工具

197 阅读2分钟

作为一个独立开发者,面对市面上越来越多的AI模型(GPT-4、Claude、Gemini等),我经常纠结:到底哪个模型最适合我的项目?性能怎么样?性价比如何?

以前测试不同模型需要写各种不同的代码,手动记录数据,既麻烦又缺乏系统性。直到我发现了AIT (AI 模型性能测试工具),一行命令就能解决这些问题。

image.png

工具特点

安装简单:下载二进制文件即可使用

使用方便:一行命令测试多个模型

数据全面:提供TTFT、TPS、响应时间等关键指标

多格式报告:支持JSON和CSV格式,方便分析

快速开始

安装

# macOS (Apple Silicon)
wget https://github.com/yinxulai/ait/releases/latest/download/ait-darwin-arm64
chmod +x ait-darwin-arm64
sudo mv ait-darwin-arm64 /usr/local/bin/ait

使用

# 设置环境变量
export OPENAI_API_KEY="sk-your-api-key"
export ANTHROPIC_API_KEY="sk-ant-your-api-key"

# 测试多个模型
ait --models="gpt-4,claude-3.5-sonnet,gemini-pro" --count=20 --report
ait --models="gpt-4-turbo,claude-3.5-sonnet,gemini-2.0-flash" --concurrency=5 --count=50 --report

测试结果示例

工具会输出详细的性能数据:

  • TTFT (首字节时间):影响用户感知的响应速度
  • TPS (每秒处理令牌数):吞吐量指标
  • 平均响应时间:综合性能表现
  • 成功率:稳定性指标

有了这些数据,可以根据项目需求选择合适的模型:

  • 速度优先选择Gemini-Pro
  • 综合性能选择Claude-3.5-Sonnet
  • 根据预算和性能需求权衡

其他实用功能

  • 网络诊断:检测DNS、TCP连接、TLS握手时间
  • 压力测试:支持调整并发数测试不同负载
  • 多协议支持:自动处理OpenAI和Anthropic协议差异
  • 报告生成:生成JSON和CSV格式的详细报告

总结

AIT解决了AI模型选择中的几个核心问题:

  • 统一的测试方式,避免重复编码
  • 客观的性能数据,支持科学决策
  • 详细的报告输出,便于分析和存档

项目地址github.com/yinxulai/ai…

如果你也在纠结AI模型选择,这个工具值得一试。