AIT 轻量大模型服务测试工具批量测试 OpenAI 协议和 Anthropic 协议的 AI 模型性能指标。支持 TT

作为一个独立开发者，面对市面上越来越多的AI模型（GPT-4、Claude、Gemini等），我经常纠结：到底哪个模型最适合我的项目？性能怎么样？性价比如何？

以前测试不同模型需要写各种不同的代码，手动记录数据，既麻烦又缺乏系统性。直到我发现了AIT (AI 模型性能测试工具)，一行命令就能解决这些问题。

工具特点

安装简单：下载二进制文件即可使用

使用方便：一行命令测试多个模型

数据全面：提供TTFT、TPS、响应时间等关键指标

多格式报告：支持JSON和CSV格式，方便分析

快速开始

安装

# macOS (Apple Silicon)
wget https://github.com/yinxulai/ait/releases/latest/download/ait-darwin-arm64
chmod +x ait-darwin-arm64
sudo mv ait-darwin-arm64 /usr/local/bin/ait

使用

# 设置环境变量
export OPENAI_API_KEY="sk-your-api-key"
export ANTHROPIC_API_KEY="sk-ant-your-api-key"

# 测试多个模型
ait --models="gpt-4,claude-3.5-sonnet,gemini-pro" --count=20 --report

ait --models="gpt-4-turbo,claude-3.5-sonnet,gemini-2.0-flash" --concurrency=5 --count=50 --report

测试结果示例

工具会输出详细的性能数据：

TTFT (首字节时间)：影响用户感知的响应速度
TPS (每秒处理令牌数)：吞吐量指标
平均响应时间：综合性能表现
成功率：稳定性指标

有了这些数据，可以根据项目需求选择合适的模型：

速度优先选择Gemini-Pro
综合性能选择Claude-3.5-Sonnet
根据预算和性能需求权衡

其他实用功能

网络诊断：检测DNS、TCP连接、TLS握手时间
压力测试：支持调整并发数测试不同负载
多协议支持：自动处理OpenAI和Anthropic协议差异
报告生成：生成JSON和CSV格式的详细报告

总结

AIT解决了AI模型选择中的几个核心问题：

统一的测试方式，避免重复编码
客观的性能数据，支持科学决策
详细的报告输出，便于分析和存档

项目地址：github.com/yinxulai/ai…

如果你也在纠结AI模型选择，这个工具值得一试。