在库拉c.kulaai.cn上做开发测试的时候,顺手抓了一下Gemini在国内的网络表现数据。结果发现,卡顿的原因比我预想的层次更多。写这篇从网络层和技术角度拆解一下,顺便分享一个实测能用的解决方案。
先摆数据:到底卡成什么样
测试环境:电信500M企业宽带,北京节点,测试时间2026年4月10日工作时段。
连续跑了30次对Gemini官网的请求,记录了TCP连接时间、TLS握手时间、首字节时间(TTFB)和完整响应时间。
结果:
- TCP连接失败或超时:13次,43%
- TTFB超过3秒:8次,27%
- 正常响应(TTFB<1.5s):9次,30%
换了个联通网络再测,超时率降到35%,但TTFB中位数依然在2.8秒左右。
结论很明确:这不是带宽问题,是链路问题。
第一层:物理延迟无法回避
Gemini服务端主要在Google的美国和欧洲数据中心。从北京到美西的物理光纤距离大约1万公里,光速传播的理论延迟就在50ms以上。加上路由中转、协议握手,实际单程延迟通常在150到200ms。
对于普通网页浏览,这个延迟还算可接受。但对于AI对话这种需要服务端逐步生成token的场景,每一次token传输都要走一个来回,累积延迟非常明显。
一个2000字的回答,如果每个token都要等待一次网络往返,体感上的卡顿是被放大的。
第二层:国际出口是最大瓶颈
物理延迟只是底噪,真正让体验崩掉的是国际出口带宽的拥堵。
国内到海外的互联网出口带宽是有限资源,由几条海底光缆承载。高峰期(晚8点到11点)的拥堵程度可以参考一个数据:我用traceroute追踪了请求路径,高峰期到美西节点的丢包率在5%到8%之间,凌晨则低于1%。
丢包意味着TCP重传,重传意味着延迟翻倍。5%的丢包率在体验上可以表现为响应时间增加2到3倍。
更麻烦的是,出口拥堵不是线性的,而是会触发TCP拥塞控制的连锁反应。一旦检测到丢包,发送窗口会被急剧缩小,吞吐量断崖式下降。
第三层:路由绕转增加不确定性
由于没有国内直连节点,请求的路由路径是不确定的。我用mtr跑了20次路由追踪,发现路径主要有两条:
路径A:北京 → 上海出口 → 日本东京 → 美国圣何塞 → Google数据中心,共11跳。
路径B:北京 → 广州出口 → 香港 → 日本大阪 → 美国洛杉矶 → Google数据中心,共13跳。
路径B比路径A多了两跳,延迟高出约80ms。而且路径选择是动态的,同一分钟内的两次请求可能走不同路径,导致响应时间波动很大。
第四层:服务端策略影响
谷歌对不同地区IP的处理策略有差异。从非支持地区的IP发起请求,观察到的行为包括:
- 首次连接时有额外的重定向(增加一次RTT)
- 流式响应的chunk间隔被拉大
- 部分高负载时段直接返回429或503
这些策略本身是合理的资源管理手段,但对国内用户来说,叠加前面三层问题后,体验就变得很难接受了。
解决方案对比
针对上述问题,开发者常用的几种方案:
自建代理:可控性最强,但需要维护海外服务器,成本不低,而且高峰期同样受限于出口带宽。适合团队内部使用,不适合个人。
官方API + 自建前端:绕过了网页端的一些限制,但API调用同样受网络链路影响。好处是可以通过连接池和重试机制做一定优化。
国内聚合中转平台:在国内部署接入节点,通过优化后的专线链路连接模型服务端。用户无需任何配置。
实测第三种方案的实际表现
重点测了库拉c.kulaai.cn。测试环境和上面完全一致。
同样的30次请求测试:
- 全部成功建立连接,0次超时
- TTFB中位数:1.1秒
- 完整响应中位数:2.3秒
- 最大响应时间:3.8秒(对比官网最大超时>30秒)
做了一下traceroute,请求路径是:北京 → 平台国内节点 → 专线出口 → 模型服务端,跳数压缩到了5跳以内,而且路径固定,延迟波动很小。
连续对话测试:跑了15轮中等长度的对话,每轮响应时间稳定在1.0到1.4秒之间,没有出现官网那种越聊越卡的情况。
功能方面,Gemini 3 Pro、GPT-4o、Claude 3.5三个模型都支持,切换无感知延迟。文件上传和联网搜索功能正常。
对开发工作流的影响
速度提升不只是"快了"这么简单,它改变了几个具体的开发场景:
模型评测:以前做多模型对比,每轮测试要等半天,一次完整对比可能要花一两个小时。现在同样的测试可以在十几分钟内完成,迭代速度完全不同。
Agent调试:Agent开发中最痛苦的事之一就是等模型响应。官网卡顿时,一个需要多步推理的Agent任务可能因为某一步超时而整体失败。稳定的低延迟让调试流程可以连续进行。
长文档处理:Gemini的长上下文是核心卖点,但如果加载一份文档要等30秒,这个功能的实用价值就大打折扣。流畅的访问体验让长文本分析变成了日常可用的能力。
写在最后
从网络层分析完Gemini在国内卡顿的原因之后,结论其实很清楚:这不是短期内能从根源解决的问题,它涉及国际网络架构、出口带宽分配、服务区域策略等多个系统性因素。
但技术上总有可行的绕行方案。找一个在国内有接入节点的聚合平台,是最直接的方式。不需要折腾网络配置,不需要申请API Key,开发者打开就能用。
如果你也在被Gemini的响应速度拖慢工作节奏,值得花两分钟试一下,差距是量级的。