Gemma 4 是 Google DeepMind 于 2026 年 4 月 2 日 发布的 第四代开源大模型家族,是当前谷歌最强、参数效率极高的开源 AI 模型。
在本次尝试分别部署了E4B与E2B,部署环境如下:
- Gemma4:E4B,笔记本电脑,i7-11800H,16G内存,Win10
- Gemma4:E2B,macmini4,10核16G
在今天之前没有任何的AI开发经验,只是想体验一下,看看文档就尝试写个工具,源码如下:
package com.lingx.jt808.ai.impl;
import java.util.List;
import java.util.Map;
import org.springframework.beans.factory.annotation.Autowired;
import org.springframework.jdbc.core.JdbcTemplate;
import org.springframework.stereotype.Component;
import com.alibaba.fastjson.JSON;
import com.lingx.jt808.ai.IAiTool;
import com.lingx.jt808.ai.annotation.Prop;
import com.lingx.jt808.core.service.JT808CommonService;
import com.lingx.web.api.IApi;
@Component
public class GetCarInfo implements IAiTool{
@Autowired
private JdbcTemplate jdbcTemplate;
@Autowired
private JT808CommonService commonService;
@Prop(type="string",description="车牌号码,必须使用参数名:carno,例如:闽C966EK、京D123456、12345678912、18000032600")
private String carno;
@Override
public String getName() {
return "get_carinfo";
}
@Override
public String getDescription() {
return "用于查询车辆当前信息。用户提问'车牌号码'时必须使用此工具,参数名必须是carno。";
}
@Override
public String call(Map<String,Object> map,Map<String,Object> params) {
String language=IApi.getParamString(params, "language", "zh-CN");
String carno=map.get("carno").toString();
List<Map<String,Object>> list=this.jdbcTemplate.queryForList("select id from tgps_car where carno=? or tid=?",carno,carno);
if(list.size()==0)return "无效的车牌号码";
Map<String,Object> map111=this.commonService.getLast0x0200Data(list.get(0).get("id").toString());
this.commonService.addJT808Info(map111, language, true);
return JSON.toJSONString(map111);
}
}
以上是Gemma4:E2B的输出效果,每次应答需要20多秒
以上是Gemma4:E4B的输出效果,每次应答需要1分钟多
按照目前的体验来讲Gemma4真的是强,做好历史消息缓存与工具缓存就跟普通AI聊天差不多,不智障;不过如上所示,目前所需的算力服务器仍是一笔不小的开销,在成本有限的情况下可以选择E2B。