领新北斗车辆动态监控系统通过ollama接入本地Gemma4大模型,E4B对比E2B,小项目整合可以考虑Gemma4:E2B

0 阅读2分钟

Gemma 4Google DeepMind2026 年 4 月 2 日 发布的 第四代开源大模型家族,是当前谷歌最强、参数效率极高的开源 AI 模型。

在本次尝试分别部署了E4B与E2B,部署环境如下:

  1. Gemma4:E4B,笔记本电脑,i7-11800H,16G内存,Win10
  2. Gemma4:E2B,macmini4,10核16G

在今天之前没有任何的AI开发经验,只是想体验一下,看看文档就尝试写个工具,源码如下:


package com.lingx.jt808.ai.impl;

import java.util.List;
import java.util.Map;

import org.springframework.beans.factory.annotation.Autowired;
import org.springframework.jdbc.core.JdbcTemplate;
import org.springframework.stereotype.Component;

import com.alibaba.fastjson.JSON;
import com.lingx.jt808.ai.IAiTool;
import com.lingx.jt808.ai.annotation.Prop;
import com.lingx.jt808.core.service.JT808CommonService;
import com.lingx.web.api.IApi;
@Component
public class GetCarInfo implements IAiTool{
	@Autowired
	private JdbcTemplate jdbcTemplate;
	@Autowired
	private JT808CommonService commonService;
	
	@Prop(type="string",description="车牌号码,必须使用参数名:carno,例如:闽C966EK、京D123456、12345678912、18000032600")
	private String carno;
	
	@Override
	public String getName() {
		return "get_carinfo";
	}

	@Override
	public String getDescription() {
		return "用于查询车辆当前信息。用户提问'车牌号码'时必须使用此工具,参数名必须是carno。";
	}

	@Override
	public String call(Map<String,Object> map,Map<String,Object> params) {

		String language=IApi.getParamString(params, "language", "zh-CN");
		String carno=map.get("carno").toString();
		List<Map<String,Object>> list=this.jdbcTemplate.queryForList("select id from tgps_car where carno=? or tid=?",carno,carno);
		if(list.size()==0)return "无效的车牌号码";
		Map<String,Object> map111=this.commonService.getLast0x0200Data(list.get(0).get("id").toString());
		this.commonService.addJT808Info(map111, language, true);
		return JSON.toJSONString(map111);
	}

}

image.png 以上是Gemma4:E2B的输出效果,每次应答需要20多秒

image.png 以上是Gemma4:E4B的输出效果,每次应答需要1分钟多

按照目前的体验来讲Gemma4真的是强,做好历史消息缓存与工具缓存就跟普通AI聊天差不多,不智障;不过如上所示,目前所需的算力服务器仍是一笔不小的开销,在成本有限的情况下可以选择E2B。

qrcode.png