前一阵闹得沸沸扬扬的IP归属地,到底是怎么实现的?

16,509 阅读5分钟

大家好,我是王老师,一直在准备写这篇稿子,但是事情太多一直耽误了,导致一直拖一直拖,结果就从最近变成了前一阵子。这下好了,不会有人说我蹭热度了。

image.png

image.png

大家都知道,前一阵子抖音和微博开始陆续上了IP归属地的功能,引起了众多热议。有大批在国外的老铁们开始"原形毕露",被定位到国内来,那么IP归属到底是怎么实现的呢?那么网红们的归属地到底对不对呢?这篇文章帮大家揭晓。

一.第一步:如何拿到用户的真实IP

大家都知道,我们一般想访问公网,一般必须具备上网环境,那么我们开通宽带之后,运营商会给我们分配一个IP地址。一般IP地址我们都是自动分配的。所以我们不知道本机地址是什么?想知道自己的ip公网地址,可以通过百度搜索IP查看自己的ip位置 image.png

那么问题来了。百度是怎么知道我的公网IP的?

一般情况,用户访问我们的服务网络拓扑如下:

image.png

用户通过域名或者IP访问门户,然后请求到后端服务。这样的话后端服务就可以通过request.getRemoteAddr();方法获取用户的ip。

SpringBoot获取IP如下:

@RestController
public class IpController {
​
    @RequestMapping("/getIp")
    public String hello(HttpServletRequest request) {
        String ip = request.getRemoteAddr();
        System.out.println(ip);
        return ip;
    }
}

将服务部署到服务端,然后请求该接口,即可获取IP信息,如下图:

image.png

但是为什么我们获取的IP和百度搜出来的不一样呢?

1.1内网IP和外网IP

打开电脑CMD,输出ipconfig命令,查看本机的IP地址,发现我们本机地址和程序获取的地址是一样的。

image.png

其实,网络也是分内网IP和公网IP的。内网也成局域网。对于像公司,学校这种一般内部建立自己的局域网,对内部的信息进行传输时,都是通过内网相互通讯,建立局域网内网通讯节省了公网IP资源,并且通信效率也有很大的提升。当然非局域网内的设备则无法向内网的设备发送信息。

但是机器想要访问互联网的资源时,则需要机器拥有外网带宽,也就是我们所说的分配公网IP,负责也是无法访问互联网资源的。

image.png

因此,我们把服务部署在同一局域网内,客户端使用内网进行通信,因此获取的就是内网IP地址。但访问百度是需要使用公网访问,因此百度搜出来的IP就是公网IP地址。

1.2.为什么有时候获取到的客户端IP有问题?

当我们兴致勃勃的把IP获取的功能搞上去之后,发现获取的IP都是同一个?这是为什么呢?不可能只是一个用户在访问呀?查询IP信息之后发现,原来是我们部署的一台负载均衡的IP地址。

image.png

那么后端服务获取的地址都是负载均衡如nginx的地址。那么怎么透过负载均衡获取真实的地址呢?

透明的代理服务器在将客户端的访问请求转发到下一环节的服务器时,会在HTTP的请求头中添加一条X-Forwarded-For记录,用于记录客户端的IP,格式为X-Forwarded-For:客户端IP。如果客户端和服务器之间有多个代理服务器,则X-Forwarded-For记录使用以下格式记录客户端IP和依次经过的代理服务器IP:X-Forwarded-For:客户端IP, 代理服务器1的IP, 代理服务器2的IP, 代理服务器3的IP, ……

因此,常见的Web应用服务器可以通过解析X-Forwarded-For记录获取客户端真实IP。

public static String getIp(HttpServletRequest request) {
    String ip = request.getHeader("x-forwarded-for");
​
    if (ip == null || ip.length() == 0 || "unknown".equalsIgnoreCase(ip)) {
        ip = request.getRemoteAddr();
    } else if (ip.length() > 15) {
        //多次反向代理后会有多个ip值,第一个ip才是真实ip
        String[] ips = ip.split(",");
        for (int index = 0; index < ips.length; index++) {
            String strIp = ips[index];
            ip = strIp;
            break;
        }
    }
    return ip;
}

第二步:如何解析IP

IP来了,我们怎么解析呢:

IP的解析一般都要借助第三方软件使用了,第三方一般也分为离线库和在线库

  • 离线库支持的有如:IPIP,使用离线库的好处是解析效率高,性能好,问题就是IP库要经常更新。如果大家需要我私信我可以提供给大家比较新版本的ip库。
  • 在线库则各大云厂商接口能力都有支持。在线版本的好处是更新即时,问题就是接口查询性能和使用TPS有要求。

以下演示借助IP库离线IP解析方式:

借助IP库就可以帮我们实现ip地址的解析。

public static void main(String[] args) {
    IpAddrInfo IpAddrInfo = IPAddr.getInstance().putLocInfo("114.103.71.226");
    System.out.println(JSONObject.toJSONString(IpAddrInfo));
}
​
public IpAddrInfo putLocInfo(String ip) {
    IpAddrInfo info = new IpAddrInfo();
    if (StringUtils.isNotBlank(ip)) {
        try {
            DistrictInfo addrInfo = db.findInfo(ip, "CN");
            info.setCity(addrInfo.getCityName());
            info.setCountry(addrInfo.getCountryName());
            info.setCountryCode(addrInfo.getChinaAdminCode());
            info.setIsp(addrInfo.getIsp());
            info.setLat(addrInfo.getLatitude());
            info.setLon(addrInfo.getLongitude());
            info.setProvince(addrInfo.getRegionName());
            info.setTimeZone(addrInfo.getTimeZone());
            System.out.println(addrInfo.toString());
        } catch (IPFormatException e) {
            e.printStackTrace();
        } catch (InvalidDatabaseException e) {
            e.printStackTrace();
        }
    }
    return info;
}

image.png

其实IP的定位解析其实就是一个巨大的位置库,同时IP数量也是有限制的,因此同一个Ip也可能会分配到不同的区域,因此影响IP解析位置准确率的有几个方面 1、位置库不精准,导致解析偏差大或者地区字段确实 2、离线库更新不及时 并且海外的一般有专门的离线库去支持,使用同一套离线库并不一定支持海外IP的解析,所以本次受影响最大的海外网红门被解析到中国各个地区,被大家认为造假,当然也包括真的有造假。不过上线了这个功能也是有好处的,至少网络不是法外之地,大家也要有序的健康的冲浪,拒绝网络暴力。

好了,今天就到这里,我是王老狮,一个有想法有内涵的工程狮,关注我,学习更多技术知识。