开箱即用-移动网络IPv6浓度检测工具

3,931 阅读11分钟

一、背景

关于加快推进互联网协议第六版(IPv6)规模部署和应用工作的通知

到2023年末,基本建成先进自主的 IPv6 技术、产业、设施、应用和安全体系,形成市场驱动、协同互促的良性发展格局。IPv6 活跃用户数达到7亿,物联网 IPv6 连接数达到2亿。移动网络IPv6流量占比达到50% ,城域网IPv6流量占比达到15%。

名称解释

移动网络 IPv6 流量占比(浓度) =(4G 网络IPv6 流量+5G网络IPv6 流量)/(4G 网络总流量+5G 网络总流量)。

测试指标: 互联网应用(APP)IPv6 浓度指在移动终端上使用APP10 分钟内所通过 IPv6 协议承载的网络流量占全部网络流量 - 5 - 的比例,取三次测试的平均值。

IPv4地址: 使用32位正整数表示,需要4字节存储,可以提供约2^32≈4.3x10^9个地址;为了方便记忆采用了点分十进制的标记方式,如114.114.114.114就是一个IPv4地址。

IPv6地址: 采用128位正整数表示,需要16字节存储,可以提供约2^128≈3.4x10^38个地址;采用了冒号十六进制法来表示IPv6地址,它将每个16位的值用十六进制表示,各值之间用冒号分隔,如2001:0DB8:0000:0023:0008:0800:200C:417A就是一个IPv6地址

二、效果展示

这里以 App内 IPv6 浓度检测为例,提高移动网络的 IPv6 浓度,关键是找到App内请求的接口域名中还有哪些还没有支持 IPv6。

该工具的关键点是通过获取抓包数据,通过对抓包数据分析聚合,然后找到走 IPv4 的域名列表,通过该工具生成的最终产物如下:

页面IPv6流量占比IPv4域名列表
京喜特价99.87%域名:gold.jd.com,数据大小:1.52kb,占比:0.01% 域名:httpfereport.jd.com,数据大小:0.10kb,占比:0.00% 域名:fd.3.cn,数据大小:-0.00kb,占比:-0.00% 域名:mcard.jd.com,数据大小:6.80kb,占比:0.04% 域名:gia.jd.com,数据大小:0.98kb,占比:0.01% 域名:blackhole-m.m.jd.com,数据大小:1.16kb,占比:0.01% 域名:lbsgwh5.m.jd.com,数据大小:0.09kb,占比:0.00% 域名:cactus.jd.com,数据大小:3.04kb,占比:0.02% 域名:sp-desk.jd.com,数据大小:1.14kb,占比:0.01% 域名:sh.jd.com,数据大小:-0.05kb,占比:-0.00% 域名:im-x.jd.com,数据大小:0.01kb,占比:0.00% 域名:blackhole.m.jd.com,数据大小:1.01kb,占比:0.01% 域名:sdkfp.jd.com,数据大小:3.15kb,占比:0.02% 域名:mllog.jd.com,数据大小:0.22kb,占比:0.00% 域名:aks.jdpay.com,数据大小:0.02kb,占比:0.00% 域名:gs-loc-cn.apple.com,数据大小:0.08kb,占比:0.00% 域名:ccc-x.jd.com,数据大小:0.05kb,占比:0.00% 域名:storage.jd.com,数据大小:-0.00kb,占比:-0.00% 域名:shop-license.jd.com,数据大小:1.39kb,占比:0.01% 域名:rjsb-token-m.jd.com,数据大小:0.52kb,占比:0.00% 域名:daily-redpacket.jd.com,数据大小:1.28kb,占比:0.01%

有了这一份数据,整个App 的 IPv6 的流量占比及整改方向一目了然。

三、自检工具使用

这里以 京喜特价 App为例来实践演习。

京喜特价(原京东特价版)是京东旗下满足大众消费需求的特价购物平台,以“省出新生活”为价值主张,为百姓提供质优价低的商品,让大家享受实惠购物、赚钱乐趣的同时也体验到京东品质服务。

3.1、环境准备

先保障客户端支持 IPv6 地址,这样才有可能对等连接后台的 IPv6 地址

最差的情况下是:有些公司可能没有 Wi-Fi 支持 IPv6 环境,需要使用 5G 网络进行检测。

硬件要求:

需要准备两台手机( iPhoneA 支持4/5G网络、iPhoneB 安装好检测的App)、一台 Mac电脑

软件要求:

Mac电脑安装 whistle 抓包环境(其他抓包环境类似)

3.1.1、IPv6 网络检测

iPhoneA 在手机浏览器打开 test-ipv6.com 后,会提示你当前网络是否支持 IPv6 地址,如果同时支持 IPv4/6,正常通讯会优先使用 IPv6,如下图:

ipv6test.png

3.1.2、测试设备支持 IPv6

iPhoneA 使用 5G 流量开启热点,Mac 电脑和 iPhoneB 都连接到该热点,并且 iPhoneB 代理请求到 Mac 电脑上:

env1.png

3.1.3、并确保 Mac 电脑和 iPhoneB 都支持 IPv6 环境,Mac 电脑上需要在网络配置 IPv6 为自动:

env2.png

然后在 Mac 电脑进行测试是否已经支持:

env3.png

3.2、数据采集及处理

装有 App 的设备 iPhoneB 支持 IPv6 网络环境,具备抓包环境的 Mac电脑就绪后,接下来就是对数据的采集工作。

3.2.1、生产数据

使用 iPhoneB 对目标App进行各种页面进行测试,这里最好是每一个页面及涉及到网络请求的地方都要验证一下,保证数据相对完善,然后导出所有的抓包数据,命名为:native.har

3.2.2、数据整合

# 遍历并分析.har文件
# 遍历当前目录下的所有.har文件(HTTP归档文件,用于记录web浏览器和网站之间的交互)。
# 对每个.har文件进行解析,提取出每个请求的URL、响应状态、传输大小、服务器IP地址等信息。
# 对服务器IP地址进行检查,判断其是IPv4还是IPv6,并计算IPv6数据的大小和总数据大小的比例。
# 对于IPv4的请求,提取出其域名,并计算每个域名的数据大小。
# 将每个文件的页面标题、IPv6数据占比、未支持IPv6的域名信息等数据保存下来。
# 最后,将所有文件的这些数据导出为一个Excel文件。

# 脚本使用方式:
# python3 analysis_ipv6.py --d '/Users/denglibing/Desktop/京喜特价H5页面IPv6验证/priorityPage'
# 或者
# python3 analysis_ipv6.py --directory '/Users/denglibing/Desktop/京喜特价H5页面IPv6验证/priorityPage'
# 生成的数据在传入的路径中,output.xlsx


import argparse
import json
import os
import glob
import ipaddress
# 获取url的domain
from urllib.parse import urlparse
# 导出表格数据
import pandas as pd
from openpyxl import load_workbook
from openpyxl.styles import Alignment


# IPv6占比基线
ipv6_baseline = 1.0


def get_domain(url):
    return urlparse(url).netloc


def check_ip_address(ip):
    try:
        ip_obj = ipaddress.ip_address(ip)
        return ip_obj.version == 6
    except ValueError:
        print("无效的IP地址")
        return False


def calculate_sizes(entries):
    domains = {}
    sizes = 0
    ipv6sizes = 0

    for entry in entries:
        url = entry['request']['url']
        response = entry['response']
        size = response.get('_transferSize', response.get(
            'bodySize', 0) + response.get('headersSize', 0))
        if 'serverIPAddress' in entry:
            serverIPAddress = entry['serverIPAddress']
            if check_ip_address(serverIPAddress):
                ipv6sizes += size
            else:
                domain = get_domain(url)
                domains[domain] = domains.get(domain, 0) + size
        if size > 0:
            sizes += size
    return domains, sizes, ipv6sizes


def print_results(domains, sizes, ipv6sizes):
    ipv6point = ipv6sizes / sizes * 100
    print("IPv6 数据大小:{:.2f}kb".format(ipv6sizes / 1024))
    print("总数据大小:{:.2f}kb".format(sizes / 1024))
    print("IPv6 数据占比:{:.2f}%".format(ipv6point))
    print("⚠️  未支持IPv6的域名信息:")
    ipv4info = ''
    for key, value in domains.items():
        info = "域名:{},数据大小:{:.2f}kb,占比:{:.2f}%".format(
            key, value / 1024, value / sizes * 100)
        ipv4info += info + '\n'
        print(info)
    print("====================")
    print("")
    return ipv6point, ipv4info


def analysis_request(entries):
    domains, sizes, ipv6sizes = calculate_sizes(entries)
    ipv6point, ipv4info = print_results(domains, sizes, ipv6sizes)

    results = {}
    if ipv6sizes / sizes < ipv6_baseline:
        results['ipv6point'] = '{:.2f}%'.format(ipv6point)
        results['ipv4list'] = ipv4info
    return results


def read_jsonfile(file):
    json_data = json.load(file)
    log = json_data['log']
    pages = log.get('pages', [])
    if not pages:
        print('har无页面数据')
        page_title = "未知页面"
    else:
        page = pages[0]
        page_title = page['title']
        print("")
        print("加载的页面:", page_title)

    entries = log.get('entries', [])
    if 'entries' in log:
        results = analysis_request(entries)
        if results:
            results['page'] = page_title
            return results


def export_excel(data):
    # 创建一个数据字典
    # data = {'Name': ['Tom', 'Nick', 'John'],'Age': [20, 21, 19]}

    # 将数据字典转换为pandas DataFrame
    df = pd.DataFrame(data)
    # 将DataFrame导出为Excel文件
    df.to_excel(output_file, index=False)


def format_excel():
    # 加载Excel文件
    wb = load_workbook(output_file)

    # 选择要修改的工作表
    ws = wb.active

    # 设置第一列的宽度为特定值
    ws.column_dimensions['A'].width = 40
    ws.column_dimensions['B'].width = 15
    ws.column_dimensions['C'].width = 80

    # 遍历所有单元格,设置其对齐方式为上下居中
    for row in ws.iter_rows():
        for cell in row:
            cell.alignment = Alignment(vertical='center', wrap_text=True)

    # 获取C列的所有单元格
    # c_column_cells = ws['C']
    # for cell in c_column_cells:
    #     # 设置其对齐方式为自动换行
    #     cell.alignment = Alignment(wrap_text=True)

    # 保存修改后的Excel文件
    wb.save(output_file)


def traverse_files(directory):
    # 指定当前目录路径
    # directory = os.getcwd()
    print(directory)
    # 指定文件格式
    file_format = '*.har'

    # 使用glob模块获取匹配的文件路径列表
    file_list = glob.glob(os.path.join(directory, file_format))

    pages = []
    ipv6points = []
    ipv4lists = []

    # 遍历文件列表
    for file_path in file_list:
        # 打开文件进行处理
        with open(file_path, 'r') as file:
            result = read_jsonfile(file)
            if result:
                pages.append(result['page'])
                ipv6points.append(result['ipv6point'])
                ipv4lists.append(result['ipv4list'])

    if pages:
        data = {
            '页面': pages,
            'IPv6占比': ipv6points,
            'IPv4域名列表': ipv4lists
        }
        export_excel(data)
        format_excel()


# 创建一个解析器
parser = argparse.ArgumentParser(description='分析IPv6数据')
# 添加一个命令行参数
parser.add_argument('--directory', type=str, help='要分析的文件的目录')
parser.add_argument('--d', type=str, help='要分析的文件的目录')

# 解析命令行参数
args = parser.parse_args()

directory = os.getcwd()
if args.directory:
    directory = args.directory
elif args.d:
    directory = args.d
output_file = directory + '/output.xlsx'

# 使用命令行参数
traverse_files(directory)

下载 analysis_ipv6.py 脚本代码(下载失败请直接使用上面的源码),将上一步生产的数据 native.har 建议放在同一个目录下,本文是放在 Desktop/IPv6Data 中:

✗ tree -L 2
.
├── analysis_ipv6.py
├── other
│   ├── native.har

3.2.3、数据分析

在终端执行如下命令,即可得到每一个页面 IPv6 的数据量及占比,未支持 IPv6 的域名数据:

✗ python3 analysis_ipv6.py --d /Users/denglibing/Desktop/IPv6Data/other
/Users/denglibing/Desktop/IPv6Data/other
har无页面数据
IPv6 数据大小:17130.18kb
总数据大小:17152.94kb
IPv6 数据占比:99.87%
⚠️  未支持IPv6的域名信息:
域名:gold.jd.com,数据大小:1.52kb,占比:0.01%
域名:httpfereport.jd.com,数据大小:0.10kb,占比:0.00%
域名:fd.3.cn,数据大小:-0.00kb,占比:-0.00%
域名:mcard.jd.com,数据大小:6.80kb,占比:0.04%
域名:gia.jd.com,数据大小:0.98kb,占比:0.01%
域名:blackhole-m.m.jd.com,数据大小:1.16kb,占比:0.01%
域名:lbsgwh5.m.jd.com,数据大小:0.09kb,占比:0.00%
域名:cactus.jd.com,数据大小:3.04kb,占比:0.02%
域名:sp-desk.jd.com,数据大小:1.14kb,占比:0.01%
域名:sh.jd.com,数据大小:-0.05kb,占比:-0.00%
域名:im-x.jd.com,数据大小:0.01kb,占比:0.00%
域名:blackhole.m.jd.com,数据大小:1.01kb,占比:0.01%
域名:sdkfp.jd.com,数据大小:3.15kb,占比:0.02%
域名:mllog.jd.com,数据大小:0.22kb,占比:0.00%
域名:aks.jdpay.com,数据大小:0.02kb,占比:0.00%
域名:gs-loc-cn.apple.com,数据大小:0.08kb,占比:0.00%
域名:ccc-x.jd.com,数据大小:0.05kb,占比:0.00%
域名:storage.jd.com,数据大小:-0.00kb,占比:-0.00%
域名:shop-license.jd.com,数据大小:1.39kb,占比:0.01%
域名:rjsb-token-m.jd.com,数据大小:0.52kb,占比:0.00%
域名:daily-redpacket.jd.com,数据大小:1.28kb,占比:0.01%
====================

同时会在 native.har 同一级目录下自动生成表格数据(目录下的 output.xlsx 文件),方便跟进哪些域名还未支持IPv6

✗ tree -L 2
.
├── analysis_ipv6.py
├── other
│   ├── native.har
│   ├── output.xlsx
页面IPv6占比IPv4域名列表
未知页面99.87%域名:gold.jd.com,数据大小:1.52kb,占比:0.01% ... ...

四、其他检测方式

4.1、手机安装抓包软件

推荐在 App Store 搜索【蜻蜓抓包】,根据【蜻蜓抓包】引导安装对应的证书后,开启抓包,然后打开 h5 页面,这里以【特价团】页面举例说明:

ipv6test1.png

该页面中 h5speed.m.jd.com(120.52.148.150即为 IPv4 地址,目前已经支持 IPv6 ) 未支持 IPv6,而 uranus.jd.com (2408:xxxx) 已支持。

说明不仅当前页面域名可能不支持 IPv6 ,页面内部的一些请求不支持 IPv6 的域名也需要一一找出来,然后在公司内部找到负责人推动支持。

该方式优点是简单快速验证有限数量的域名是否支持,缺点在于无法统计整个页面或者整个App的数据,然后有效持续跟进。

当然也可以通过导出 har 文件,然后通过上面的工具分析,得到的数据是一致的。

4.2、Safari调试h5页面分析

前提条件是需要在 iPhone 上安装 debug 包。

这里以 【京喜特价首页】 入口去【特价团】页面举例说明:

4.2.1、 开启调试模式

iPhone 安装 debug 包后,通过 Mac 上 Safri 开启网页检测器(调试模式):

ipv6h51.png

4.2.2、页面测试采集数据

在【特价团】页面进行浏览5分钟左右,在网页检测器中选择导出命名 pro.jingxi.com-tjt.har 文件:

ipv6h52.png

4.2.3、数据分析

pro.jingxi.com-tjt.har 文件和如下脚本 在同一个目录下,然后终端执行脚本会得到下面的数据:

➜  tree -L 2
.
├── analysis_ipv6.py
└── priorityPage
    ├── pro.jingxi.com-tjt.har
​
加载的页面: https://pro.jingxi.com/jx/active/2maPuB2FfzqTEmzuebGqrZsjfhLw/index.html?babelChannel=ttt1&un_area=19_1607_4773_62130&sid=fc1430bfb1f06f42118dbf15f94a5adw
IPv6 数据大小:2261.62kb
总数据大小:2262.93kb
IPv6 数据占比:99.94%
⚠️  未支持IPv6的域名信息:
域名blackhole-m.m.jd.com:数据大小:0.43kb
域名blackhole.m.jd.com:数据大小:0.43kb
域名rjsb-token-m.jd.com:数据大小:0.45kb
====================

并且自动导出 IPv6 浓度低于 90%(脚本中 ipv6_baseline 可以自己控制阈值) 的页面,还有哪些域名走 IPv4 地址的表格(如上表)。

该方式优点是可以聚合统计某一个 h5 页面维度的数据,提供当前 IPv6 的流量占比及整改方向,缺点在于依赖 debug 包环境及对工具的依赖,当然不支持统计原生页面的数据。

五、参考资料

占比首破50%!我国移动网络IPv6流量超过IPv4流量

IPv6 改造相关指标和测试方法说明

IPv6与IPv4对比学习

iOS 流量监控分析