qData 数据中台 v1.1.0(开源版)发布:清洗与稽查规则扩展,ARM 架构正式支持

41 阅读3分钟

规则不够用、部署过程繁琐、ARM 环境无法直接运行,是部分用户在使用 qData 开源版过程中遇到的共性问题。v1.1.0 版本围绕这些问题进行了集中优化。

在这里插入图片描述

为什么要做这次更新

在 qData 开源版的使用过程中,社区用户集中反馈了以下几类问题:

  • 清洗与稽查规则覆盖不足

    当数据结构和质量情况较为复杂时,现有规则数量有限,难以满足实际处理需求。

  • 部署与发版成本偏高

    安装包体积较大,交付与下载耗时较长;版本发布过程中人工操作较多,整体效率有待提升。

  • 运行环境适配受限

    ARM 架构服务器及苹果芯片设备逐步普及,原有版本在部分环境下无法直接运行,需要统一适配方案。

v1.1.0 版本即针对上述问题进行了集中优化。

新增清洗规则(5 个)

为增强数据预处理阶段的灵活性,qData 开源版 v1.1.0 新增了 5 项清洗规则:

  • 清洗过期记录

    支持基于时间条件自动清理已失效的数据记录。

  • 字段值转大写

    对指定字段进行统一的大写转换,适用于编码、标识类字段的标准化处理。

  • 超长字段截取

    当字段长度超过设定阈值时,按规则自动截断,避免异常数据影响后续处理。

  • 小数位统一处理

    对数值字段的小数位数进行规范,确保数据精度一致。

  • 正则表达式替换

    支持通过正则表达式对字段内容进行替换,增强对复杂文本场景的清洗能力。

新增稽查规则(3 个)

在数据质量校验层面,v1.1.0 版本补充了以下稽查规则:

  • 数值范围校验

    校验字段值是否处于设定的数值区间内,用于拦截异常数据。

  • 字段长度范围校验

    校验字段长度是否符合预期范围,提升字段规范性。

  • 枚举值校验

    校验字段值是否属于预定义的枚举集合,确保数据满足业务约束。

ARM + x86 双架构支持

针对不同硬件环境的部署需求,qData 开源版 v1.1.0 在构建与交付方式上进行了优化:

  • 统一构建方式

    支持基于 Maven 一键打包生成 Jar 包与镜像(可配置)。在安装 Docker 与 Buildx 的前提下,同时支持 ARM 与 x86 架构。

  • 镜像化交付

    支持将构建完成的镜像直接推送至阿里云镜像管理平台,避免反复传输大型安装包,部署过程更加高效。

  • 达梦数据库 ARM 适配

    完成达梦数据库在 ARM 架构下的镜像适配,增强国产化环境下的运行能力。

结语

qData 开源版 v1.1.0 并未引入新的使用范式,而是围绕可用性、工程效率与运行环境适配进行了持续完善,目标是让开源版在真实项目中更加稳定、易部署、可落地。