大数据利器 Impala 4.0 发布

Impala是一款由C++和Java编写的本地分析数据库。是用于处理存储在Hadoop集群中的大量数据的MPP(大规模并行处理)SQL查询引擎。

新版本有哪些新功能?

  1. 扩展 bootstrap_system.sh 以支持 CentOS 8
  2. 改进 Impala 的“快速入门”内容
  3. 实现 ds_kll_union() 函数、ds_kll_rank() 函数、ds_kll_pmf() 函数、ds_kll_cdf() 函数、ds_kll_stringify 函数
  4. impala-shell:添加对基于 cookie 的身份验证的支持
  5. 将 DataSketches 升级到 3.0.0 版
  6. 实现 ds_cpc_sketch() 和 ds_cpc_estimate() 函数
  7. ...

新版本有哪些改进?

  1. 将 Thrift 版本升级到 0.11.0
  2. 减少下载 Maven 来进行预提交测试的时间
  3. 放弃对“无日期时间戳”的支持
  4. 从 docker 镜像中删除一些不必要的 jars
  5. 提高对 x86-64 CPU 的最低要求
  6. 为 DML 启用 mt_dop
  7. Kudu 客户端支持自定义 SASL 协议名称
  8. ...

更新内容较多,详细内容可前往 impala.apache.org/docs/change… 查看