开源地理空间UDF(一)

289 阅读2分钟

持续创作,加速成长!这是我参与「掘金日新计划 · 6 月更文挑战」的第5天,点击查看活动详情

我要一步一步往上爬~大家好我是青三阿,今天我们来一起学习一下开源地理空间UDF的概念。

这篇文章主要介绍由美国环境系统研究所公司ESRI开源的地理空间框架spatial-framework-for-hadoop,这个框架允许开发人员和数据科学家使用Hadoop数据处理系统对空间数据进行分析,其中提供了一套Hive的开源地理空间UDF。

GIS工具包介绍

这里面提供了多个测试数据集,可以进行位置数据记录的过滤和聚合、多边形区域分析、在地图上可视化分析结果、将地图集成到报告中或作为地图应用程序在线发布等等例子,可以供我们学习使用。

GIS Tools for Hadoop 是一个开源工具包,可以对大数据做空间分析,先来了解一下这个工具包的四个组成部分吧

1. Esri Geometry API for Java

这个库包含了:几何对象(点、线、多边形)、空间操作(相交、缓冲区)和空间索引。通过在 Hadoop 中部署 Esri 几何 API 库,可以使用 Java 构建自定义 MapReduce 程序来分析空间数据。

2. Spatial Framework for Hadoop

这个库包含了:扩展 Hive 基于Esri Geometry API构建的UDF。在 Hive 中启用此库就可以使用和 SQL 非常相似的HQL查询,这样就不需要使用复杂的 MapReduce 算法。

3. Geoprocessing Tools for Hadoop:

这些工具可以做到:

  • 在 Hadoop 和 ArcGIS 之间连接数据、提交工作流作业、将数据与 JSON 相互转换
  • 将 Hadoop 结果传输到 ArcGIS 进行可视化
  • 利用 ArcGIS 平台将地图发布到服务器或在线、创建 Web 和移动应用程序,并将它们与 BI 报告等集成

4. Hadoop GIS Tools

集成了上面三个项目,包括了完整工具包示例、说明

总结

先了解了这几个项目之间的关系,就可以更清楚的知道每个项目代码的作用,下一篇文章我将会详细介绍如何去使用这些UDF。