cubeJS的介绍与使用

779 阅读3分钟

开启掘金成长之旅!这是我参与「掘金日新计划 · 2 月更文挑战」的第 30 天,点击查看活动详情

cubeJS的介绍

CubeJS是一个开源的分析平台,它能够帮助您快速构建和部署OLAP(在线分析处理)和BI(商业智能)解决方案。CubeJS主要基于Node.js和开源的数据库PostgreSQL,使用它您可以轻松地构建出高效、快速的分析结果。

一、优势

  1. 极简的API

Cube.js定义了简洁的查询API,使得对数据源进行查询变得非常易于使用和理解。

  1. 优异的性能

受益于使用OLAP数据建模的优势,使得在大数据集上对数据进行聚合式查询具有优异的性能表现。

  1. 开放性

Cube.js提供基于开放标准的API,这种API可以被客户端、服务端或数据处理进程等各种系统所使用。

  1. 可拓展性

借助于可拓展的数据建模、自我部署和扩容能力,Cube.js更适用于大规模的数据分析场景。

cubeJS安装和配置

Cube.js运行在Node.js环境下,所以需要进行相应安装:

  1. 安装Node.js

首先需要安装Node.js,这里不再赘述。

  1. 安装Cube.js CLI

使用如下命令可以安装Cube.js CLI:

npm install -g cubejs-cli

  1. 初始化项目

初始化Cube.js项目使用可创建一个新的目录,该目录包含默认配置文件和启动脚本。可以使用如下命令快速初始化项目:

cubejs create

通过上述命令,会在当前目录下创建一个名为 "project-name" 的子目录,并在其中生成所需的目录结构、配置文件和启动脚本。

扫描 Cube.js 版本库,你可以找到许多不同的示例应用程序。每个应用程序都有不同的数据源和分析。

三、 构建数据源

建立数据源是使用 Cube.js 进行分析的第一步。Cube.js 支持包括 PostgreSQL, MySQL, BigQuery, Redshift, Snowflake 在内的多种数据源,并提供方便的配置构建工具来配置和管理它们。

  1. 准备示例数据

如果你没有自己的数据,Cube.js 可以为你提供一个测试数据存储在 example-db 目录下。从 example-db/airline.db 中获得示例数据。

  1. 配置数据源

Cube.js 可以通过 JSON 配置文件来配置数据源。在 data/cube.js 中,将以下代码行解除注释,并将其中的“test”更改为我们想要创建的新数据源名称:

`const myDatabase = require('./my-database.json'); const { database: testDb } = myDatabase;

module.exports = {   databases: {     test: testDb,   }, ` 更改完成后,我们需要单独创建一个新的数据源配置文件:

创建一个名为myDatabase.json的新文件,并将以下代码复制到该文件中:

{
  "type": "postgres",
  "host": "localhost",
  "port": 5432,
  "user": "root",
  "password": "",
  "database": "airline"
}

如果需要,将主机名、端口、用户名、密码、数据库等信息更新为您的PostgreSQL连接所需的值。这里我们使用的类型是“ postgres”。

  1. 验证数据源

输入以下命令来验证您的新数据源连接是否正常:

CUBEJS_DB_TYPE=postgres
CUBEJS_DB_HOST=localhost
CUBEJS_DB_NAME=airline
CUBEJS_DB_USER=root
CUBEJS_DB_PASS=""
npx cubejs check

以上命令中为您的新数据源提供了如上所示的连接参数。

如果返回信息中包含 "[check] [postgres driver]" 关键字,表示 Cube.js 已正常连接并查看到数据源。也可以通过命令行中提供的两个 URL 进行服务器启动并连接Cube.js开发服务器。

结束