开启掘金成长之旅!这是我参与「掘金日新计划 · 2 月更文挑战」的第 30 天,点击查看活动详情
cubeJS的介绍
CubeJS是一个开源的分析平台,它能够帮助您快速构建和部署OLAP(在线分析处理)和BI(商业智能)解决方案。CubeJS主要基于Node.js和开源的数据库PostgreSQL,使用它您可以轻松地构建出高效、快速的分析结果。
一、优势
- 极简的API
Cube.js定义了简洁的查询API,使得对数据源进行查询变得非常易于使用和理解。
- 优异的性能
受益于使用OLAP数据建模的优势,使得在大数据集上对数据进行聚合式查询具有优异的性能表现。
- 开放性
Cube.js提供基于开放标准的API,这种API可以被客户端、服务端或数据处理进程等各种系统所使用。
- 可拓展性
借助于可拓展的数据建模、自我部署和扩容能力,Cube.js更适用于大规模的数据分析场景。
cubeJS安装和配置
Cube.js运行在Node.js环境下,所以需要进行相应安装:
- 安装Node.js
首先需要安装Node.js,这里不再赘述。
- 安装Cube.js CLI
使用如下命令可以安装Cube.js CLI:
npm install -g cubejs-cli
- 初始化项目
初始化Cube.js项目使用可创建一个新的目录,该目录包含默认配置文件和启动脚本。可以使用如下命令快速初始化项目:
cubejs create
通过上述命令,会在当前目录下创建一个名为 "project-name" 的子目录,并在其中生成所需的目录结构、配置文件和启动脚本。
扫描 Cube.js 版本库,你可以找到许多不同的示例应用程序。每个应用程序都有不同的数据源和分析。
三、 构建数据源
建立数据源是使用 Cube.js 进行分析的第一步。Cube.js 支持包括 PostgreSQL, MySQL, BigQuery, Redshift, Snowflake 在内的多种数据源,并提供方便的配置构建工具来配置和管理它们。
- 准备示例数据
如果你没有自己的数据,Cube.js 可以为你提供一个测试数据存储在 example-db 目录下。从 example-db/airline.db 中获得示例数据。
- 配置数据源
Cube.js 可以通过 JSON 配置文件来配置数据源。在 data/cube.js 中,将以下代码行解除注释,并将其中的“test”更改为我们想要创建的新数据源名称:
`const myDatabase = require('./my-database.json'); const { database: testDb } = myDatabase;
module.exports = { databases: { test: testDb, }, ` 更改完成后,我们需要单独创建一个新的数据源配置文件:
创建一个名为myDatabase.json的新文件,并将以下代码复制到该文件中:
{
"type": "postgres",
"host": "localhost",
"port": 5432,
"user": "root",
"password": "",
"database": "airline"
}
如果需要,将主机名、端口、用户名、密码、数据库等信息更新为您的PostgreSQL连接所需的值。这里我们使用的类型是“ postgres”。
- 验证数据源
输入以下命令来验证您的新数据源连接是否正常:
CUBEJS_DB_TYPE=postgres
CUBEJS_DB_HOST=localhost
CUBEJS_DB_NAME=airline
CUBEJS_DB_USER=root
CUBEJS_DB_PASS=""
npx cubejs check
以上命令中为您的新数据源提供了如上所示的连接参数。
如果返回信息中包含 "[check] [postgres driver]" 关键字,表示 Cube.js 已正常连接并查看到数据源。也可以通过命令行中提供的两个 URL 进行服务器启动并连接Cube.js开发服务器。