在一台Ubuntu机器上安装Greenplum,可以通过以下步骤进行单机部署。这种部署方式适用于开发和测试环境,不适合生产环境。
步骤概览
- 安装依赖
- 下载并安装Greenplum
- 配置环境变量
- 初始化数据库集群
- 启动数据库
- 验证安装
详细步骤
1. 安装依赖
首先,确保系统更新并安装必要的依赖包。
sudo apt update
sudo apt install -y bzip2 libreadline-dev zlib1g-dev curl
2. 下载并安装Greenplum
从Greenplum官方或GitHub下载最新的Greenplum安装包。例如:
wget https://github.com/greenplum-db/gpdb/releases/download/6.15.0/open-source-greenplum-db-6.15.0-Ubuntu18.04-x86_64.tar.gz
解压缩安装包并安装:
tar -zxvf open-source-greenplum-db-6.15.0-Ubuntu18.04-x86_64.tar.gz
sudo ./greenplum-db-6.15.0-Ubuntu18.04-x86_64.bin
3. 配置环境变量
配置Greenplum的环境变量。
echo "source /usr/local/greenplum-db/greenplum_path.sh" >> ~/.bashrc
source ~/.bashrc
4. 初始化数据库集群
创建一个用户(例如gpadmin
)来运行Greenplum,并为该用户设置环境变量。
sudo useradd -m gpadmin
sudo passwd gpadmin
echo "source /usr/local/greenplum-db/greenplum_path.sh" >> /home/gpadmin/.bashrc
echo "export MASTER_DATA_DIRECTORY=/data/master/gpseg-1" >> /home/gpadmin/.bashrc
source /home/gpadmin/.bashrc
sudo mkdir -p /data/master /data/primary
sudo chown -R gpadmin:gpadmin /data
切换到gpadmin
用户并生成SSH密钥对:
su - gpadmin
ssh-keygen -t rsa -b 4096 -N "" -f ~/.ssh/id_rsa
cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys
chmod 600 ~/.ssh/authorized_keys
创建初始化配置文件gpinitsystem_config
:
vi gpinitsystem_config
配置文件内容示例:
ARRAY_NAME="Greenplum Data Warehouse"
SEG_PREFIX=gpseg
PORT_BASE=40000
declare -a DATA_DIRECTORY=(/data/primary)
MASTER_HOSTNAME=localhost
MASTER_DIRECTORY=/data/master
MASTER_PORT=5432
DATABASE_NAME=gpadmin
初始化Greenplum集群:
gpinitsystem -c gpinitsystem_config
5. 启动数据库
初始化完成后,启动Greenplum集群:
gpstart
6. 验证安装
连接到数据库并验证安装:
psql -d postgres
在psql
中,运行一些基本查询以确保集群正常工作:
SELECT version();
总结
通过上述步骤,你可以在单机Ubuntu系统上成功部署Greenplum数据库。此方法适用于开发和测试,但不建议用于生产环境。生产环境通常需要多节点的分布式部署来实现高可用性和高性能。