GaussDB-CREATE DATABASE

152 阅读11分钟

GaussDB-CREATE DATABASE

功能描述

创建一个新的数据库。缺省情况下新数据库将通过复制标准系统数据库template0来创建,且仅支持使用template0来创建。

注意事项
  • 只有拥有CREATEDB权限的用户才可以创建新数据库,系统管理员默认拥有此权限。
  • 不能在事务块中执行创建数据库语句。
  • 在创建数据库过程中,若出现类似“could not initialize database directory”的错误提示,可能是由文件系统上数据目录的权限不足或磁盘满等原因引起。
语法格式

| ``` CREATE DATABASE database_name [ [ WITH ] { [ OWNER [=] user_name ] | [ TEMPLATE [=] template ] | [ ENCODING [=] 'encoding' ] | [ LC_COLLATE [=] 'lc_collate' ] | [ LC_CTYPE [=] 'lc_ctype' ] | [ DBCOMPATIBILITY [=] 'compatibility_type' ] | [ TABLESPACE [=] tablespace_name ] | [ CONNECTION LIMIT [=] connlimit ] | [ DBTIMEZONE [=] 'time_zone' ] }[...] ];

| ----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------- |

#### 参数说明

-   **database_name**

    数据库名称。

    取值范围:字符串,要符合[标识符命名规范](https://doc.hcs.huawei.com/db/zh-cn/gaussdbqlh/24.1.30/devg-dist/gaussdb-12-0321.html#ZH-CN_TOPIC_0000001865746364__zh-cn_topic_0000001704458709_section14873217506)。

-   **OWNER [ = ] user_name**

    可选。数据库所有者。缺省时,新数据库的所有者是当前用户。

    取值范围:已存在的用户名。

-   **TEMPLATE [ = ] template**

    可选。模板名。即从哪一个模板创建新数据库。GaussDB采用从模板数据库复制的方式来创建新的数据库。初始时,GaussDB包含两个模板数据库template0、template1,以及一个默认的用户数据库postgres。

    取值范围:仅template0。

-   **ENCODING [ = ] 'encoding** **'**

    可选。指定数据库使用的字符编码,可以是字符串(如'SQL_ASCII')、整数编号。

    不指定时,默认使用模版数据库的编码。模板数据库template0和template1的编码默认与操作系统环境相关。template1不允许修改字符编码,因此若要变更编码,请使用template0创建数据库。

    常用取值:GBK、UTF8、Latin1、GB18030等,具体支持的字符集如下。

    | **名称**          | **描述**                     | **语言**         | **是否服务器端?** | **ICU(International Components for Unicode)?** | **字节/字符** | **别名**                                |
    | :-------------- | :------------------------- | :------------- | :---------- | :--------------------------------------------- | :-------- | :------------------------------------ |
    | BIG5            | Big Five                   | 繁体中文           | 否           | 否                                              | 1-2       | WIN950, Windows950                    |
    | EUC_CN          | 扩展UNIX编码-中国                | 简体中文           | 是           | 是                                              | 1-3       | -                                    |
    | EUC_JP          | 扩展UNIX编码-日本                | 日文             | 是           | 是                                              | 1-3       | -                                    |
    | EUC_JIS_2004   | 扩展UNIX编码-日本, JIS X 0213    | 日文             | 是           | 否                                              | 1-3       | -                                    |
    | EUC_KR          | 扩展UNIX编码-韩国                | 韩文             | 是           | 是                                              | 1-3       | -                                    |
    | EUC_TW          | 扩展UNIX编码-中国台湾              | 繁体中文           | 是           | 是                                              | 1-3       | -                                    |
    | GB18030         | 国家标准                       | 中文             | 是           | 否                                              | 1-4       | -                                    |
    | GB18030_2022   | 国家标准                       | 中文             | 是           | 否                                              | 1-4       | -                                    |
    | GBK             | 扩展国家标准                     | 简体中文           | 是           | 否                                              | 1-2       | WIN936, Windows936                    |
    | ISO_8859_5    | ISO 8859-5, ECMA 113       | 拉丁语/西里尔语       | 是           | 是                                              | 1         | -                                    |
    | ISO_8859_6    | ISO 8859-6, ECMA 114       | 拉丁语/阿拉伯语       | 是           | 是                                              | 1         | -                                    |
    | ISO_8859_7    | ISO 8859-7, ECMA 118       | 拉丁语/希腊语        | 是           | 是                                              | 1         | -                                    |
    | ISO_8859_8    | ISO 8859-8, ECMA 121       | 拉丁语/希伯来语       | 是           | 是                                              | 1         | -                                    |
    | JOHAB           | JOHAB                      | 韩语             | 否           | 否                                              | 1-3       | -                                    |
    | KOI8R           | KOI8-R                     | 西里尔语(俄语)       | 是           | 是                                              | 1         | KOI8                                  |
    | KOI8U           | KOI8-U                     | 西里尔语(乌克兰语)     | 是           | 是                                              | 1         | -                                    |
    | LATIN1          | ISO 8859-1, ECMA 94        | 西欧             | 是           | 是                                              | 1         | ISO88591                              |
    | LATIN2          | ISO 8859-2, ECMA 94        | 中欧             | 是           | 是                                              | 1         | ISO88592                              |
    | LATIN3          | ISO 8859-3, ECMA 94        | 南欧             | 是           | 是                                              | 1         | ISO88593                              |
    | LATIN4          | ISO 8859-4, ECMA 94        | 北欧             | 是           | 是                                              | 1         | ISO88594                              |
    | LATIN5          | ISO 8859-9, ECMA 128       | 土耳其语           | 是           | 是                                              | 1         | ISO88599                              |
    | LATIN6          | ISO 8859-10, ECMA 144      | 日耳曼语           | 是           | 是                                              | 1         | ISO885910                             |
    | LATIN7          | ISO 8859-13                | 波罗的海           | 是           | 是                                              | 1         | ISO885913                             |
    | LATIN8          | ISO 8859-14                | 凯尔特语           | 是           | 是                                              | 1         | ISO885914                             |
    | LATIN9          | ISO 8859-15                | 带欧罗巴和口音的LATIN1 | 是           | 是                                              | 1         | ISO885915                             |
    | LATIN10         | ISO 8859-16, ASRO SR 14111 | 罗马尼亚语          | 是           | 否                                              | 1         | ISO885916                             |
    | MULE_INTERNAL   | Mule内部编码                   | 多语种编辑器         | 是           | 否                                              | 1-4       | -                                    |
    | SJIS            | Shift JIS                  | 日语             | 否           | 否                                              | 1-2       | Mskanji, ShiftJIS, WIN932, Windows932 |
    | SHIFT_JIS_2004 | Shift JIS, JIS X 0213      | 日语             | 否           | 否                                              | 1-2       | -                                    |
    | SQL_ASCII       | 未指定(见文本)                   | ***任意***       | 是           | 否                                              | 1         | -                                    |
    | UHC             | 统一韩语编码                     | 韩语             | 否           | 否                                              | 1-2       | WIN949, Windows949                    |
    | UTF8            | Unicode, 8-bit             | ***所有***       | 是           | 是                                              | 1-4       | Unicode                               |
    | WIN866          | Windows CP866              | 西里尔语           | 是           | 是                                              | 1         | ALT                                   |
    | WIN874          | Windows CP874              | 泰语             | 是           | 否                                              | 1         | -                                    |
    | WIN1250         | Windows CP1250             | 中欧             | 是           | 是                                              | 1         | -                                    |
    | WIN1251         | Windows CP1251             | 西里尔语           | 是           | 是                                              | 1         | WIN                                   |
    | WIN1252         | Windows CP1252             | 西欧             | 是           | 是                                              | 1         | -                                    |
    | WIN1253         | Windows CP1253             | 希腊语            | 是           | 是                                              | 1         | -                                    |
    | WIN1254         | Windows CP1254             | 土耳其语           | 是           | 是                                              | 1         | -                                    |
    | WIN1255         | Windows CP1255             | 希伯来语           | 是           | 是                                              | 1         | -                                    |
    | WIN1256         | Windows CP1256             | 阿拉伯语           | 是           | 是                                              | 1         | -                                    |
    | WIN1257         | Windows CP1257             | 波罗的海           | 是           | 是                                              | 1         | -                                    |
    | WIN1258         | Windows CP1258             | 越南语            | 是           | 是                                              | 1         | ABC, TCVN, TCVN5712, VSCII            |
    | ZHS16GBK        | 扩展国家标准                     | 简体中文           | 是           | 否                                              | 1-2       | -                                    |

    ![](https://p9-xtjj-sign.byteimg.com/tos-cn-i-73owjymdk6/5569f1446dae45bc9665a9105528df93~tplv-73owjymdk6-jj-mark-v1:0:0:0:0:5o6Y6YeR5oqA5pyv56S-5Yy6IEAgamVycnl3YW5nMTk4Mw==:q75.awebp?rk3s=f64ab15b&x-expires=1771985254&x-signature=25%2F9NpzdBoUuWxdpBZ%2B2RDmT%2BOo%3D)

    -   需要注意并非所有的客户端API都支持上面列出的字符集。
    -   SQL_ASCII设置与其他设置表现得相当不同。如果服务器字符集是SQL_ASCII,服务器把字节值0-127根据ASCII标准解释,而字节值128-255则当作无法解析的字符。如果设置为SQL_ASCII,就不会有编码转换。因此,这个设置基本不是用来声明所使用的指定编码, 因为这个声明会忽略编码。在大多数情况下,如果你使用了任何非ASCII数据,那么使用SQL_ASCII设置都是不明智的,因为数据库将无法帮助你转换或者校验非ASCII字符。

    ![](https://p9-xtjj-sign.byteimg.com/tos-cn-i-73owjymdk6/73b19dd17a8f4f87a33d5a3661c5eaa5~tplv-73owjymdk6-jj-mark-v1:0:0:0:0:5o6Y6YeR5oqA5pyv56S-5Yy6IEAgamVycnl3YW5nMTk4Mw==:q75.awebp?rk3s=f64ab15b&x-expires=1771985254&x-signature=qrltOSpTeibRU%2BpJHRmBc4MXj%2F0%3D)NOTICE:

    -   指定新的数据库字符集编码必须与所选择的本地环境中(LC_COLLATE和LC_CTYPE)的设置兼容。
    -   当指定的字符编码集为GBK、ZHS16GBK时,部分中文生僻字无法直接作为对象名。这是因为GBK第二个字节的编码范围在0x40-0x7E之间时,字节编码与ASCII字符@A-Z[\]^_`a-z{|}重叠。其中@[\]^_'{|}是数据库中的操作符,直接作为对象名时,会语法报错。例如“侤”字,GBK16进制编码为0x8240,第二个字节为0x40,与ASCII“@”符号编码相同,因此无法直接作为对象名使用。如果确实要使用,可以在创建和访问对象时,通过增加双引号来规避这个问题。
    -   若客户端编码为A,服务器端编码为B,则需要满足数据库中存在编码格式A与B的转换。数据库能够支持的所有的编码格式转换详见系统表[PG_CONVERSION](https://doc.hcs.huawei.com/db/zh-cn/gaussdbqlh/24.1.30/devg-dist/gaussdb-12-0934.html#ZH-CN_TOPIC_0000001865747224)(若无法转换,则建议客户端编码与服务器端编码保持一致,客户端编码可通过GUC参数client_encoding修改)。
    -   若要指定数据库字符集编码为GB18030_2022,且客户端编码也要设置为GB18030_2022时,必须确保客户端操作系统支持的GB18030字符集为2022版本,否则由于GB18030字符集自身的各版本间存在不完全兼容,可能导致数据的不一致性。同时,涉及到历史数据切换为GB18030_2022数据库时应当遵循切库流程,进行数据迁移操作。

-   **LC_COLLATE [ = ] 'lc_collate**'

    可选。指定新数据库使用的字符集。例如,通过lc_collate = 'zh_CN.gbk'设定该参数。

    该参数的使用会影响到对字符串的排序顺序(如使用ORDER BY执行,以及在文本列上使用索引的顺序)。默认是使用模板数据库的字符集。

    取值范围:操作系统支持的字符集。

-   **LC_CTYPE [ = ]** **'lc_ctype**'

    可选。指定新数据库使用的字符分类。例如,通过lc_ctype = 'zh_CN.gbk'设定该参数。该参数的使用会影响到字符的分类,如大写、小写和数字。默认是使用模板数据库的字符分类。

    取值范围:操作系统支持的字符分类。

    ![](https://p9-xtjj-sign.byteimg.com/tos-cn-i-73owjymdk6/63de5af8186b43d391cccc5e0ad1e301~tplv-73owjymdk6-jj-mark-v1:0:0:0:0:5o6Y6YeR5oqA5pyv56S-5Yy6IEAgamVycnl3YW5nMTk4Mw==:q75.awebp?rk3s=f64ab15b&x-expires=1771985254&x-signature=uZJeP4Nz0bs0Q%2BCeMytSh4s2wPY%3D)

    -   对于lc_collate和lc_ctype参数的取值范围,取决于本地环境支持的字符集。例如:在Linux操作系统上,可通过locale -a命令获取操作系统支持的字符集列表,在应用lc_collate和lc_ctype参数时可从中选择用户需要的字符集和字符分类。
    -   如果需要设置字符编码集为GB18030_2022时,lc_collate参数和Lc_ctype参数的取值范围与GB18030保持一致。
    -   如果需要设置字符编码集为ZHS16GBK时,lc_collate参数和Lc_ctype参数的取值范围需与GBK字符集保持一致。

-   **DBCOMPATIBILITY [ = ] 'compatibility_type** **'**

    可选。指定兼容的数据库的类型,默认兼容MySQL。

    取值范围:MYSQL、TD、ORA、PG。分别表示兼容MySQL、TD(Teradata)、Oracle和PostgreSQL。

    ![](https://p9-xtjj-sign.byteimg.com/tos-cn-i-73owjymdk6/48ab981e72a3427d86d0a919628715fb~tplv-73owjymdk6-jj-mark-v1:0:0:0:0:5o6Y6YeR5oqA5pyv56S-5Yy6IEAgamVycnl3YW5nMTk4Mw==:q75.awebp?rk3s=f64ab15b&x-expires=1771985254&x-signature=bkzsPBvwr2tNPhCmqJNt1T4XleE%3D)

    -   ORA兼容性下,数据库将空字符串作为NULL处理,数据类型DATE会被替换为TIMESTAMP(0) WITHOUT TIME ZONE。
    -   将字符串转换成整数类型时,如果输入不合法,MYSQL兼容性会将输入转换为0,而其它兼容性则会报错。
    -   PG兼容性下,CHAR和VARCHAR以字符为计数单位,其它兼容性以字节为计数单位。例如,对于UTF-8字符集,CHAR(3)在PG兼容性下能存放3个中文字符,而在其它兼容性下只能存放1个中文字符。
    -   执行语句报错时,部分报错信息中显示“A-format”或“B-format”,“A-format”表示“ORA-format”,“B-format”表示“MYSQL-format”。

-   **TABLESPACE [ = ] tablespace_name**

    可选。指定数据库对应的表空间。

    取值范围:已存在表空间名。

-   **CONNECTION LIMIT [ = ] connlimit**

    可选。数据库可以接受的并发连接数。

    ![](https://p9-xtjj-sign.byteimg.com/tos-cn-i-73owjymdk6/d5a3ed8cfec542e8a6c10bef60091861~tplv-73owjymdk6-jj-mark-v1:0:0:0:0:5o6Y6YeR5oqA5pyv56S-5Yy6IEAgamVycnl3YW5nMTk4Mw==:q75.awebp?rk3s=f64ab15b&x-expires=1771985254&x-signature=01R%2F3du4xFx4OnGGlb1pjeh0%2FxQ%3D)NOTICE:

    -   系统管理员不受此参数的限制。
    -   connlimit每个CN单独统计,集群整体的连接数 = connlimit * 当前正常CN节点个数。

    取值范围:[-1, 2^31-1]的整数。默认值为-1,表示没有限制。

有关字符编码的一些限制:

-   若区域设置为C(或POSIX),则允许所有的编码类型,但是对于其他的区域设置,字符编码必须和区域设置相同。

-   编码和区域设置必须匹配模板数据库,除了将template0当作模板。 因为其他数据库可能会包含不匹配指定编码的数据,或者可能包含排序顺序受LC_COLLATE和LC_CTYPE影响的索引。复制这些数据会导致在新数据库中的索引失效。template0是不包含任何会受到影响的数据或者索引。

-   **DBTIMEZONE [ = ] 'time_zone** **'**

    指定新数据库的时区。例如,通过DBTIMEZONE = '+00:00'设定该参数。该参数会影响新数据库的时区。默认设置为PRC时区。

    前提条件:当前连接数据库是ORA兼容、a_format_version='10c'、a_format_dev_version='s2'。

    取值范围:操作系统支持的时区名称和缩写或者-15:59到+15:00时间戳范围。

#### 示例

--创建jim用户。 gaussdb=# CREATE USER jim PASSWORD '********';

--创建一个GBK编码的数据库testdb1。 gaussdb=# CREATE DATABASE testdb1 ENCODING 'GBK' template = template0; --查看数据库testdb1信息。 gaussdb=# SELECT datname,pg_encoding_to_char(encoding) FROM pg_database WHERE datname = 'testdb1'; datname | pg_encoding_to_char ---------+--------------------- testdb1 | GBK (1 row)

--创建兼容ORA格式的数据库testdb2,并指定所有者为jim。 gaussdb=# CREATE DATABASE testdb2 OWNER jim DBCOMPATIBILITY = 'ORA'; --查看testdb2信息。 gaussdb=# SELECT t1.datname,t2.usename,t1.datcompatibility FROM pg_database t1,pg_user t2 WHERE t1.datname = 'testdb2' AND t1.datdba=t2.usesysid; datname | usename | datcompatibility ---------+---------+------------------ testdb2 | jim | ORA (1 row)

--切换至ORA兼容性数据库testdb2,并设置会话参数。 gaussdb=# \c testdb2 testdb2=# SET a_format_version='10c'; testdb2=# SET a_format_dev_version='s2'; --创建兼容ORA格式的数据库并指定时区。 testdb2=# CREATE DATABASE testdb3 DBCOMPATIBILITY 'ORA' DBTIMEZONE='+08:00'; --查看testdb3信息。 testdb2=# SELECT datname,datcompatibility,dattimezone FROM pg_database WHERE datname = 'testdb3'; datname | datcompatibility | dattimezone ---------+------------------+------------- testdb3 | ORA | +08:00 (1 row)

--切换至初始数据库。 testdb2=# \c postgres --删除数据库。 gaussdb=# DROP DATABASE testdb1; gaussdb=# DROP DATABASE testdb2; gaussdb=# DROP DATABASE testdb3; --删除用户。 gaussdb=# DROP USER jim;


#### 相关链接

[ALTER DATABASE](https://doc.hcs.huawei.com/db/zh-cn/gaussdbqlh/24.1.30/devg-dist/gaussdb-12-0481.html#ZH-CN_TOPIC_0000001865586308),[DROP DATABASE](https://doc.hcs.huawei.com/db/zh-cn/gaussdbqlh/24.1.30/devg-dist/gaussdb-12-0591.html#ZH-CN_TOPIC_0000001911585469)

#### 优化建议

-   **create database**

    事务中不支持创建database。

<!---->

-   **ENCODING**

    当新建数据库Encoding与模板数据库(SQL_ASCII)不匹配(为'GBK' /'UTF8'/'LATIN1'/'GB18030'/'GB18030_2022'/'ZHS16GBK')时,必须指定template [=] template0。

更多详情请参考GaussDB 文档中心:<https://doc.hcs.huawei.com/db/zh-cn/gaussdbqlh/24.1.30/productdesc/qlh_03_0001.html>