#openGauss #入门 #安装 #数据库 #开源
知识来源:docs-opengauss.osinfra.cn/zh/
Pound是一种固定格式分词方法,适用于无语意但待解析文本以固定分隔符分割开来的中英文分词场景。支持中文编码包括GBK、UTF8,支持英文编码包括ASCII。内置6种token类型,如表3所示;支持5种分隔符,如表4所示,在用户不进行自定义设置的情况下分隔符默认为“#”。Pound限制单个token长度不能超过256个字符。
表 3 token类型
别名
描述
zh_words
chinese words
en_word
english word
numeric
numeric data
alnum
alnum string
grapsymbol
graphic symbol
multisymbol
multiple symbol
#openGauss #入门 #安装 #数据库 #开源