#openGauss #入门 #安装 #数据库 #开源
知识来源:docs-opengauss.osinfra.cn/zh/
N-gram是一种机械分词方法,适用于无语义中文分词场景。N-gram分词法可以保证分词的完备性,但是为了照顾所有可能,把很多不必要的词也加入到索引中,导致索引项增加。N-gram支持中文编码包括GBK、UTF-8。内置6种token类型,如表2所示。
表 2 token类型
别名
描述
zh_words
chinese words
en_word
english word
numeric
numeric data
alnum
alnum string
grapsymbol
graphic symbol
multisymbol
multiple symbol
#openGauss #入门 #安装 #数据库 #开源