正则匹配中文标点符号及常用的Unicode编码

482 阅读2分钟

 常见的中文标点符号及其 Unicode 编码

符号Unicode 编码
\u3002
\uff1f
\uff01
\uff0c
\u3001
\uff1b
\uff1a
\u201c
\u201d
\u2018
\u2019
\uff08
\uff09
\u300a
\u300b
\u3008
\u3009
\u3010
\u3011
\u300e
\u300f
\u300c
\u300d
\ufe43
\ufe44
\u3014
\u3015
\u2026
\u2014
\uff5e
\ufe4f
\uffe5

正则表达式示例

基于上述 Unicode 编码,可以扩展正则表达式,例如这样:

 // 匹配中文标点符号(包括上述符号),弹出提示
checkUnicode(text) {
  var reg = /[\u3002\uff1f\uff01\uff0c\u3001\uff1b\uff1a\u201c\u201d\u2018\u2019\uff08\uff09\u300a\u300b\u3008\u3009\u3010\u3011\u300e\u300f\u300c\u300d\uff43\uff44\u3014\u3015\u2026\u2014\uff5e\uff4f\uffe5]/;

  if (reg.test(text)) {
    alert('中文符号');
  } else {
    alert('不是中文符号');
  }
}

这个正则表达式可以匹配绝大部分常见的中文标点符号。如果你需要更多的标点符号,可以继续查找其 Unicode 编码,并将其添加到正则表达式中。

如何查找 Unicode 编码

  1. Unicode官网
    可以访问 Unicode官网 查找不同字符的 Unicode 编码。网站上提供了各种字符集、符号、语言的详细表格。

  2. Unicode工具
    有很多在线工具可以帮助你查找和转换字符到 Unicode 编码,比如:

HTML特殊字符符号大全--好玩篇记录-CSDN博客