常见的中文标点符号及其 Unicode 编码
| 符号 | Unicode 编码 |
|---|---|
| 。 | \u3002 |
| ? | \uff1f |
| ! | \uff01 |
| , | \uff0c |
| 、 | \u3001 |
| ; | \uff1b |
| : | \uff1a |
| “ | \u201c |
| ” | \u201d |
| ‘ | \u2018 |
| ’ | \u2019 |
| ( | \uff08 |
| ) | \uff09 |
| 《 | \u300a |
| 》 | \u300b |
| 〈 | \u3008 |
| 〉 | \u3009 |
| 【 | \u3010 |
| 】 | \u3011 |
| 『 | \u300e |
| 』 | \u300f |
| 「 | \u300c |
| 」 | \u300d |
| ﹃ | \ufe43 |
| ﹄ | \ufe44 |
| 〔 | \u3014 |
| 〕 | \u3015 |
| … | \u2026 |
| — | \u2014 |
| ~ | \uff5e |
| ﹏ | \ufe4f |
| ¥ | \uffe5 |
正则表达式示例
基于上述 Unicode 编码,可以扩展正则表达式,例如这样:
// 匹配中文标点符号(包括上述符号),弹出提示
checkUnicode(text) {
var reg = /[\u3002\uff1f\uff01\uff0c\u3001\uff1b\uff1a\u201c\u201d\u2018\u2019\uff08\uff09\u300a\u300b\u3008\u3009\u3010\u3011\u300e\u300f\u300c\u300d\uff43\uff44\u3014\u3015\u2026\u2014\uff5e\uff4f\uffe5]/;
if (reg.test(text)) {
alert('中文符号');
} else {
alert('不是中文符号');
}
}
这个正则表达式可以匹配绝大部分常见的中文标点符号。如果你需要更多的标点符号,可以继续查找其 Unicode 编码,并将其添加到正则表达式中。
如何查找 Unicode 编码
-
Unicode官网
可以访问 Unicode官网 查找不同字符的 Unicode 编码。网站上提供了各种字符集、符号、语言的详细表格。 -
Unicode工具
有很多在线工具可以帮助你查找和转换字符到 Unicode 编码,比如: