用python进行精细中文分句（基于正则表达式），HarvestText：文本挖掘和预处理工具 1.中文分句，乍一

1.用python进行精细中文分句（基于正则表达式）

中文分句，乍一看是一个挺简单的工作，一般我们只要找到一个 【。！？】 这类的典型断句符断开就可以了吗。
对于简单的文本这个做法是已经可行了（比如我看到这篇文章里有个简洁的实现方法

然而当我处理小说文本时，发现了这种思路的漏洞：

今天上午，我去“秘密基地”了。

所以，这里我提供一个更加精细的解决方法，可以解决上面的问题：

# 版本为python3，