2020-12-20 python库省市区

337 阅读3分钟

本文已参与「新人创作礼」活动,一起开启掘金创作之路。

前情提要:由于有同事用了cpca这个库,所以去看了一下,然后提了一些PR,不过里面的数据有点旧,希望哪天可以参考github.com/mumuy/data_….

chinese_province_city_area_mapper chinese_province_city_area_mapper:一个用于识别简体中文字符串中省,市和区并能够进行映射,检验和简单绘图的python模块

举个例子::

1 ["徐汇区虹漕路461号58号楼5楼", "泉州市洛江区万安塘西工业区"]
2        ↓ 转换

|省 |市 |区 |地址 |

|上海市|上海市|徐汇区|虹漕路461号58号楼5楼 |

|福建省|泉州市|洛江区|万安塘西工业区 |

chinese_province_city_area_mapper: built to be recognize Chinese province,city and area in simplified Chinese string, it can automaticall map area to city and map city to province.

for example::

1 ["徐汇区虹漕路461号58号楼5楼", "泉州市洛江区万安塘西工业区"]
2transform

|省 |市 |区 |地址 |

|上海市|上海市|徐汇区|虹漕路461号58号楼5楼 |

|福建省|泉州市|洛江区|万安塘西工业区 |

完整文档见该模块的Github, GitHub: github.com/DQinYuan/ch… github.com/DQinYuan/ch…_

安装说明 代码目前仅仅支持python3 pip install cpca

Get Started 本模块中最主要的方法是cpca.transform, 该方法可以输入任意的可迭代类型(如list,pandas的Series类型等), 然后将其转换为一个DataFrame,下面演示一个最为简单的使用方法::

location_str = ["徐汇区虹漕路461号58号楼5楼", "泉州市洛江区万安塘西工业区", "北京朝阳区北苑华贸城"]
import cpca
df = cpca.transform(location_str)
df

输出的结果为:

0 省     市     区          地址              adcode
   
1 上海市 上海市  徐汇区     虹漕路461号58号楼5楼  310104

2 福建省 泉州市  洛江区     万安塘西工业区        350504
3 北京市 市辖区  朝阳区     北苑华贸城           110105

如果还想知道更多的细节,请访问该 模块的github地址 github.com/DQinYuan/ch… github.com/DQinYuan/ch…_,

在那里我写了更多的细节% (chinese_province_city_area_mapper)

github/chinese_province_city_area_mapper [master●] » cl

(chinese_province_city_area_mapper) github/chinese_province_city_area_mapper [master●] »

cat README.rst

chinese_province_city_area_mapper

chinese_province_city_area_mapper:一个用于识别简体中文字符串中省,市和区并能够进行映射,检验和简

单绘图的python模块

举个例子::

1 ["徐汇区虹漕路461号58号楼5楼", "泉州市洛江区万安塘西工业区"]
2        ↓ 转换

|省 |市 |区 |地址 |

|上海市|上海市|徐汇区|虹漕路461号58号楼5楼 |

|福建省|泉州市|洛江区|万安塘西工业区 |

chinese_province_city_area_mapper: built to be recognize Chinese province,city and area in simplified Chinese string, it can automaticall map area to city and map city to province.

for example::

1 ["徐汇区虹漕路461号58号楼5楼", "泉州市洛江区万安塘西工业区"]
2transform

|省 |市 |区 |地址 |

|上海市|上海市|徐汇区|虹漕路461号58号楼5楼 |

|福建省|泉州市|洛江区|万安塘西工业区 |

完整文档见该模块的Github, GitHub: github.com/DQinYuan/ch… github.com/DQinYuan/ch…_

安装说明

代码目前仅仅支持python3

pip install cpca

Get Started

本模块中最主要的方法是cpca.transform,

该方法可以输入任意的可迭代类型(如list,pandas的Series类型等),

然后将其转换为一个DataFrame,下面演示一个最为简单的使用方法::

location_str = ["徐汇区虹漕路461号58号楼5楼", "泉州市洛江区万安塘西工业区", "北京朝阳区北苑华贸城"]
import cpca
df = cpca.transform(location_str)
df

输出的结果为::

0   省     市    区          地址              adcode
1 上海市 上海市  徐汇区     虹漕路461号58号楼5楼  310104
2 福建省 泉州市  洛江区     万安塘西工业区        350504
3 北京市 市辖区  朝阳区     北苑华贸城           110105

如果还想知道更多的细节,请访问该 模块的github地址 github.com/DQinYuan/ch… github.com/DQinYuan/ch…_, 在那里有更多的细节