实现简体中文与繁体中文的相互转换--python

1,975 阅读1分钟

一、使用opencc-python

首先介绍opencc的python实现库,它具有安装简单,翻译准确,使用方便等优点。对于我们的需求完全能够胜任。使用步骤如下:

1.1 在terminal中安装opencc-python

pip install opencc-python

1.2 使用的代码demo

# -*- coding: utf8 -*-
import opencc
cc = opencc.OpenCC('t2s')
print cc.convert(u'Open Chinese Convert(OpenCC)「開放中文轉換」,是一個致力於中文簡繁轉換的項目,提供高質量詞庫和函數庫(libopencc)。')

输出为: Open Chinese Convert(OpenCC)「开放中文转换」,是一个致力于中文简繁转换的项目,提供高质量词库和函数库(libopencc)。 这里有四种内建的opencc翻译配置:

t2s - 繁体转简体(Traditional Chinese to Simplified Chinese) s2t - 简体转繁体(Simplified Chinese to Traditional Chinese) mix2t - 混合转繁体(Mixed to Traditional Chinese) mix2s - 混合转简体(Mixed to Simplified Chinese)

二、使用zhtools

2.1 中文简体和繁体转换所需Python库

<a href="https://github.com/csdz/nstools/blob/master/zhtools/zh_wiki.py">zh_wiki.py</a>

(在原作者的库中新添近一倍词库),

<a href="https://github.com/csdz/nstools/blob/master/zhtools/langconv.py">langconv</a>

2.2 使用代码

from langconv import *

def simple2tradition(line):
    #将简体转换成繁体
    line = Converter('zh-hant').convert(line.decode('utf-8'))
    line = line.encode('utf-8')
    return line

def tradition2simple(line):
    # 将繁体转换成简体
    line = Converter('zh-hans').convert(line.decode('utf-8'))
    line = line.encode('utf-8')
    return line