国产xxxx99真实实拍_久久不雅视频_高清韩国a级特黄毛片_嗯老师别我我受不了了小说

資訊專欄INFORMATION COLUMN

Python中文繁簡(jiǎn)體轉(zhuǎn)換工具

SimonMa / 660人閱讀

Openccpy
  ___   _____      __    ___     ___    ___   _____   __  __
 / __`/ "__`  /"__`/" _ `  /"___ /"___/ "__`/ / 
/ L   L /  __// / / \__// \__/  L   \_ 
 \____/  ,__/ \____ \_ \_ \____ \____  ,__//`____ 
 /___/    /  /____//_//_//____//____/   /  `/___/> 
           \_                                  \_     /\___/
           /_/                                  /_/     /__/

OpenccPy 是一款 python 中文繁簡(jiǎn)體轉(zhuǎn)換工具。

特性

支持中文繁簡(jiǎn)體轉(zhuǎn)換

Quick Start 環(huán)境要求

Python 3.X

install
pip install openccpy
使用案例
# coding=utf-8
from openccpy.opencc import *

class TestOpencc(object):
    """
    核心轉(zhuǎn)換測(cè)試類
    """

    def test_to_simple(self):
        """
        測(cè)試轉(zhuǎn)換為簡(jiǎn)體
        """
        assert "絲" == Opencc.to_simple("絲")
        assert "一目了然" == Opencc.to_simple("一目瞭然")

    def test_to_traditional(self):
        """
        測(cè)試轉(zhuǎn)化為繁體
        """
        assert "絲" == Opencc.to_traditional("絲")
        assert "一目瞭然" == Opencc.to_traditional("一目了然")
方法簡(jiǎn)介 轉(zhuǎn)為簡(jiǎn)體
def to_simple(traditional):
     """
     繁體轉(zhuǎn)化為簡(jiǎn)體
     1. 如果字符為空,直接返回
     2. 字符長(zhǎng)度為1,返回對(duì)應(yīng)簡(jiǎn)體字符
     3. 對(duì)應(yīng)長(zhǎng)度大于1,返回對(duì)應(yīng)簡(jiǎn)體詞組
     :param traditional: 繁體單詞/單個(gè)詞組
     :return: 對(duì)應(yīng)的簡(jiǎn)體信息
     """
轉(zhuǎn)為繁體
def to_traditional(simple):

    """
    簡(jiǎn)體轉(zhuǎn)化為繁體
    1. 如果字符為空,直接返回
    2. 字符長(zhǎng)度為1,返回對(duì)應(yīng)繁體字符
    3. 對(duì)應(yīng)長(zhǎng)度大于1,返回對(duì)應(yīng)繁體詞組
    :param simple: 簡(jiǎn)體單詞/單個(gè)詞組
    :return: 對(duì)應(yīng)的繁體信息
    """
相關(guān)框架

中文繁簡(jiǎn)體轉(zhuǎn)換-java 版本

源碼地址

github/openccpy

文章版權(quán)歸作者所有,未經(jīng)允許請(qǐng)勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。

轉(zhuǎn)載請(qǐng)注明本文地址:http://m.specialneedsforspecialkids.com/yun/43571.html

相關(guān)文章

  • 中文維基百科文本數(shù)據(jù)獲取與預(yù)處理

    摘要:下載數(shù)據(jù)方法使用官方的數(shù)據(jù)最新打包的中文文檔下載地址是。中文維基數(shù)據(jù)繁簡(jiǎn)混雜大家都說存在這個(gè)問題,但的網(wǎng)站是將繁體中文和簡(jiǎn)體中文分開處理的,所以一直覺得從數(shù)據(jù)庫到結(jié)構(gòu)都應(yīng)有方法將兩者區(qū)分開,暫罷,待有空研究其數(shù)據(jù)時(shí)再議。 照例,先講下環(huán)境,Mac OSX 10.11.2 ,Python 3.4.3。 下載數(shù)據(jù) 方法1:使用官方dump的xml數(shù)據(jù) 最新打包的中文文檔下載地址是:http...

    loostudy 評(píng)論0 收藏0
  • java 中文簡(jiǎn)體轉(zhuǎn)換工具 opencc4j

    摘要:創(chuàng)作緣由對(duì)于中文的繁簡(jiǎn)體轉(zhuǎn)換是一種很常見的需求。存在一個(gè)嚴(yán)重的問題特殊詞組的轉(zhuǎn)換可能存在問題。是一款非常優(yōu)秀的轉(zhuǎn)換工具。使用方式引入轉(zhuǎn)為簡(jiǎn)體生命不息,奮鬥不止結(jié)果為生命不息,奮斗不止轉(zhuǎn)為繁體生命不息,奮斗不止結(jié)果為生命不息,奮鬥不止 創(chuàng)作緣由 對(duì)于中文的繁簡(jiǎn)體轉(zhuǎn)換是一種很常見的需求。 但是很多工具類都是簡(jiǎn)單的做個(gè)映射。(使用map,集合,properties)等。 存在一個(gè)嚴(yán)重的問題:...

    nodejh 評(píng)論0 收藏0
  • Python截圖識(shí)字簡(jiǎn)單地完成流程

      工作上需要把繁體版轉(zhuǎn)化成簡(jiǎn)體中文版手機(jī)上網(wǎng)找了點(diǎn)材料,接下來本文關(guān)鍵為大家介紹了有關(guān)Python完成截圖識(shí)字的資料,原文中根據(jù)案例編碼推薦的十分詳盡,須要的小伙伴可以參考一下  1、opencc-python  首先介紹opencc中的Python實(shí)現(xiàn)庫,它具有安裝簡(jiǎn)單,翻譯準(zhǔn)確,使用方便等優(yōu)點(diǎn)。對(duì)于我們?nèi)粘5男枨笸耆軌騽偃??! ?.1安裝opencc-python  首先在terminal...

    89542767 評(píng)論0 收藏0
  • Python2.x 字符編碼終極指南

    摘要:值得注意的是,有的編碼方案不一定能表示某些信息,這時(shí)編碼就會(huì)失敗,比如就不能用來表示中文。數(shù)組的每一項(xiàng)是一個(gè)字節(jié),用來表示。所以對(duì)于字符串來說,其長(zhǎng)度等于編碼后字節(jié)的長(zhǎng)度。所以,讓來編碼解碼中文,就超出了其能力范圍。 在人機(jī)交互之字符編碼 一文中對(duì)字符編碼進(jìn)行了詳細(xì)的討論,并通過一些簡(jiǎn)單的小程序驗(yàn)證了我們對(duì)于字符編碼的認(rèn)識(shí)。但僅了解這篇文章的內(nèi)容,并不能幫我們?cè)谌粘>幊讨卸氵^一些字符編...

    Amio 評(píng)論0 收藏0
  • 基于gensim的Wiki百科中文word2vec訓(xùn)練

    摘要:而騰訊和寶馬保時(shí)捷,網(wǎng)易和寶馬保時(shí)捷將會(huì)離得較遠(yuǎn)一些。關(guān)于的使用方法,可以參考基于的實(shí)踐。下面我們分別查看同寶馬和騰訊最相近的前個(gè)詞語。可以發(fā)現(xiàn)和寶馬相近的詞大都屬于汽車行業(yè),而且是汽車品牌和騰訊相近的詞大都屬于互聯(lián)網(wǎng)行業(yè)。 Word2Vec簡(jiǎn)介 Word2Vec是詞(Word)的一種表示方式。不同于one-hot vector,word2vec可以通過計(jì)算各個(gè)詞之間的距離,來表示詞與...

    stdying 評(píng)論0 收藏0

發(fā)表評(píng)論

0條評(píng)論

最新活動(dòng)
閱讀需要支付1元查看
<