国产xxxx99真实实拍_久久不雅视频_高清韩国a级特黄毛片_嗯老师别我我受不了了小说

資訊專欄INFORMATION COLUMN

java 中文繁簡體轉換工具 opencc4j

nodejh / 3171人閱讀

摘要:創作緣由對于中文的繁簡體轉換是一種很常見的需求。存在一個嚴重的問題特殊詞組的轉換可能存在問題。是一款非常優秀的轉換工具。使用方式引入轉為簡體生命不息,奮鬥不止結果為生命不息,奮斗不止轉為繁體生命不息,奮斗不止結果為生命不息,奮鬥不止

創作緣由

對于中文的繁簡體轉換是一種很常見的需求。

但是很多工具類都是簡單的做個映射。(使用map,集合,properties)等。

存在一個嚴重的問題:特殊詞組 的轉換可能存在問題。

OpenCC

OpenCC 是一款非常優秀的轉換工具。但是沒有直接提供 Java 便于使用的 jar。

opencc4j

opencc4j 就是在上面的工具基礎上提供的 java 使用版本。

opencc4j 使用方式 maven 引入

    com.github.houbb
    opencc4j
    1.0.2
轉為簡體
String original = "生命不息,奮鬥不止";
String result = ZhConverterUtil.convertToSimple(original);

結果為

生命不息,奮斗不止
轉為繁體
String original = "生命不息,奮斗不止";
String result = ZhConverterUtil.convertToTraditional(original);

結果為

生命不息,奮鬥不止

文章版權歸作者所有,未經允許請勿轉載,若此文章存在違規行為,您可以聯系管理員刪除。

轉載請注明本文地址:http://m.specialneedsforspecialkids.com/yun/76447.html

相關文章

  • NLP 開源形近字算法補完計劃(完結篇)

    摘要:本文將作為漢字相似度的完結篇,為該系列畫上一個句號。起中文形近字相似度計算思路承中文形近字相似度算法實現,為漢字盡一點綿薄之力轉當代中國最貴的漢字是什么不足之處之所以有本篇,是因為上一次的算法實現存在一些不足。 前言所有的故事都有開始,也終將結束。本文將作為 NLP 漢字相似度的完結篇,為該系列畫上一個句號。起...

    番茄西紅柿 評論0 收藏2637
  • Python中文簡體轉換工具

    Openccpy ___ _____ __ ___ ___ ___ _____ __ __ / __`/ __` /__`/ _ ` /___ /___/ __`/ / / L L / __// / / \__// \__/ L \_ \____/ ,__/ \____ \_ \_ \____ \____ ,__//`__...

    SimonMa 評論0 收藏0
  • 中文維基百科文本數據獲取與預處理

    摘要:下載數據方法使用官方的數據最新打包的中文文檔下載地址是。中文維基數據繁簡混雜大家都說存在這個問題,但的網站是將繁體中文和簡體中文分開處理的,所以一直覺得從數據庫到結構都應有方法將兩者區分開,暫罷,待有空研究其數據時再議。 照例,先講下環境,Mac OSX 10.11.2 ,Python 3.4.3。 下載數據 方法1:使用官方dump的xml數據 最新打包的中文文檔下載地址是:http...

    loostudy 評論0 收藏0

發表評論

0條評論

最新活動
閱讀需要支付1元查看
<