摘要:多拼音格式輸出支持支持多種拼音輸出格式帶音標不帶音標數字表示音標以及拼音首字母輸出格式常見多音字識別支持常見多音字的識別,其中包括詞組成語地名等簡繁體中文轉換經對比以上三個類庫,個人認為更加適合。
1、目前在百度或谷歌上搜索“java漢字轉拼音”,主要有以下三種: 1)piny4j:搜索結果介紹文章最多的,然而此類庫對生僻字支持不好,轉換時會報空指針(java.lang.NullPointerException)錯誤,如漢字“栆” 2)unidecode:介紹較少,google的han2pinyin作廢后的推薦類庫,詳見http://code.google.com/p/han2... 3)JPinyin是一個漢字轉拼音的Java開源類庫,在PinYin4j的功能基礎上做了一些改進
【JPinyin主要特性】
①、準確、完善的字庫;
Unicode編碼從4E00-9FA5范圍及3007(〇)的20903個漢字中,JPinyin能轉換除46個異體字(異體字不存在標準拼音)之外的所有漢字;
②、拼音轉換速度快;
經測試,轉換Unicode編碼從4E00-9FA5范圍的20902個漢字,JPinyin耗時約100毫秒。
③、多拼音格式輸出支持;
JPinyin支持多種拼音輸出格式:帶音標、不帶音標、數字表示音標以及拼音首字母輸出格式;
④、常見多音字識別;
JPinyin支持常見多音字的識別,其中包括詞組、成語、地名等;
⑤、簡繁體中文轉換
經對比以上三個類庫,個人認為jpinyin更加適合。
另:暫時發現缺陷是jpinyin不能解析“厼”,unidecode中解析出的拼音為“uk”,而“厼”為韓國漢字(讀音yi),因此使用jpinyin解析拼音也沒問題
1.jpinyin的github下載地址:
https://github.com/stuxuhai/j...
2.unidecode下載地址:
https://github.com/xuender/un...
3.pinyin4j下載地址:
https://github.com/belerweb/p...
文章版權歸作者所有,未經允許請勿轉載,若此文章存在違規行為,您可以聯系管理員刪除。
轉載請注明本文地址:http://m.specialneedsforspecialkids.com/yun/67843.html
摘要:如果轉進制,則位進制只能表示個漢字,這個太少了。假設我們用個進制的字符,則可以表示,表示個漢字綽綽有余,但這時候需要多個字符。 項目地址:https://github.com/xinglie/pi... 壓縮說明 為了便于在網絡上的傳輸,本人想辦法寫了一個壓縮算法,目前這個版本是壓縮好的,帶自解壓功能以下說明壓縮思路: 理想狀態下是使用Stirng.prototype.localCom...
摘要:拼音字符轉換圖將中文編碼成拼音要轉換為拼音的字符串返回格式每個字的首字母全拼音字符串字母中文轉換到拼音每次處理一個字符待處理字符雙字節拼音結果為拼音首字母測試文字結果為全拼音測試文字結果為第一個拼音測試文字 class Pinyin { /** * 拼音字符轉換圖 * @var array */ private $data = array(...
閱讀 1740·2021-10-18 13:30
閱讀 2621·2021-10-09 10:02
閱讀 2969·2021-09-28 09:35
閱讀 2097·2019-08-26 13:39
閱讀 3529·2019-08-26 13:36
閱讀 1956·2019-08-26 11:46
閱讀 1139·2019-08-23 14:56
閱讀 1700·2019-08-23 10:38