摘要:從行,可以看出字符串的存儲結(jié)構(gòu)是字符數(shù)組。如果不相等,則返回兩字符的編碼值的差值第行當(dāng)前字符串和另一個字符串,依次字符比較。如果均相等,則返回兩個字符串長度的差值所以要排序,肯定先有比較能力,即實現(xiàn)接口。
摘要: 原創(chuàng)出處 https://www.bysocket.com 「公眾號:泥瓦匠BYSocket 」歡迎關(guān)注和轉(zhuǎn)載,保留摘要,謝謝!
這是泥瓦匠的第103篇原創(chuàng)
《程序兵法:Java String 源碼的排序算法(一)》文章工程:
* JDK 1.8
* 工程名:algorithm-core-learning # StringComparisonDemo
* 工程地址:https://github.com/JeffLi1993/algorithm-core-learning
Q:什么是選擇問題?
選擇問題,是假設(shè)一組 N 個數(shù),要確定其中第 K 個最大值者。比如 A 與 B 對象需要哪個更大?又比如:要考慮從一些數(shù)組中找出最大項?
解決選擇問題,需要對象有個能力,即比較任意兩個對象,并確定哪個大,哪個小或者相等。找出最大項問題的解決方法,只要依次用對象的比較(Comparable)能力,循環(huán)對象列表,一次就能解決。
那么 JDK 源碼如何實現(xiàn)比較(Comparable)能力的呢?
二、java.lang.Comparable 接口Comparable 接口,從 JDK 1.2 版本就有了,歷史算悠久。Comparable 接口強制了實現(xiàn)類對象列表的排序。其排序稱為自然順序,其 compareTo 方法,稱為自然比較法。
該接口只有一個方法 public int compareTo(T o); ,可以看出
入?yún)?T o :實現(xiàn)該接口類,傳入對應(yīng)的要被比較的對象
返回值 int:正數(shù)、負(fù)數(shù)和 0 ,代表大于、小于和等于
對象的集合列表(Collection List)或者數(shù)組(arrays) ,也有對應(yīng)的工具類可以方便的使用:
java.util.Collections#sort(List) 列表排序
java.util.Arrays#sort(Object[]) 數(shù)組排序
那 String 對象如何被比較的?
三、String 源碼中的算法String 源碼中可以看到 String JDK 1.0 就有了。那么應(yīng)該是 JDK 1.2 的時候,String 類實現(xiàn)了 Comparable 接口,并且傳入需要被比較的對象是 String。對象如圖:
String 是一個 final 類,無法從 String 擴展新的類。從 114 行,可以看出字符串的存儲結(jié)構(gòu)是字符(Char)數(shù)組。先可以看看一個字符串比較案例,代碼如下:
/**
* 字符串比較案例
*
* Created by bysocket on 19/5/10.
*/
public class StringComparisonDemo {
public static void main(String[] args) {
String foo = "ABC";
// 前面和后面每個字符完全一樣,返回 0
String bar01 = "ABC";
System.out.println(foo.compareTo(bar01));
// 前面每個字符完全一樣,返回:后面就是字符串長度差
String bar02 = "ABCD";
String bar03 = "ABCDE";
System.out.println(foo.compareTo(bar02)); // -1 (前面相等,foo 長度小 1)
System.out.println(foo.compareTo(bar03)); // -2 (前面相等,foo 長度小 2)
// 前面每個字符不完全一樣,返回:出現(xiàn)不一樣的字符 ASCII 差
String bar04 = "ABD";
String bar05 = "aABCD";
System.out.println(foo.compareTo(bar04)); // -1 (foo 的 "C" 字符 ASCII 碼值為 67,bar04 的 "D" 字符 ASCII 碼值為 68。返回 67 - 68 = -1)
System.out.println(foo.compareTo(bar05)); // -32 (foo 的 "A" 字符 ASCII 碼值為 65,bar04 的 "a" 字符 ASCII 碼值為 97。返回 65 - 97 = -32)
String bysocket01 = "泥瓦匠";
String bysocket02 = "瓦匠";
System.out.println(bysocket01.compareTo(bysocket02));// -2049 (泥 和 瓦的 Unicode 差值)
}
}
運行結(jié)果如下:
0 -1 -2 -1 -32 -2049
可以看出, compareTo 方法是按字典順序比較兩個字符串。具體比較規(guī)則可以看代碼注釋。比較規(guī)則如下:
字符串的每個字符完全一樣,返回 0
字符串前面部分的每個字符完全一樣,返回:后面就是兩個字符串長度差
字符串前面部分的每個字符存在不一樣,返回:出現(xiàn)不一樣的字符 ASCII 碼的差值
中文比較返回對應(yīng)的 Unicode 編碼值(Unicode 包含 ASCII)
foo 的 ‘C’ 字符 ASCII 碼值為 67
bar04 的 ‘D’ 字符 ASCII 碼值為 68。
foo.compareTo(bar04),返回 67 – 68 = -1
常見字符 ASCII 碼,如圖所示
再看看 String 的 compareTo 方法如何實現(xiàn)字典順序的。源碼如圖:
源碼解析如下:
第 1156 行:獲取當(dāng)前字符串和另一個字符串,長度較小的長度值 lim
第 1161 行:如果 lim 大于 0 (較小的字符串非空),則開始比較
第 1164 行:當(dāng)前字符串和另一個字符串,依次字符比較。如果不相等,則返回兩字符的 Unicode 編碼值的差值
第 1169 行:當(dāng)前字符串和另一個字符串,依次字符比較。如果均相等,則返回兩個字符串長度的差值
所以要排序,肯定先有比較能力,即實現(xiàn) Comparable 接口。然后實現(xiàn)此接口的對象列表(和數(shù)組)可以通過 Collections.sort(和 Arrays.sort)進行排序。
還有 TreeSet 使用樹結(jié)構(gòu)實現(xiàn)(紅黑樹),集合中的元素進行排序。其中排序就是實現(xiàn) Comparable 此接口
另外,如果沒有實現(xiàn) Comparable 接口,使用排序時,會拋出 java.lang.ClassCastException 異常。詳細(xì)看《Java 集合:三、HashSet,TreeSet 和 LinkedHashSet比較》https://www.bysocket.com/archives/195
四、小結(jié)上面也說到,這種比較其實有一定的弊端:
默認(rèn) compareTo 不忽略字符大小寫。如果需要忽略,則重新自定義 compareTo 方法
無法進行二維的比較決策。比如判斷 2 * 1 矩形和 3 * 3 矩形,哪個更大?
比如有些類無法實現(xiàn)該接口。一個 final 類,也無法擴展新的類。其也有解決方案:函數(shù)對象(Function Object)
方法參數(shù):定義一個沒有數(shù)據(jù)只有方法的類,并傳遞該類的實例。一個函數(shù)通過將其放在一個對象內(nèi)部而被傳遞。這種對象通常叫做函數(shù)對象(Funtion Object)
在接口方法設(shè)計中, T execute(Callback callback) 參數(shù)中使用 callback 類似。比如在 Spring 源碼中,可以看出很多設(shè)計是:聚合優(yōu)先于繼承或者實現(xiàn)。這樣可以減少很多繼承或者實現(xiàn)。類似 SpringJdbcTemplate 場景設(shè)計,可以考慮到這種 Callback 設(shè)計實現(xiàn)。
代碼示例本文示例讀者可以通過查看下面?zhèn)}庫的中: StringComparisonDemo 字符串比較案例案例:
Github:github.com/JeffLi1993/…
Gitee:gitee.com/jeff1993/al…
如果您對這些感興趣,歡迎 star、follow、收藏、轉(zhuǎn)發(fā)給予支持!
參考資料《數(shù)據(jù)結(jié)構(gòu)與算法分析:Java語言描述(原書第3版)》
https://en.wikipedia.org/wiki/Unicode
https://www.cnblogs.com/vamei/tag/%E7%AE%97%E6%B3%95/
https://www.bysocket.com/archives/2314/algorithm
以下專題教程也許您會有興趣《程序兵法:算法與數(shù)據(jù)結(jié)構(gòu)》 https://www.bysocket.com/archives/2314/algorithm
《Spring Boot 2.x 系列教程》
https://www.bysocket.com/springboot
《Java 核心系列教程》
https://www.bysocket.com/archives/2100
(關(guān)注微信公眾號,領(lǐng)取 Java 精選干貨學(xué)習(xí)資料)
(添加我微信:bysocket01。加入純技術(shù)交流群,成長技術(shù))
文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請注明本文地址:http://m.specialneedsforspecialkids.com/yun/7345.html
摘要:減少垃圾收集壓力因為所有長生命周期的數(shù)據(jù)都是在的管理內(nèi)存中以二進制表示的,所以所有數(shù)據(jù)對象都是短暫的,甚至是可變的,并且可以重用。當(dāng)然,并不是唯一一個基于且對二進制數(shù)據(jù)進行操作的數(shù)據(jù)處理系統(tǒng)。 showImg(https://segmentfault.com/img/remote/1460000020044119?w=1280&h=853); 前言 如今,許多用于分析大型數(shù)據(jù)集的開源系...
摘要:到十二月份,公司開始第二波裁員,我決定主動拿賠償走人。加一個小插曲上面的題是餓了嗎面試問到的。想去的公司沒有面試好,不要氣餒,繼續(xù)加油準(zhǔn)備。避免打擊自信心。 回顧一下自己這段時間的經(jīng)歷,九月份的時候,公司通知了裁員,我匆匆忙忙地出去面了幾家,但最終都沒有拿到offer,我感覺今年的寒冬有點冷。到十二月份,公司開始第二波裁員,我決定主動拿賠償走人。后續(xù)的面試過程我做了一些準(zhǔn)備,基本都能走...
摘要:原文地址游客前言金三銀四,很多同學(xué)心里大概都準(zhǔn)備著年后找工作或者跳槽。最近有很多同學(xué)都在交流群里求大廠面試題。 最近整理了一波面試題,包括安卓JAVA方面的,目前大廠還是以安卓源碼,算法,以及數(shù)據(jù)結(jié)構(gòu)為主,有一些中小型公司也會問到混合開發(fā)的知識,至于我為什么傾向于混合開發(fā),我的一句話就是走上編程之路,將來你要學(xué)不僅僅是這些,豐富自己方能與世接軌,做好全棧的裝備。 原文地址:游客kutd...
閱讀 863·2021-11-24 09:38
閱讀 1096·2021-10-08 10:05
閱讀 2587·2021-09-10 11:21
閱讀 2809·2019-08-30 15:53
閱讀 1834·2019-08-30 15:52
閱讀 1973·2019-08-29 12:17
閱讀 3423·2019-08-29 11:21
閱讀 1616·2019-08-26 12:17