摘要:實際上這個情形中存在冪定律實際上絕大多數(shù)的計算機算法的運行時間滿足冪定律?;谘芯康弥?,原則上我們能夠獲得算法,程序或者操作的性能的精確數(shù)學(xué)模型。
前言
上一篇:并查集
下一篇:棧和隊列
在算法性能上我們常常面臨的挑戰(zhàn)是我們的程序能否求解實際中的大型輸入:
--為什么程序運行的慢?
--為什么程序耗盡了內(nèi)存?
沒有理解算法的性能特征會導(dǎo)致客戶端的性能很差,為了避免這種情況的出線,需要具備算法分析的一些知識。
此篇主要涉及一些基礎(chǔ)數(shù)學(xué)知識和科學(xué)方法,以及如何在實踐應(yīng)用中使用這些方法理解算法的性能。我們的重點放在獲得性能的預(yù)測上。
主要分為5部分:
觀察特點 (observations)
數(shù)學(xué)模型 (mathematical models)
增長階數(shù)分類 (order-of-growth classifications)
算法理論 (theory of algorithms)
內(nèi)存使用 (memory)
注:下文我所的增長量級和增長階數(shù)是一個東西其實...
我們將從多種不同的角色思考這些問題:
程序員:解決一個問題,讓算法能夠工作,并部署它
用戶:完成某項工作,但不關(guān)心程序做了什么
理論家:想要理解發(fā)生的事情
團隊:可能需要完成以上角色的所有工作
關(guān)于算法分析需要集中考慮的關(guān)鍵是運行時間。運行時間也可以理解為完成一項計算我們需要進行多少次操作。
這里主要關(guān)心:
預(yù)測算法的性能
比較完成同一任務(wù)不同算法的性能
在最壞情況下算法性能的底線
理解算法如何運行的一些理論基礎(chǔ)
算法分析的科學(xué)方法概述:
從自然界中觀察某些特征(程序在計算機上的運行時間)
提出假設(shè)模型(與觀察到的現(xiàn)象相一致的模型)
預(yù)測(利用上邊的假設(shè)做出合理的預(yù)測,一般用來預(yù)測更大問題規(guī)模,或者另一臺計算機上的運行時間)
驗證(作更多的觀察來驗證我們的預(yù)測)
證實(重復(fù)地驗證直到證實我們的模型和觀察的特征吻合,證實我們的模型假設(shè)是正確的)
使用科學(xué)方法有一些基本原則:
別人做同樣的實驗也會得到相同的結(jié)果
假設(shè)必須具備某個特殊性質(zhì):可證偽性
(可證偽性:指從一個理論推導(dǎo)出來的結(jié)論(解釋、預(yù)見)在邏輯上或原則上要有與一個或一組觀察陳述與之發(fā)生沖突或抵觸的可能。
可證偽,不等于已經(jīng)被證偽;可證偽,不等于是錯的。)
第一步是要觀察算法的性能特點,這里就是要觀察程序的運行時間。
給程序計時的方法:
看表(你沒看錯,簡單粗暴)
利用API:很多第三方或者Java標(biāo)準(zhǔn)庫中有一個秒表類,可以計算用掉的時間
(如apache commons lang,springframework的工具包都有,這里使用stdlib庫中的Stopwatch API 進行時間監(jiān)控)
我們將使用 3-SUM 問題作為觀察的例子。
3-SUM問題描述三數(shù)之和。如果有N個不同的整數(shù),以3個整數(shù)劃為一組,有多少組整數(shù)只和為0.
如下圖,8ints.txt 有8個整數(shù),有四組整數(shù)和為0
目標(biāo)是編寫一個程序,能對任意輸入計算出3-SUM整數(shù)和為0有多少組。
這個程序?qū)崿F(xiàn)的算法也很簡單,首先是第一種,“暴力算法”
"暴力算法"EN:brute-force algorithm
這里使用第三方API的方法測量程序運行的時間。
import edu.princeton.cs.algs4.StdIn; import edu.princeton.cs.algs4.StdOut; import edu.princeton.cs.algs4.Stopwatch; public class ThreeSum { public static int count(int[] a) { int N = a.length; int count = 0; //三重的for循環(huán),檢查每三個整數(shù)組合 for (int i = 0; i < N; i++) for (int j = i + 1; j < N; j++) for (int k = j + 1; k < N; k++) //為了方便觀察算法的性能問題,這里忽略了整型溢出問題的處理 if (a[i] + a[j] + a[k] == 0) count++; return count; } /** * 讀入所有整數(shù),輸出count的值 * 利用StopWatch執(zhí)行時間監(jiān)控 * @param args */ public static void main(String[] args) { int[] a = StdIn.readAllInts(); Stopwatch stopwatch = new Stopwatch(); StdOut.println(ThreeSum.count(a)); double time = stopwatch.elapsedTime(); } }實證分析
測試數(shù)據(jù)可以用越來越大的輸入來運行。每次將輸入的大小翻倍,程序會運行得更久。通過類似的測試,有時能相當(dāng)方便和快速地評估程序什么時候結(jié)束。
數(shù)據(jù)分析通過實證得出的數(shù)據(jù),可以建立圖像,使觀察更直觀:
標(biāo)準(zhǔn)坐標(biāo) :Y軸:運行時間;X軸:輸入大小
雙對數(shù)坐標(biāo):Y軸:取運行時間的對數(shù);X軸:取問題輸入大小的對數(shù)
(lg以2為底)
使用雙對數(shù)坐標(biāo)通常情況下是得到一條直線,這條直線的斜率就是問題的關(guān)鍵。
這個例子(3-SUM 暴力算法)的斜率是3
--通過對數(shù)坐標(biāo)的方法得出公式:lg(T(N)) = blgN + c (可看做 y = b*x + c,其中 y = lg(T(N)),x = lgN)
--通過圖中兩點可求出b,c值,如果等式兩邊同時取2的冪,就得到 T(N) = 2^c*N^b, 其中 2^c 為一個常數(shù),可記作 a
由此,從這個模型的觀察中我們就得到了程序的運行時間,通過一些數(shù)學(xué)計算(在這里是回歸運算),我們就知道得出了運行時間:
T(N) = a*N^b (b為雙對數(shù)坐標(biāo)中直線的斜率,同時 b 也是這個算法的增長量級,第三點會講到)
假設(shè)
通過上述的數(shù)據(jù)分析,我們得出假設(shè):
運行時間看起來大約是 1.006 × 10^–10 × N^2.999 (秒)
預(yù)測
可以運用這個假設(shè)繼續(xù)做預(yù)測,只要帶入不同的N值,就能計算出需要的大致時間。
?51.0 seconds for N = 8,000.
?408.1 seconds for N = 16,000.
驗證
通過對比 程序?qū)嶋H運行時間(下圖) 和 通過我們的假設(shè)模型預(yù)測的時間上一步) 可以看出結(jié)果非常相近 (51.0 vs ~51.0/408.1 vs ~410.8)
這個模型幫助我們在不需要花時間運行試驗的前提下做一些預(yù)測。實際上這個情形中存在冪定律(a*N^b).實際上絕大多數(shù)的計算機算法的運行時間滿足冪定律。
下邊介紹一種求解符合冪定律運行時間中的增長量級值(b)的方法
Doubling hypothesis 方法計算b值
這里可以通過 Doubling hypothesis 的方法可以快速地估算出冪定律關(guān)系中的 b 值:
運行程序,將每次輸入的大小翻倍(doubling size of the input),然后計算出N和2N運行時間的比率。主要看下圖的后幾行運算時間比率,前幾行的輸入值小,以現(xiàn)在的計算機運算能力處理起來,立方級別的增量級運算速度快也相差無幾。
ratio ≈ T(2N)/T(N)
至于為什么 0.8/0.1≈7.7 或其他看起來 "運算錯誤" 類似的情況,是因為圖上的運行時間的記錄是簡化精確到了小數(shù)點后一位,實際運算比率值是使用了實際運行時間(精確到小數(shù)點后幾位)去計算的,所以會出現(xiàn)0.8/0.1≈7.7。
通過不斷地進行雙倍輸入實驗,可以看到比率會收斂到一個常數(shù)(這里為8),而實際上比率的對數(shù)會收斂到N的指數(shù),也就是 b 的值,這里粗暴算法的 b 值就等于3
通過Doubling hypothesis方法我們又能提出假設(shè):
此算法的運行時間大約是 a*N^b, 其中 b = lg ratio
注意:Doubling hypothesis 不適用于識別對數(shù)因子
計算a值
得出 b 的值后,在某個大的輸入值上運行程序,就能求出 a 值。
由此得出假設(shè):運行時間 ≈ 0.998 × 10^–10 × N^3 (秒)
我們通過作圖得出的模型( ≈ 1.006 × 10^–10 × N^2.999 )和我們通過Doubling hypothesis方法得出的模型是很接近的。
計算機中有很多的因素也會影響運行時間,但是關(guān)鍵因素一般和計算機的型號無關(guān)。
影響因素關(guān)鍵的因素即為你使用的算法和數(shù)據(jù). 決定冪定律中的 b 值
還有很多與系統(tǒng)相關(guān)的因素:
硬件配置:CPU,內(nèi)存,緩存...
軟件環(huán)境:編譯器,解析器,垃圾回收器...
計算機的系統(tǒng):操作系統(tǒng),網(wǎng)絡(luò),其它應(yīng)用...
以上所有因素,包括關(guān)鍵因素,都決定了冪定律中的 a 值
現(xiàn)代計算機系統(tǒng)中硬件和軟件是非常復(fù)雜的,有時很難獲得非常精確的測量,但是另一方面我們不需要像其他科學(xué)中需要犧牲動物或者向一顆行星發(fā)射探測器這些復(fù)雜地方法,我們只需要進行大量的實驗,就能理解和得到我們想要知道的影響因子(的值)。
數(shù)學(xué)模型通過觀察發(fā)生了什么能夠讓我們對性能作出預(yù)測,但是并不能幫助我們理解算法具體做了什么。通過數(shù)學(xué)模型更有利于我們理解算法的行為。
我們可以通過識別所有的基本操作計算出程序的總運行時間。
致敬一下,Don Knuth 在二十世紀(jì)60年代末便提出和推廣了運行時間的數(shù)學(xué)模型:sum(操作的開銷 * 操作執(zhí)行的頻率)
需要分析程序以確執(zhí)行了哪些操作。
計算機以及系統(tǒng)的開銷取決于機器,編譯器。
頻率分析將我們引向數(shù)學(xué)方法,它取決于算法,輸入數(shù)據(jù)。
基于 knuth 研究得知,原則上我們能夠獲得算法,程序或者操作的性能的精確數(shù)學(xué)模型。
基本操作的開銷基本操作的開銷一般都是一個取決于計算機及系統(tǒng)的常量,如果想要知道這個常量是多少,可以對一個基本操作運行成千上萬的實驗的方式算出。比如可以進行十億次的加法,然后得出在你運行的計算機系統(tǒng)上進行 a + b 的基本操作花費大概 2.1 納秒
為了方便建立數(shù)學(xué)模型,絕大多數(shù)的情況下我們只要 假定它是某個常數(shù) cn (n:1,2,3...) 就可以。
下圖羅列了一下基本操作和其開銷
關(guān)于N:當(dāng)我們在處理一組對象時,假設(shè)有N個對象,有一些操作需要的時間和N成正比。比如第六行,分配一個大小為N的數(shù)組是,需要正比于N的時間,因為在Java中默認(rèn)吧數(shù)組中的每個元素初始化為0.
還有些運行時間去決定系統(tǒng)的實現(xiàn),比如連接兩個字符串需要的運行時間與字符串的長度(N)成正比,連接字符串并不等同于加法運算
1-SUM 為例
數(shù)組中有多少個元素等于0
public class OneSum { public static int count(int[] a) { int N = a.length; int count = 0; for (int i = 0; i < N; i++) if(a[i] == 0) count++; return count; } }
其中幾項操作的頻率取決于N的輸入
2-SUM 為例
數(shù)組中有多少對元素等于0
public class TwoSum { public static int count(int[] a) { int N = a.length; int count = 0; for (int i = 0; i < N; i++) for (int j = i + 1; j < N; j++) if (a[i] + a[j] == 0) count++; return count; } }
額外稍微解釋下數(shù)據(jù)怎么算來的,如果已經(jīng)了解可以略過以下細(xì)致的解釋。
j 每次迭代的增量都取決于 i 的值,因為 j 被初始化為 i + 1
便于理解可以用具體數(shù)值帶入:
假設(shè) N = 5
當(dāng) i == 0 時,i 遞增到 1,遞增了 1 次;j 從 1 遞增到 5,遞增了4次;i 和 j 一起遞增了 5 次
當(dāng) i == 0 時,i 進行了 1 次 i < N 的比較,j 進行了 5 次 j < 5 的比較,i 和 j 一起進行了 6 次比較
將具體泛化:
a) < 比較 : 離散求和公式:0 + 1 + 2 +...+ N + (N+1) = ?(N+1)(N+2)
即當(dāng) i == 0 時,j < N 的比較會進行 N 次,因此總的來說,i 的第一次迭代中**i和j**一起有 N + 1 次比較操作 而后 i 遞增,對于 i == 1 的下一次迭代,j < N 進行了 N - 1 次,在i的第二次迭代中,**i和j一起**有N次比較操作 即 i 每加 1,j 都會在上一層比較的基礎(chǔ)上少比較一次 直到 i == N, j 不再進行比較操作,i 和 j 一共有 1 次比較操作 i + j 總共進行 < N 比較操作的頻率利用離散求和就是?(N+1)(N+2)
b) == 比較 : 離散求和:0 + 1 + 2 +...+ (N-2) + (N-1) = ? N (N ? 1)
即當(dāng) i == 0 時,j 將會迭代 N-1 (從1到N-1) 次 而后 i == 1 時,j 將會迭代 N-2 (從2到N-1) 次 當(dāng) i == N 時,j 將不會再迭代,即 0 次結(jié)束 即 i 每加 1,j 都會在上一層迭代的基礎(chǔ)上少迭代一次 利用離散求和得出 j 的迭代次數(shù)為 ? N (N ? 1) j 的 迭代頻率與進行“==”比較的操作頻率是一樣的,所判斷相等的操作頻率就等于? N (N ? 1)
c) 數(shù)組訪問 : 假設(shè)我們假設(shè)編譯器/JVM沒有優(yōu)化數(shù)組訪問的情況下
每次進行相等比較都會有兩次數(shù)組訪問的操作,所以是? N (N ? 1) * 2 = N (N ? 1)
d) 增量{++} : ? N(N+1) to N^2.,coursera上ppt的? N (N ? 1) to N (N ? 1)是錯的
Mathematical Models, slide 28, 30, 32. Number of increments should be ? N(N+1) to N^2.
(參見coursera 課程勘誤表Resources--Errata)
當(dāng) i == 0 時,i 先進行遞增,j 也遞增了 N-1 次,因此總的來說,i 的第一次迭代中**i和j**一起有 N 個遞增 然后i遞增,對于 i == 1 的下一次迭代,j 將遞增 N-2 次,在i的第二次迭代中,**i和j一起**給出N-1個增量。 一直到 i == N,**i和j一共**只有一次遞增 (j 不再遞增) 同樣利用離散求和:N +(N-1)+ ... + 2 + 1,**i和j一起給出** ?N(N+1)個增量 下限 : ? N(N+1)(假設(shè)計數(shù)完全沒有增加,即count沒有增加,只有上訴 i 和 j 進行了增量)。 上限 : 我們假設(shè)計數(shù)器count在每次循環(huán)都增加,count++執(zhí)行的次數(shù)與“等于比較”的次數(shù)相同,因此我們得到 ? N(N+1) + ? N(N-1) = N^2數(shù)學(xué)表示的簡化
第一種簡化
原則上我們是可以算出這些精確的次數(shù),可是這樣太繁瑣。圖靈大佬1947年就提出了,其實我們測量計算過程中的工作量時不用列出所有細(xì)節(jié),粗略的估計同樣有用。其實我們只需要對開銷最大的操作計數(shù)就OK了。所以現(xiàn)在我們也這么干。我們選出開銷最大的基本操作,或者是執(zhí)行次數(shù)最多的、開銷最大的、頻率最高的操作來代表執(zhí)行時間。
我們假設(shè)運行時間等于 常數(shù)*操作的執(zhí)行時間,在 2-SUM 例子中,
我們選擇訪問數(shù)組的時間 (c*N(N ? 1)) 代表這個以上算法的運行時間。
第二種簡化
-- 估算輸入大小為 N 的函數(shù)的運行時間(或內(nèi)存)
-- 忽略推導(dǎo)式子中的低階項。使用 tilde notation (~ 號)表示:
a) 當(dāng) N 很大時,我們只需要關(guān)注高階項的開銷
b) 當(dāng) N 很小時,雖然低階項不能忽略,但是我們更無需擔(dān)心,因為小 N 的運行時間本來就不長,我們更想要對大 N 估計運算時間
如圖,當(dāng) N 很大時,N^3 遠(yuǎn)比后邊的 N 的低階項要大得多,大到基本不用關(guān)注低階項,所以這些式子都近似為 (1/6)N^3
通過圖形可以看出低階項真的沒太多影響
波浪號的含義:f(n) 近似于 g(n) 意味著 f(n)/g(n)的極限等于 1
簡化統(tǒng)計頻率后,我們可以這么樣的表示:
是不是看起來更微妙,更清爽~
結(jié)合兩種簡化,我們就可以說 2-SUM 需要近似 N^2 次數(shù)組訪問,并暗示了運行時間為 ~c*N^2 (c 為常數(shù))
利用開銷模型和 ~ 嘗試對 3-SUM 問題進行分析
3-SUM 為例
public class ThreeSum { public static int count(int[] a) { int N = a.length; int count = 0; for (int i = 0; i < N; i++) for (int j = i + 1; j < N; j++) for (int k = j+1; k < N; k++) if (a[i] + a[j] + a[k] == 0) count++; return count; } }
開銷最大的就是這句了:if (a[i] + a[j] + a[k] == 0),我們可以說 3-SUM 問題需要近似 ~ ? n3 次數(shù)組訪問,并暗示了運行時間 ~? c*n3 (c 為常數(shù))
為了避免部分蒙圈現(xiàn)象,解釋下為什么是1/6 N^3 和 1/2 N^3
a) 1/6 N^3 這個值還是離散求和得出的,可以參考 2-SUM. 就是又多了一層loop. 建議利用計算器或者工具去計算
Maple 或者 Wolfram Alpha
b) 因為 1/6 N^3 是 equal to compare 的次數(shù),不是數(shù)組訪問的次數(shù)。
每次在執(zhí)行 equal to compare 都有 3 次數(shù)組訪問,所以是 1/6 N^3 * 3 = 1/2 N^3
精確的模型最好還是讓專家?guī)透愣?,簡化模型也是有價值的。有時會給出一些數(shù)學(xué)證明,但是有時候引用專家的研究成果,利用數(shù)學(xué)工具就可以了。簡化后我們就不用去計算所有操作的開銷,我們選出開銷最大的操作乘上頻率,得出適合的近似模型來描述運行時間。精確一點的數(shù)學(xué)模型如下:
costs:基本操作的開銷,常量,取決于計算機,編譯器
frequencies:操作頻率,取決于算法,輸入大小(即 N 的大小)
以下增長量級同增長階數(shù)一個意思。
概述增長量級可以看做是函數(shù)類型,如是常量,線性函數(shù),指數(shù)函數(shù),平方,立方,冪函數(shù)等。
一般分析算法時我們不會遇到太多不同的函數(shù),這樣我們可以將算法按照性能隨問題的大小變化分類。
一般算法我們都能用這幾個函數(shù)描述:
當(dāng)我們關(guān)注增長量級時,我們會忽略掉函數(shù)前面的常數(shù)。比如當(dāng)我們說這個算法的運行時間和 NlogN 成正比,等同于我們假設(shè)運行時間近似 cNlogN (c 為常數(shù)).
上圖為雙對數(shù)坐標(biāo)圖,從圖中可以看出如果:
增長量級是對數(shù)(logarithmic)或者常數(shù)(constant),無論問題的規(guī)模多大,算法的運行速度都很快
增長量級是線性的(linearithmic/linear), 也就是增長量級與問題大小N成正比,N增長,運行時間也會隨問題規(guī)模大小線性增長 (NlogN 就是 linearithmic 類型的增長量級)
以上兩種算法都是我們想要設(shè)計的算法,它們能夠成比例適應(yīng)問題的規(guī)模。
增長量級為平方階(quadratic),運行時間遠(yuǎn)快于問題輸入的大小,即 N 的大小。這種算法不適合處理龐大問題的輸入。立方階(cubic)的算法就更糟糕
還有一種指數(shù)階算法(exponential),出來龐大輸入也不會用到
綜上所訴,我們研究算法是,首先要保證這些算法不是平方或者立方階的。
增長階數(shù)類型實際上就源于我們寫的代碼中的某些簡單模式。下圖使用翻倍測試(參考上邊 Doubling hypothesis 內(nèi)容)得出算法運行時間隨問題大小翻倍后增長的翻倍情況。某些增長量級對應(yīng)的代碼模式如下:
如果沒有循環(huán),增長階數(shù)是常數(shù)(constant),運行時間的增長是常數(shù)的;
如果有某種循環(huán):
每次循環(huán)被分為兩半(如二分查找算法 binary search),增長階數(shù)就是對數(shù),運行時間的增長幾乎是常數(shù)的
如果遍歷了輸入中的所有對象,運行時間是線性的(與 N 成正比),典型的例子是找一個數(shù)組里頭的最大值,或是上邊提到的 1-SUM 問題
nlogn 線性對數(shù)階算法,這種時間復(fù)雜度源于一種特定的算法設(shè)計技巧叫分治法,如歸并排序(mergesort),后續(xù)幾周內(nèi)會有介紹
算法中有兩層for循環(huán)(如 2-SUM),算法的運行時間是平方階的,和N^2成正比,當(dāng)輸入翻倍后,運行時間增大4倍
三層loop(如 3-SUM),運行時間就是立方階的,與N^3成正比,當(dāng)輸入翻倍后,運行時間增大8倍
指數(shù)階算法 2^n, 運行時間是指數(shù)階,這些算法中的涉及到的 N 都不會非常大
通過上述分析,我們在設(shè)計處理巨大規(guī)模輸入的算法的時候,一般都盡量把算法設(shè)計成線性階數(shù)和線性對數(shù)階數(shù)。
為了展示描述算法性能的數(shù)學(xué)模型的建立過程,下邊以 binary search 二分查找為例
Binary search 二分查找 算法介紹目標(biāo):給定一個有序整數(shù)數(shù)組,給定一個值,判斷這個值在這個數(shù)組中是否存在,如果存在,它在什么位置
二分查找:將給定值與位于數(shù)組中間的值進行比較
比中間值小,向中間值左邊查找
比中間值大,向中間值右邊查找
相等即找到
如下圖,查找 33,首先和 53比較,33<53, 所以如果33存在,那么就會在數(shù)組的左半邊,然后遞歸地使用同樣的算法,直到找到,或確認(rèn)要查找的值不在給定數(shù)組中。下圖展示二分查找的過程(使用了3個指針 lo, hi, mid)
初始化 lo 指針指向 id[0], hi 指針指向 id[n-1], mid 指針指向 id[mid]
33<53, hi指針向左移動到mid的前一位
33>53, lo 指針向右移動到mid的后一位
33<43, hi 指針移動到 43 之前,也就是數(shù)組中 33 的位置,此時只剩下一個元素查看,如果等于 33,則返回 index 4, 如果不等于 33,則返回 -1,或者別的形式說明要查找的定值不在數(shù)組中
Java 實現(xiàn)此算法的不變式:如果數(shù)組 a[] 中存在要尋找的關(guān)鍵字,則它在 lo 和 hi 之間的子數(shù)組中, a[lo] ≤ key ≤ a[hi].
public static int binarySearch(int[] a, int key) { int lo = 0, hi = a.length - 1; while (lo <= hi) { //why not mid = (lo + hi) / 2 ? int mid = lo + (hi - lo) / 2; //關(guān)鍵值與中間值是三項比較(<,>, ==) if (key < a[mid]) hi = mid - 1; else if (key > a[mid]) lo = mid + 1; else return mid; } return -1; }數(shù)學(xué)分析
定理:在大小為 N 的有序數(shù)組中完成一次二分查找最多只需要 1 + lgN 次的比較
定義:定義變量 T(N) 表示對長度為 N 的有序數(shù)組的子數(shù)組(長度<=N)進行二分查找所需要的比較次數(shù)
遞推公式(根據(jù)代碼):T(n) ≤ T(n / 2) + 1 for n > 1, with T(1) = 1.
程序?qū)栴}一分為二,所以T(n) ≤ T(n / 2) 加上一個數(shù)值,這個數(shù)值取決于你怎么對比較計數(shù)。這里看做二向比較,分成兩半需要進行一次比較,所以只要 N>1, 這個遞推關(guān)系成立。當(dāng) N 為 1 時,只比較了 1 次。
裂項求和
我們將遞推關(guān)系帶入下面公式右邊(即 <= 號右邊)求解,
如果T (n) ≤ T (n / 2) + 1 成立,則 T (n / 2) ≤ T (n / 4) + 1 成立...
這個證明雖然是證明在 N 是 2 的冪的時候成立,因為并沒有在遞推關(guān)系中明確 N 是奇數(shù)的情況,但是如果把奇數(shù)情況考慮進來,也能夠證明二分查找的運行時間也總是對數(shù)階的。
基于這個事實,我們能夠?qū)?3-SUM 問題設(shè)計一個更快的算法:
3 - SUM 舉例(基于增長量級與二分查找應(yīng)用)
Java 實現(xiàn):
import java.util.Arrays; public class ThreeSumFast { // Do not instantiate. private ThreeSumFast() { } // returns true if the sorted array a[] contains any duplicated integers private static boolean containsDuplicates(int[] a) { for (int i = 1; i < a.length; i++) if (a[i] == a[i-1]) return true; return false; } /** * Prints to standard output the (i, j, k) with {@code i < j < k} * such that {@code a[i] + a[j] + a[k] == 0}. * * @param a the array of integers * @throws IllegalArgumentException if the array contains duplicate integers */ public static void printAll(int[] a) { int n = a.length; Arrays.sort(a); if (containsDuplicates(a)) throw new IllegalArgumentException("array contains duplicate integers"); for (int i = 0; i < n; i++) { for (int j = i+1; j < n; j++) { int k = Arrays.binarySearch(a, -(a[i] + a[j])); if (k > j) StdOut.println(a[i] + " " + a[j] + " " + a[k]); } } } /** * Returns the number of triples (i, j, k) with {@code i < j < k} * such that {@code a[i] + a[j] + a[k] == 0}. * * @param a the array of integers * @return the number of triples (i, j, k) with {@code i < j < k} * such that {@code a[i] + a[j] + a[k] == 0} */ public static int count(int[] a) { int n = a.length; Arrays.sort(a); if (containsDuplicates(a)) throw new IllegalArgumentException("array contains duplicate integers"); int count = 0; for (int i = 0; i < n; i++) { for (int j = i+1; j < n; j++) { int k = Arrays.binarySearch(a, -(a[i] + a[j])); if (k > j) count++; } } return count; } /** * Reads in a sequence of distinct integers from a file, specified as a command-line argument; * counts the number of triples sum to exactly zero; prints out the time to perform * the computation. * * @param args the command-line arguments */ public static void main(String[] args) { In in = new In(args[0]); int[] a = in.readAllInts(); int count = count(a); StdOut.println(count); } }
基于搜索的算法:
第一步: 將輸入中的數(shù)進行排序(排序算法后邊會做介紹)
第二步: 查看每對數(shù)字 a[i] 和 a[j], 對 - (a[i] + a[j]) 進行二分查找.
如果找到- (a[i] + a[j]),那么就有 a[i], a[j] 和 - (a[i] + a[j]) 三個整數(shù)和為 0
運行時間的增長階數(shù): N^2 log N.
第一步: 排序需要正比于 N^2(如果使用插入排序, N^2的數(shù)組訪問還是好理解的,兩層loops).
第二步: 二分查找使用 N^2 log N
主要看這里:
for (int i = 0; i < n; i++) { for (int j = i+1; j < n; j++) { int k = Arrays.binarySearch(a, -(a[i] + a[j])); if (k > j) count++; } }
第2步進行多次二分搜索。多少次? N ^ 2次。二分查找需要log(n)時間 (請參考概述中最后一個表和回顧二分查找的內(nèi)容)。 因此,循環(huán)需要(N ^ 2 * log(N))時間。 應(yīng)該注意循環(huán)在排序后發(fā)生。不在排序過程中發(fā)生。由于操作一個接一個地發(fā)生,我們添加了運行時間。不是成倍增加。 **總運行時間是這樣的**: (N ^ 2)+(N ^ 2 * log(N)) **由于忽略了較低階項**,因此算法只有最重要的項的增長順序: (N ^ 2 * log(N))
通常,更好的增長階數(shù)意味著程序在實際運行中更快。
為了更有說服力,一般情況下不考慮上下限問題,運行時間為最壞情況下的時間復(fù)雜度 (算法理論內(nèi)容)
增長量級在實際運用在是非常重要的,它直接反映了算法的效率,近年來人們針對增長量級也做了很多研究。
分析類型:性能取決于輸入一個不同的輸入可能會讓算法的性能發(fā)生巨大變化。我們需要從不同的角度針對輸入的大小分析算法。運行時間介于最好情況與最壞情況之間。
Best case:最好情況,算法代價的下限(lower bound on cost), 運行時間總是大于或等于下限。
由“最簡單”的輸入決定
為所有輸入情況提供目標(biāo) (應(yīng)對所有輸入,希望運行時間能夠是或者接近最好情況)
Worst case:最糟糕的情況,算法代價的上限(Upper bound on cost), 運行時間不會長于上限。
由“最復(fù)雜”的輸入決定
為所有輸入提供擔(dān)保 (最壞的情況的分析結(jié)果為我們提供底線,算法運行時間不會長于這種情況)
Average case:平均隨機情況,將輸入認(rèn)為是隨機的
需要以某種方式對問題中的隨機輸入進行建模
提供預(yù)測性能的方法
一般的,即使輸入變化非常大,我們也能夠各種情況進行建模和預(yù)測性能
Ex 1. 如上邊的 3-SUM 問題:
通過“暴力算法”,數(shù)組的訪問次數(shù)為
Best: ~ ? N^3
Average: ~ ? N^3
Worst: ~ ? N^3
其實各種情況的低階項是不一樣的,但是因為我們利用了簡化方法忽略了低階項(回顧數(shù)學(xué)表示的簡化內(nèi)容),所以3種情況下的數(shù)組訪問幾乎是一樣的。使用近似表達時,算法中唯一的變化就是計數(shù)器 count 增加的次數(shù)。
Ex 2. 二分查找中的比較次數(shù)
Best: ~ 1 常數(shù)時間,第一次比較結(jié)束后就找到了關(guān)鍵字
Average: ~ lg N
Worst: ~ lg N
應(yīng)對不同的輸入,我們有不同的類型分析,但是關(guān)鍵是客戶要解決的實際問題是什么。為了了解算法的性能,我們也要了解這個問題。
實際數(shù)據(jù)可能與輸入模型不匹配怎么辦?
需要了解輸入以有效地處理它
方法1:取決于最壞情況下的性能保證,保證你的算法在最壞情況下運行也能很快
示例:使用歸并排序 Mergesort 而不是快速排序 Quicksort
如果不能保證最壞情況,那么就考慮隨機情況,依靠某種概率條件下成立的保證
方法2:隨機化,取決于概率保證。
示例:Quicksort
(排序在后幾個星期有談?wù)摰?
對于增長量級的討論引出了對算法理論的討論
算法理論 - 探討最壞情況新目標(biāo)
確定問題的“困難性”
例如 3-SUM 有多難?
開發(fā)“最優(yōu)”算法解決問題
方法
用增長量級對最壞情況進行描述
在分析中試著去掉盡可能多的細(xì)節(jié),將分析做到只差一個常數(shù)倍數(shù)的精度,這就是上邊所說到的利用增長量級分析的方法
通過關(guān)注最壞的情況,完全忽略輸入模型,消除輸入模型的可變性,把重點放在針對最壞情況的設(shè)計方法上,這樣就能簡便地只利用增長階數(shù)來談?wù)撍惴ㄐ阅?/p>
分析的目標(biāo)是找出“最優(yōu)”算法
最優(yōu)算法
對于任意輸入,我們能將運行時間的浮動控制在一個常數(shù)之內(nèi)。
因為是針對最壞情況考慮,所以提出的算法也就證明了除了它以外,沒有其它的算法提供更好的性能保證了,這個算法就是“最優(yōu)的”
描述性能界限的常用記號如何使用這三個符號對算法按照性能分類?
使用示例 1-SUM 問題目標(biāo):確定問題的“難度”并開發(fā)“最優(yōu)”算法。
EX. 1-SUM 問題:數(shù)組中是否有0?
上限:O(g(N)) 問題難度的上限取決于某個特定的算法
EX. 1-SUM的暴力算法:查看每個數(shù)組元素
暴力算法的運行時間為 Θ(N)
1-SUM 問題未知的最優(yōu)算法的運行時間是 O(N):
這里的 g(N)=N,重復(fù)一次,Θ(N) 表示某個常數(shù)*N。暴力算法已經(jīng)表明解決 1-SUM 問題需要 Θ(N) 的時間,那么如果存在最優(yōu)算法,運行時間肯定是 ≤ Θ(N), 根據(jù)上表,≤ Θ(N) 用 O(N) 表示
下限:Ω(h(N)) 證明沒有算法可以做得比 Θ(h(N)) 更好了
Ex. 必須檢查所有N個數(shù)組里頭的元素(任何未經(jīng)檢查的條目都可能為0)
1-SUM 的未知最優(yōu)算法的運行時間是 Ω(N)
這里 h(N) = N,因為必須檢查所有項,沒有別的算法可以做到比暴力算法 Θ(N) 更好了,所以 1-SUM 的未知最優(yōu)算法的運行時間是肯定都是 ≥ Θ(N) 的,記作 Ω(N)
最優(yōu)算法:
下限等于上限:g(N)= h(N)= N
Ex. 1-SUM 的暴力算法是最優(yōu)的:其運行時間是 Θ(N)。
對于簡單問題,找到最優(yōu)算法還是比較簡單的,但對于很復(fù)雜的問題,確定上下限就很困難,確定上下界吻合就更加困難。
3-SUM 問題目標(biāo)
確定問題的“難度”并開發(fā)“最優(yōu)”算法。
Ex. 3-SUM: 數(shù)組中,三個數(shù)和為 0 出現(xiàn)多少次
暴力算法分析
上限: 問題難度的上限取決于某個特定的算法
Ex. 3-SUM 的暴力算法
3-SUM 的最優(yōu)算法的運行時間為 O(N^3)
3-SUM 的的暴力算法需要的運行時間是 Θ(N^3),如果存在某種算法比暴力算法更優(yōu),那么運行時間肯定 ≤ Θ(N^3), 記作 O(N^3)
但如果我們找到了更好的算法
上限: 一種特定的改進算法
Ex. 改進的 3-SUM 算法
3-SUM 最優(yōu)算法的運行時間為 O(N^2*logN) {使用了二分查找}
下限: 證明沒有別的算法可以做得更好
Ex. 必須檢查所有N個條目以解決 3-SUM 問題
求解 3-SUM 的最優(yōu)算法的運行時間為 Ω(N)
可能大家還是對Omega Ω 符號有點困惑。 Omega只顯示算法復(fù)雜度的下限。 3-SUM 算法需要檢查來自某個數(shù)組的所有元素,因此我們可以說,該算法具有 Ω(N) 復(fù)雜度,因為它至少執(zhí)行線性數(shù)量的操作。事實上,操作總數(shù)是更大的,因此實際最優(yōu)算法肯定是 ≥ Θ(N) 的,記作 Ω(N)
對于 3-SUM 問題沒有人知道更高的下界,其實我們現(xiàn)在就能看出,處理 3-SUM 問題肯定是要用超過 Θ(N) 的時間的,但是我們卻不能確定多出多少,就是不知道比 Θ(N) 更高的下界是多少。
當(dāng)有人證明更高的下限時,也是同意沒有算法可以做得比前一個下限更好的前提下提出新的下界。但是他們會做出了更強有力的陳述,特別是證明沒有算法可以實現(xiàn)比他們剛才證明的新下界更好,以此來提高原來的下界,定義一個新的下界。
新的下限可能僅略高于先前的下限,或者可能顯著更高。提高下界往往都不是很容易。談?wù)撊绾翁岣呦陆邕@也不是本文的重點。
算法理論中的一個開放問題:
·3-SUM 有最優(yōu)算法嗎?我們不知道
·3-SUM 問題是否存在一個運行時間小于 O(N^2) 的算法?我們無法確定
·3-SUM 比現(xiàn)行的下界更高的下界是什么,上面已經(jīng)談?wù)撨^了,我們也還不知道
我們不知道求解 3-SUM 問題的難度
遇到新的問題,設(shè)計出某個算法,并證明它的下界
如果上界和下界存在間隔,那么尋找新的能夠降低上界的算法,或者是尋找提高下界的方法(但是這個一般很難)
所以人們更傾向于研究持續(xù)下降上界,也就是設(shè)法提高算法在最壞情況下的運行時間來了解問題的難度,并得到了很多最壞情況下的最優(yōu)算法。
這門課程并不會把注意點都放在關(guān)注最壞的情況去分析算法性能,而是專注于理解輸入的性質(zhì)(不一定是最糟糕的情況),并針對輸入的性質(zhì)尋找最高效的算法
真的要預(yù)測性能和比較算法時,我們需要比常數(shù)因子級別誤差更準(zhǔn)確的分析
值得注意的是:有很多人錯把 big-Oh 分析結(jié)果當(dāng)做了運行時間的近似模型,其實 big-Oh 應(yīng)該是這個問題運行時間的上界,不是運行時間的近似模型。
我們使用 ~ 來表示算法運行時間的近似模型。當(dāng)我們談?wù)摰竭\行時間的上界就使用 big-Oh.
運行時間和程序的內(nèi)存需求都會對算法的性能有所影響,下邊是對內(nèi)存需求的簡單討論。
從根本上講我們就是想知道程序?qū)W要多少比特(bit),或者多少字節(jié)(byte)
Bit: 0 or 1 Byte: 8 bites Megabyte (MB) 2^20 bytes Gigabyte (GB) 2^30 bytes. 32-bit machine: 32 位系統(tǒng),指針是 4 個字節(jié), 64-bit machine: 64 位系統(tǒng),指針是 8 個字節(jié),這使得我們能夠?qū)艽蟮膬?nèi)存尋址,但是指針指針也使用了更大的空間。有些 JVM 把指針壓縮到 4 bytes 來節(jié)省開支。典型的內(nèi)存使用量
內(nèi)存使用和機器還有硬件實現(xiàn)有很大的關(guān)系,但是一般情況都是如圖所示
Boolean 雖然只用了 1 bit,但系統(tǒng)還是分配了 1 byte 給它
數(shù)組需要額外空間 + 基本類型空間開支(參考左表) * 元素個數(shù)(N)
二維數(shù)組需要的空間下圖用近似值表示, ~ 2MN 可以理解為 char 基本類型開銷是 2 bytes,char [M] [N] 近似用了 2MN bytes 的內(nèi)存
Object overhead 對象需要的額外空間. 16 bytes. Reference 引用. 8 bytes. Padding 內(nèi)置用來對齊的空間. 對齊空間可以是 4 bytes 或者是其它,對齊空間的分配目的是使得每個對象使用的空間都是 8 bytes 的倍數(shù)
下圖是一個日期對象的內(nèi)存占用量例子
數(shù)據(jù)類型值的總內(nèi)存使用量:
基本數(shù)據(jù)類型:int 為 4 字節(jié),double 為 8 字節(jié),...
對象引用:8個字節(jié),這是指針需要占用的空間
數(shù)組:24 個字節(jié) + 每一項的內(nèi)存。
對象:16 個字節(jié) + 實例變量的空間 ( + 8個字節(jié),如果有內(nèi)部類對象)
對齊空間:增加一定量字節(jié),使得上邊的字節(jié)加上這里的字節(jié)數(shù)和為 8 個字節(jié)的倍數(shù)
例子:用了多少字節(jié)?
使用上邊的基本知識可以算出 B
對象的額外空間 16 bytes (參考日期對象用例)
int[] id:8 byte + ( 4N + 24 )
int[] sz:同上 (引用 + 24 個字節(jié) + int 類型開銷 * N)
int count:4 bytes
對齊空間:4 byte
總共 8N + 88 ~ 8 N bytes.
面試問題大意解釋待更新...
大意解釋待更新...
大意解釋待更新...
Version 0: Try each flow from the bottom. The first floor that the egg breaks on is the value of T. Version 1: Using the binary search.Firstly, try floor T/2. If the egg breaks, T must be equal to T/2 or smaller. If the egg does not break, T must be greater than T/2. Continue testing the mid-point of the subset of floors until T is determined. Version 2: Start test at floor 1 and exponentially grow (2^t) floor number (1, 2, 4, 8 ... 2^t)until first egg breaks. The value of T must be in [2^(t-1), 2^t). This step costs lgT tosses. Then in the range got from last step can be searched in ~lgT tosses using the binary search. Two step will cost ~2lgT tosses. Version 3: Test floors in increments of sqrt(N) starting from the first floor. {e.g: {1, sqrt(N), 2*sqrt(N), 3*sqrt(N)...t*sqrt(N)...}. When the egg breaks on t, test floor from (t-1)*sqrt(N) and increment by each floor. The remaining sqrt(N){e.g [(t-1)*sqrt(N), t*sqrt(N))} tests will be enough to check each floor between floor t-1 and t. The floor that breaks will be the value of T. Version 4: Start test at floor 1 in increments of t^2 (e.g {1,4,9...t^2..N}), When the egg breaks on t, test floor from (t-1)^2+1 and increment by each floor.
文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請注明本文地址:http://m.specialneedsforspecialkids.com/yun/73548.html
摘要:兩個單元素數(shù)組的合并實際就是對這兩個數(shù)進行了排序,即變?yōu)椋瑯釉賹笠唤M的兩個數(shù)歸并排序,即變?yōu)?,再將兩單元?shù)組歸并成四單元數(shù)組即和歸并為。 前言 本周講解兩個50多年前發(fā)明,但今天仍然很重要的經(jīng)典算法 (歸并排序和快速排序) 之一 -- 歸并排序,幾乎每個軟件系統(tǒng)中都可以找到其中一個或兩個的實現(xiàn),并研究這些經(jīng)典方法的新變革。我們的涉及范圍從數(shù)學(xué)模型中解釋為什么這些方法有效到使這些算法...
摘要:我們討論比較排序算法的理論基礎(chǔ),并結(jié)合本章應(yīng)用排序和優(yōu)先級隊列算法?;九判蛞肓诉x擇排序,插入排序和。描述了,一種保證在線性時間內(nèi)運行的排序算法。當(dāng)我們后續(xù)實現(xiàn)排序算法時,我們實際上將這個機制隱藏在我們的實現(xiàn)下面。 前言 上一篇:棧和隊列下一篇:歸并排序 排序是重新排列一系列對象以便按照某種邏輯順序排列的過程。排序在商業(yè)數(shù)據(jù)處理和現(xiàn)代科學(xué)計算中起著重要作用。在交易處理,組合優(yōu)化,天體...
摘要:作者微信號微信公眾號簡書地址我把這篇文章分為四個部分機器學(xué)習(xí),,和數(shù)學(xué)。在這篇文章中,我把每個主題的教程數(shù)量都是控制在五到六個,這些精選出來的教程都是非常重要的。每一個鏈接都會鏈接到別的鏈接,從而導(dǎo)致很多新的教程。 作者:chen_h微信號 & QQ:862251340微信公眾號:coderpai簡書地址:http://www.jianshu.com/p/2be3... showIm...
摘要:默認(rèn)值為返回值,一個對象,包含了原生用戶原生項目真實評分預(yù)測評分可能對后面預(yù)測有用的一些其他的詳細(xì)信息在給定的測試集上測試算法,即估計給定測試集中的所有評分。 這里的格式并沒有做過多的處理,可參考于OneNote筆記鏈接 由于OneNote取消了單頁分享,如果需要請留下郵箱,我會郵件發(fā)送pdf版本,后續(xù)再解決這個問題 推薦算法庫surprise安裝 pip install surp...
閱讀 3018·2021-10-27 14:15
閱讀 3011·2021-09-07 10:18
閱讀 1328·2019-08-30 15:53
閱讀 1581·2019-08-26 18:18
閱讀 3382·2019-08-26 12:15
閱讀 3467·2019-08-26 10:43
閱讀 659·2019-08-23 16:43
閱讀 2216·2019-08-23 15:27