摘要:在中由于歷史原因使得中多線程的效果非常不理想使得任何時刻只能利用一個核并且它的調(diào)度算法簡單粗暴多線程中讓每個線程運行一段時間然后強行掛起該線程繼而去運行其他線程如此周而復(fù)始直到所有線程結(jié)束這使得無法有效利用計算機系統(tǒng)中的局部性頻繁的線程切換
GIL
在Python中,由于歷史原因(GIL),使得Python中多線程的效果非常不理想.GIL使得任何時刻Python只能利用一個CPU核,并且它的調(diào)度算法簡單粗暴:多線程中,讓每個線程運行一段時間t,然后強行掛起該線程,繼而去運行其他線程,如此周而復(fù)始,直到所有線程結(jié)束.
這使得無法有效利用計算機系統(tǒng)中的"局部性",頻繁的線程切換也對緩存不是很友好,造成資源的浪費.
據(jù)說Python官方曾經(jīng)實現(xiàn)了一個去除GIL的Python解釋器,但是其效果還不如有GIL的解釋器,遂放棄.后來Python官方推出了"利用多進程替代多線程"的方案,在Python3中也有concurrent.futures這樣的包,讓我們的程序編寫可以做到"簡單和性能兼得".
多進程/多線程+Queue一般來說,在Python中編寫并發(fā)程序的經(jīng)驗是:計算密集型任務(wù)使用多進程,IO密集型任務(wù)使用多進程或者多線程.另外,因為涉及到資源共享,所以需要同步鎖等一系列麻煩的步驟,代碼編寫不直觀.另外一種好的思路是利用多進程/多線程+Queue的方法,可以避免加鎖這樣麻煩低效的方式.
現(xiàn)在在Python2中利用Queue+多進程的方法來處理一個IO密集型任務(wù).
假設(shè)現(xiàn)在需要下載多個網(wǎng)頁內(nèi)容并進行解析,單進程的方式效率很低,所以使用多進程/多線程勢在必行.
我們可以先初始化一個tasks隊列,里面將要存儲的是一系列dest_url,同時開啟4個進程向tasks中取任務(wù)然后執(zhí)行,處理結(jié)果存儲在一個results隊列中,最后對results中的結(jié)果進行解析.最后關(guān)閉兩個隊列.
下面是一些主要的邏輯代碼.
python# -*- coding:utf-8 -*- #IO密集型任務(wù) #多個進程同時下載多個網(wǎng)頁 #利用Queue+多進程 #由于是IO密集型,所以同樣可以利用threading模塊 import multiprocessing def main(): tasks = multiprocessing.JoinableQueue() results = multiprocessing.Queue() cpu_count = multiprocessing.cpu_count() #進程數(shù)目==CPU核數(shù)目 create_process(tasks, results, cpu_count) #主進程馬上創(chuàng)建一系列進程,但是由于阻塞隊列tasks開始為空,副進程全部被阻塞 add_tasks(tasks) #開始往tasks中添加任務(wù) parse(tasks, results) #最后主進程等待其他線程處理完成結(jié)果 def create_process(tasks, results, cpu_count): for _ in range(cpu_count): p = multiprocessing.Process(target=_worker, args=(tasks, results)) #根據(jù)_worker創(chuàng)建對應(yīng)的進程 p.daemon = True #讓所有進程可以隨主進程結(jié)束而結(jié)束 p.start() #啟動 def _worker(tasks, results): while True: #因為前面所有線程都設(shè)置了daemon=True,故不會無限循環(huán) try: task = tasks.get() #如果tasks中沒有任務(wù),則阻塞 result = _download(task) results.put(result) #some exceptions do not handled finally: tasks.task_done() def add_tasks(tasks): for url in get_urls(): #get_urls() return a urls_list tasks.put(url) def parse(tasks, results): try: tasks.join() except KeyboardInterrupt as err: print "Tasks has been stopped!" print err while not results.empty(): _parse(results) if __name__ == "__main__": main()利用Python3中的concurrent.futures包
在Python3中可以利用concurrent.futures包,編寫更加簡單易用的多線程/多進程代碼.其使用感覺和Java的concurrent框架很相似(借鑒?)
比如下面的簡單代碼示例
pythondef handler(): futures = set() with concurrent.futures.ProcessPoolExecutor(max_workers=cpu_count) as executor: for task in get_task(tasks): future = executor.submit(task) futures.add(future) def wait_for(futures): try: for future in concurrent.futures.as_completed(futures): err = futures.exception() if not err: result = future.result() else: raise err except KeyboardInterrupt as e: for future in futures: future.cancel() print "Task has been canceled!" print e return result總結(jié)
要是一些大型Python項目也這般編寫,那么效率也太低了.在Python中有許多已有的框架使用,使用它們起來更加高效.
但是自己的一些"小打小鬧"的程序這樣來編寫還是不錯的.:)
文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請注明本文地址:http://m.specialneedsforspecialkids.com/yun/45376.html
摘要:具有以下基本同步原語子進程提供了通過創(chuàng)建和管理子進程的。雖然隊列不是線程安全的,但它們被設(shè)計為專門用于代碼。表示異步操作的最終結(jié)果。 Python的asyncio是使用 async/await 語法編寫并發(fā)代碼的標(biāo)準(zhǔn)庫。通過上一節(jié)的講解,我們了解了它不斷變化的發(fā)展歷史。到了Python最新穩(wěn)定版 3.7 這個版本,asyncio又做了比較大的調(diào)整,把這個庫的API分為了 高層級API和...
摘要:并發(fā)用于制定方案,用來解決可能但未必并行的問題。在協(xié)程中使用需要注意兩點使用鏈接的多個協(xié)程最終必須由不是協(xié)程的調(diào)用方驅(qū)動,調(diào)用方顯式或隱式在最外層委派生成器上調(diào)用函數(shù)或方法。對象可以取消取消后會在協(xié)程當(dāng)前暫停的處拋出異常。 導(dǎo)語:本文章記錄了本人在學(xué)習(xí)Python基礎(chǔ)之控制流程篇的重點知識及個人心得,打算入門Python的朋友們可以來一起學(xué)習(xí)并交流。 本文重點: 1、了解asyncio...
摘要:每個在同一時間只能執(zhí)行一個線程在單核下的多線程其實都只是并發(fā),不是并行,并發(fā)和并行從宏觀上來講都是同時處理多路請求的概念。在多線程下,每個線程的執(zhí)行方式獲取執(zhí)行代碼直到或者是虛擬機將其掛起。拿不到通行證的線程,就不允許進入執(zhí)行。 進程與線程 并發(fā)與并行 進程與線程 首先要理解的是,我們的軟件都是運行在操作系統(tǒng)之上,操作系統(tǒng)再控制硬件,比如 處理器、內(nèi)存、IO設(shè)備等。操作系統(tǒng)為了向上...
摘要:并發(fā)線程測試循環(huán)新建線程類,并在線程體內(nèi)塞入單個的測試用例,以及全局的計數(shù)類。為了讓性能測試更充分,我編寫了不同的計算過程,并使用隨機函數(shù)隨機獲取并塞入線程執(zhí)行。 ...
閱讀 2003·2021-08-11 11:13
閱讀 1026·2021-07-25 21:37
閱讀 2583·2019-08-29 18:42
閱讀 2515·2019-08-26 12:18
閱讀 921·2019-08-26 11:29
閱讀 1695·2019-08-23 17:17
閱讀 2669·2019-08-23 15:55
閱讀 2611·2019-08-23 14:34