摘要:中關(guān)于線程的標(biāo)準(zhǔn)庫是,之前在版本中的在之后更名為,無論是還是都應(yīng)該盡量避免使用較為底層的而應(yīng)該使用。而與線程相比,協(xié)程尤其是結(jié)合事件循環(huán)無論在編程模型還是語法上,看起來都是非常友好的單線程同步過程。
項目地址:https://git.io/pytips
要說到線程(Thread)與協(xié)程(Coroutine)似乎總是需要從并行(Parallelism)與并發(fā)(Concurrency)談起,關(guān)于并行與并發(fā)的問題,Rob Pike 用 Golang 小地鼠燒書的例子給出了非常生動形象的說明。簡單來說并行就是我們現(xiàn)實世界運行的樣子,每個人都是獨立的執(zhí)行單元,各自完成自己的任務(wù),這對應(yīng)著計算機(jī)中的分布式(多臺計算機(jī))或多核(多個CPU)運作模式;而對于并發(fā),我看到最生動的解釋來自Quora 上 Jan Christian Meyer 回答的這張圖:
并發(fā)對應(yīng)計算機(jī)中充分利用單核(一個CPU)實現(xiàn)(看起來)多個任務(wù)同時執(zhí)行。我們在這里將要討論的 Python 中的線程與協(xié)程僅是基于單核的并發(fā)實現(xiàn),隨便去網(wǎng)上搜一搜(Thread vs Coroutine)可以找到一大批關(guān)于它們性能的爭論、benchmark,這次話題的目的不在于討論誰好誰壞,套用一句非常套路的話來說,拋開應(yīng)用場景爭好壞都是耍流氓。當(dāng)然在硬件支持的條件下(多核)也可以利用線程和協(xié)程實現(xiàn)并行計算,而且 Python 2.6 之后新增了標(biāo)準(zhǔn)庫 multiprocessing (PEP 371)突破了 GIL 的限制可以充分利用多核,但由于協(xié)程是基于單個線程的,因此多進(jìn)程的并行對它們來說情況是類似的,因此這里只討論單核并發(fā)的實現(xiàn)。
要了解線程以及協(xié)程的原理和由來可以查看參考鏈接中的前兩篇文章。Python 3.5 中關(guān)于線程的標(biāo)準(zhǔn)庫是 threading,之前在 2.x 版本中的 thread 在 3.x 之后更名為 _thread ,無論是2.7還是3.5都應(yīng)該盡量避免使用較為底層的 thread/_thread 而應(yīng)該使用 threading。
創(chuàng)建一個線程可以通過實例化一個 threading.Thread 對象:
from threading import Thread import time def _sum(x, y): print("Compute {} + {}...".format(x, y)) time.sleep(2.0) return x+y def compute_sum(x, y): result = _sum(x, y) print("{} + {} = {}".format(x, y, result)) start = time.time() threads = [ Thread(target=compute_sum, args=(0,0)), Thread(target=compute_sum, args=(1,1)), Thread(target=compute_sum, args=(2,2)), ] for t in threads: t.start() for t in threads: t.join() print("Total elapsed time {} s".format(time.time() - start)) # Do not use Thread start = time.time() compute_sum(0,0) compute_sum(1,1) compute_sum(2,2) print("Total elapsed time {} s".format(time.time() - start))
Compute 0 + 0... Compute 1 + 1... Compute 2 + 2... 0 + 0 = 0 1 + 1 = 2 2 + 2 = 4 Total elapsed time 2.002729892730713 s Compute 0 + 0... 0 + 0 = 0 Compute 1 + 1... 1 + 1 = 2 Compute 2 + 2... 2 + 2 = 4 Total elapsed time 6.004806041717529 s
除了通過將函數(shù)傳遞給 Thread 創(chuàng)建線程實例之外,還可以直接繼承 Thread 類:
from threading import Thread import time class ComputeSum(Thread): def __init__(self, x, y): super().__init__() self.x = x self.y = y def run(self): result = self._sum(self.x, self.y) print("{} + {} = {}".format(self.x, self.y, result)) def _sum(self, x, y): print("Compute {} + {}...".format(x, y)) time.sleep(2.0) return x+y threads = [ComputeSum(0,0), ComputeSum(1,1), ComputeSum(2,2)] start = time.time() for t in threads: t.start() for t in threads: t.join() print("Total elapsed time {} s".format(time.time() - start))
Compute 0 + 0... Compute 1 + 1... Compute 2 + 2... 0 + 0 = 0 1 + 1 = 2 2 + 2 = 4 Total elapsed time 2.001662015914917 s
根據(jù)上面代碼執(zhí)行的結(jié)果可以發(fā)現(xiàn),compute_sum/t.run 函數(shù)的執(zhí)行是按照 start() 的順序,但 _sum 結(jié)果的輸出順序卻是隨機(jī)的。因為 _sum 中加入了 time.sleep(2.0) ,讓程序執(zhí)行到這里就會進(jìn)入阻塞狀態(tài),但是幾個線程的執(zhí)行看起來卻像是同時進(jìn)行的(并發(fā))。
有時候我們既需要并發(fā)地“跳過“阻塞的部分,又需要有序地執(zhí)行其它部分,例如操作共享數(shù)據(jù)的時候,這時就需要用到”鎖“。在上述”求和線程“的例子中,假設(shè)每次求和都需要加上額外的 _base 并把計算結(jié)果累積到 _base 中。盡管這個例子不太恰當(dāng),但它說明了線程鎖的用途:
from threading import Thread, Lock import time _base = 1 _lock = Lock() class ComputeSum(Thread): def __init__(self, x, y): super().__init__() self.x = x self.y = y def run(self): result = self._sum(self.x, self.y) print("{} + {} + base = {}".format(self.x, self.y, result)) def _sum(self, x, y): print("Compute {} + {}...".format(x, y)) time.sleep(2.0) global _base with _lock: result = x + y + _base _base = result return result threads = [ComputeSum(0,0), ComputeSum(1,1), ComputeSum(2,2)] start = time.time() for t in threads: t.start() for t in threads: t.join() print("Total elapsed time {} s".format(time.time() - start))
Compute 0 + 0... Compute 1 + 1... Compute 2 + 2... 0 + 0 + base = 1 1 + 1 + base = 3 2 + 2 + base = 7 Total elapsed time 2.0064051151275635 s
這里用上下文管理器來管理鎖的獲取和釋放,相當(dāng)于:
_lock.acquire() try: result = x + y + _base _base = result finally: _lock.release()
死鎖
線程的一大問題就是通過加鎖來”搶奪“共享資源的時候有可能造成死鎖,例如下面的程序:
from threading import Lock _base_lock = Lock() _pos_lock = Lock() _base = 1 def _sum(x, y): # Time 1 with _base_lock: # Time 3 with _pos_lock: result = x + y return result def _minus(x, y): # Time 0 with _pos_lock: # Time 2 with _base_lock: result = x - y return result
由于線程的調(diào)度執(zhí)行順序是不確定的,在執(zhí)行上面兩個線程 _sum/_minus 的時候就有可能出現(xiàn)注釋中所標(biāo)注的時間順序,即 # Time 0 的時候運行到 with _pos_lock 獲取了 _pos_lock 鎖,而接下來由于阻塞馬上切換到了 _sum 中的 # Time 1 ,并獲取了 _base_lock,接下來由于兩個線程互相鎖定了彼此需要的下一個鎖,將會導(dǎo)致死鎖,即程序無法繼續(xù)運行。根據(jù) 我是一個線程 中所描述的,為了避免死鎖,需要所有的線程按照指定的算法(或優(yōu)先級)來進(jìn)行加鎖操作。不管怎么說,死鎖問題都是一件非常傷腦筋的事,原因之一在于不管線程實現(xiàn)的是并發(fā)還是并行,在編程模型和語法上看起來都是并行的,而我們的大腦雖然是一個(內(nèi)隱的)絕對并行加工的機(jī)器,卻非常不善于將并行過程具象化(至少在未經(jīng)足夠訓(xùn)練的時候)。而與線程相比,協(xié)程(尤其是結(jié)合事件循環(huán))無論在編程模型還是語法上,看起來都是非常友好的單線程同步過程。后面第二部分我們再來討論 Python 中協(xié)程是如何從”小三“一步步扶正上位的:D。
歡迎關(guān)注公眾號 PyHub 每日推送
參考Python 中的進(jìn)程、線程、協(xié)程、同步、異步、回調(diào)
我是一個線程
Concurrency is not Parallelism
A Curious Course on Coroutines and Concurrency
PyDocs: 17.1. threading — Thread-based parallelism
PyDocs: 18.5.3. Tasks and coroutines
[譯] Python 3.5 協(xié)程究竟是個啥
協(xié)程的好處是什么? - crazybie 的回答
Py3-cookbook:第十二章:并發(fā)編程
Quora: What are the differences between parallel, concurrent and asynchronous programming?
文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請注明本文地址:http://m.hztianpu.com/yun/37867.html
摘要:項目地址我之前翻譯了協(xié)程原理這篇文章之后嘗試用了模式下的協(xié)程進(jìn)行異步開發(fā),確實感受到協(xié)程所帶來的好處至少是語法上的。 項目地址:https://git.io/pytips 我之前翻譯了Python 3.5 協(xié)程原理這篇文章之后嘗試用了 Tornado + Motor 模式下的協(xié)程進(jìn)行異步開發(fā),確實感受到協(xié)程所帶來的好處(至少是語法上的:D)。至于協(xié)程的 async/await 語法是如...
摘要:所以與多線程相比,線程的數(shù)量越多,協(xié)程性能的優(yōu)勢越明顯。值得一提的是,在此過程中,只有一個線程在執(zhí)行,因此這與多線程的概念是不一樣的。 真正有知識的人的成長過程,就像麥穗的成長過程:麥穗空的時候,麥子長得很快,麥穗驕傲地高高昂起,但是,麥穗成熟飽滿時,它們開始謙虛,垂下麥芒。 ——蒙田《蒙田隨筆全集》 上篇論述了關(guān)于python多線程是否是雞肋的問題,得到了一些網(wǎng)友的認(rèn)可,當(dāng)然也有...
摘要:項目地址提供兩種內(nèi)置排序方法,一個是只針對的原地排序方法,另一個是針對所有可迭代對象的非原地排序方法。 項目地址:https://git.io/pytips Python 提供兩種內(nèi)置排序方法,一個是只針對 List 的原地(in-place)排序方法 list.sort(),另一個是針對所有可迭代對象的非原地排序方法 sorted()。 所謂原地排序是指會立即改變被排序的列表對象,就...
摘要:事件循環(huán)是異步編程的底層基石。對事件集合進(jìn)行輪詢,調(diào)用回調(diào)函數(shù)等一輪事件循環(huán)結(jié)束,循環(huán)往復(fù)。協(xié)程直接利用代碼的執(zhí)行位置來表示狀態(tài),而回調(diào)則是維護(hù)了一堆數(shù)據(jù)結(jié)構(gòu)來處理狀態(tài)。時代的協(xié)程技術(shù)主要是,另一個比較小眾。 Coding Crush Python開發(fā)工程師 主要負(fù)責(zé)豈安科技業(yè)務(wù)風(fēng)險情報系統(tǒng)redq。 引言 1.1. 存儲器山 存儲器山是 Randal Bryant 在《深入...
摘要:上一篇文章第二章實戰(zhàn)演練開發(fā)網(wǎng)站第五節(jié)輸出相應(yīng)函數(shù)下一篇文章第二章實戰(zhàn)演練開發(fā)網(wǎng)站第七節(jié)安全機(jī)制有兩種方式可改變同步的處理流程異步化針對的處理函數(shù)使用修飾器,將默認(rèn)的同步機(jī)制改為異步機(jī)制。使用異步對象處理耗時操作,比如本例的。 上一篇文章:Python:Tornado 第二章:實戰(zhàn)演練:開發(fā)Tornado網(wǎng)站:第五節(jié):RequestHandler:輸出相應(yīng)函數(shù)下一篇文章:Python:...
閱讀 2204·2021-11-23 09:51
閱讀 2921·2021-11-22 15:35
閱讀 3017·2019-08-30 15:53
閱讀 1101·2019-08-30 14:04
閱讀 3339·2019-08-29 12:39
閱讀 1887·2019-08-28 17:57
閱讀 1184·2019-08-26 13:39
閱讀 623·2019-08-26 13:34