對python并發(fā)編程的思考

sshe 發(fā)布于2019-07-30 15:24 / 1044人閱讀

摘要：我們以請求網(wǎng)絡(luò)服務(wù)為例，來實(shí)際測試一下加入多線程之后的效果。所以，執(zhí)行密集型操作時(shí)，多線程是有用的，對于密集型操作，則每次只能使用一個(gè)線程。說到這里，對于密集型，可以使用多線程或者多進(jìn)程來提高效率。

為了提高系統(tǒng)密集型運(yùn)算的效率，我們常常會使用到多個(gè)進(jìn)程或者是多個(gè)線程，python中的Threading包實(shí)現(xiàn)了線程，multiprocessing 包則實(shí)現(xiàn)了多進(jìn)程。而在3.2版本的python中，將進(jìn)程與線程進(jìn)一步封裝成concurrent.futures 這個(gè)包，使用起來更加方便。我們以請求網(wǎng)絡(luò)服務(wù)為例，來實(shí)際測試一下加入多線程之后的效果。

首先來看看不使用多線程花費(fèi)的時(shí)間：

import time
import requests

NUMBERS = range(12)
URL = "http://httpbin.org/get?a={}"

# 獲取網(wǎng)絡(luò)請求結(jié)果
def fetch(a):
    r = requests.get(URL.format(a))
    return r.json()["args"]["a"]

# 開始時(shí)間
start = time.time()

for num in NUMBERS:
    result = fetch(num)
    print("fetch({}) = {}".format(num, result))
# 計(jì)算花費(fèi)的時(shí)間
print("cost time: {}".format(time.time() - start))

執(zhí)行結(jié)果如下：

fetch(0) = 0
fetch(1) = 1
fetch(2) = 2
fetch(3) = 3
fetch(4) = 4
fetch(5) = 5
fetch(6) = 6
fetch(7) = 7
fetch(8) = 8
fetch(9) = 9
fetch(10) = 10
fetch(11) = 11
cost time: 6.952988862991333

再來看看加入多線程之后的效果：

import time
import requests
from concurrent.futures import ThreadPoolExecutor

NUMBERS = range(12)
URL = "http://httpbin.org/get?a={}"

def fetch(a):
    r = requests.get(URL.format(a))
    return r.json()["args"]["a"]

start = time.time()
# 使用線程池（使用5個(gè)線程）
with ThreadPoolExecutor(max_workers=5) as executor:
  # 此處的map操作與原生的map函數(shù)功能一樣
    for num, result in zip(NUMBERS, executor.map(fetch, NUMBERS)):
        print("fetch({}) = {}".format(num, result))
print("cost time: {}".format(time.time() - start))

執(zhí)行結(jié)果如下：

fetch(0) = 0
fetch(1) = 1
fetch(2) = 2
fetch(3) = 3
fetch(4) = 4
fetch(5) = 5
fetch(6) = 6
fetch(7) = 7
fetch(8) = 8
fetch(9) = 9
fetch(10) = 10
fetch(11) = 11
cost time: 1.9467740058898926

只用了近2秒的時(shí)間，如果再多加幾個(gè)線程時(shí)間會更短，而不加入多線程需要接近7秒的時(shí)間。

不是說python中由于全局解釋鎖的存在，每次只能執(zhí)行一個(gè)線程嗎，為什么上面使用多線程還快一些？

確實(shí)，由于python的解釋器（只有cpython解釋器中存在這個(gè)問題）本身不是線程安全的，所以存在著全局解釋鎖，也就是我們經(jīng)常聽到的GIL，導(dǎo)致一次只能使用一個(gè)線程來執(zhí)行Python的字節(jié)碼。但是對于上面的I/O操作來說，一個(gè)線程在等待網(wǎng)絡(luò)響應(yīng)時(shí)，執(zhí)行I/O操作的函數(shù)會釋放GIL，然后再運(yùn)行一個(gè)線程。

所以，執(zhí)行I/O密集型操作時(shí)，多線程是有用的，對于CPU密集型操作，則每次只能使用一個(gè)線程。那這樣說來，想執(zhí)行CPU密集型操作怎么辦？

答案是使用多進(jìn)程，使用concurrent.futures包中的ProcessPoolExecutor 。這個(gè)模塊實(shí)現(xiàn)的是真正的并行計(jì)算，因?yàn)樗褂肞rocessPoolExecutor 類把工作分配給多個(gè) Python 進(jìn)程處理。因此，如果需要做 CPU密集型處理，使用這個(gè)模塊能繞開 GIL，利用所有可用的 CPU 核心。

說到這里，對于I/O密集型，可以使用多線程或者多進(jìn)程來提高效率。我們上面的并發(fā)請求數(shù)只有5個(gè)，但是如果同時(shí)有1萬個(gè)并發(fā)操作，像淘寶這類的網(wǎng)站同時(shí)并發(fā)請求數(shù)可以達(dá)到千萬級以上，服務(wù)器每次為一個(gè)請求開一個(gè)線程，還要進(jìn)行上下文切換，這樣的開銷會很大，服務(wù)器壓根承受不住。一個(gè)解決辦法是采用分布式，大公司有錢有力，能買很多的服務(wù)器，小公司呢。

我們知道系統(tǒng)開進(jìn)程的個(gè)數(shù)是有限的，線程的出現(xiàn)就是為了解決這個(gè)問題，于是在進(jìn)程之下又分出多個(gè)線程。所以有人就提出了能不能用同一線程來同時(shí)處理若干連接，再往下分一級。于是協(xié)程就出現(xiàn)了。

協(xié)程在實(shí)現(xiàn)上試圖用一組少量的線程來實(shí)現(xiàn)多個(gè)任務(wù)，一旦某個(gè)任務(wù)阻塞，則可能用同一線程繼續(xù)運(yùn)行其他任務(wù)，避免大量上下文的切換，而且，各個(gè)協(xié)程之間的切換，往往是用戶通過代碼來顯式指定的，不需要系統(tǒng)參與，可以很方便的實(shí)現(xiàn)異步。

協(xié)程本質(zhì)上是異步非阻塞技術(shù)，它是將事件回調(diào)進(jìn)行了包裝，讓程序員看不到里面的事件循環(huán)。說到這里，什么是異步非阻塞？同步異步，阻塞，非阻塞有什么區(qū)別？

借用知乎上的一個(gè)例子，假如你打電話問書店老板有沒有《分布式系統(tǒng)》這本書，如果是同步通信機(jī)制，書店老板會說，你稍等，”我查一下"，然后開始查啊查，等查好了（可能是5秒，也可能是一天）告訴你結(jié)果（返回結(jié)果）。而異步通信機(jī)制，書店老板直接告訴你我查一下啊，查好了打電話給你，然后直接掛電話了（不返回結(jié)果）。然后查好了，他會主動(dòng)打電話給你。在這里老板通過“回電”這種方式來回調(diào)。

而阻塞與非阻塞則是你打電話問書店老板有沒有《分布式系統(tǒng)》這本書，你如果是阻塞式調(diào)用，你會一直把自己“掛起”，直到得到這本書有沒有的結(jié)果，如果是非阻塞式調(diào)用，你不管老板有沒有告訴你，你自己先一邊去玩了，當(dāng)然你也要偶爾過幾分鐘check一下老板有沒有返回結(jié)果。在這里阻塞與非阻塞與是否同步異步無關(guān)。跟老板通過什么方式回答你結(jié)果無關(guān)。

總之一句話，阻塞和非阻塞，描述的是一種狀態(tài)，而同步與非同步描述的是行為方式。

回到協(xié)程上。

類似于Threading 包是對線程的實(shí)現(xiàn)一樣，python3.4之后加入的asyncio 包則是對協(xié)程的實(shí)現(xiàn)。我們用asyncio改寫文章開頭的代碼，看看使用協(xié)程之后能花費(fèi)多少時(shí)間。

import asyncio
import aiohttp
import time

NUMBERS = range(12)
URL = "http://httpbin.org/get?a={}"
# 這里的代碼不理解沒關(guān)系
# 主要是為了證明協(xié)程的強(qiáng)大
async def fetch_async(a):
    async with aiohttp.request("GET", URL.format(a)) as r:
        data = await r.json()
    return data["args"]["a"]

start = time.time()
loop = asyncio.get_event_loop()
tasks = [fetch_async(num) for num in NUMBERS]
results = loop.run_until_complete(asyncio.gather(*tasks))

for num, results in zip(NUMBERS, results):
    print("fetch({}) = ()".format(num, results))

print("cost time: {}".format(time.time() - start))

執(zhí)行結(jié)果：

fetch(0) = ()
fetch(1) = ()
fetch(2) = ()
fetch(3) = ()
fetch(4) = ()
fetch(5) = ()
fetch(6) = ()
fetch(7) = ()
fetch(8) = ()
fetch(9) = ()
fetch(10) = ()
fetch(11) = ()
cost time: 0.8582110404968262

不到一秒！感受到協(xié)程的威力了吧。

asyncio的知識說實(shí)在的有點(diǎn)難懂，因?yàn)樗怯卯惒降姆绞皆诰帉懘a。上面給出的asyncio示例不理解也沒有關(guān)系，之后的文章會詳細(xì)的介紹一些asyncio相關(guān)的概念。

GPU云服務(wù)器云服務(wù)器對人工智能的思考 Python并發(fā)編程對編程語言的偏見 python 思考題

文章版權(quán)歸作者所有，未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為，您可以聯(lián)系管理員刪除。

轉(zhuǎn)載請注明本文地址：http://m.hztianpu.com/yun/41225.html

發(fā)表評論

登陸后可評論

0條評論

sshe

男|高級講師

我要關(guān)注我要私信

TA的文章

feed_dict

閱讀 2032·2023-04-26 00:59
企業(yè)走混合云之路有什么好處？

閱讀 3288·2021-11-15 18:10
虛擬主機(jī)怎么搭建免流-怎樣選擇免備案虛擬主機(jī)空間？

閱讀 3246·2021-09-22 16:02
三文讀透指針語法【上篇】@指針的進(jìn)階---字符指針+數(shù)組指針+指針數(shù)組+數(shù)組傳參和指針傳參

閱讀 917·2021-09-02 15:15
不可思議的純 CSS 實(shí)現(xiàn)鼠標(biāo)跟隨效果

閱讀 3892·2019-08-30 15:56
CSS 中重要的層疊概念

閱讀 2056·2019-08-30 15:54
前端每日實(shí)戰(zhàn)：118# 視頻演示如何用純 CSS 創(chuàng)作一個(gè)沙漏 loader

閱讀 3008·2019-08-29 16:31
【叢林】HTML Table 表格淺談（邊框、隔行變色

閱讀 2208·2019-08-29 16:10

成人无码视频,亚洲精品久久久久av无码,午夜精品久久久久久毛片,亚洲中文字幕日韩无码

資訊專欄INFORMATION COLUMN

上云采購季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺、長期優(yōu)惠，快來選購！

對python并發(fā)編程的思考

相關(guān)文章

Python

python

并發(fā)模型：線程與鎖

那些年我看過的書 —— 致敬我的大學(xué)生活 —— Say Good Bye ！

發(fā)表評論

0條評論

sshe

男|高級講師

TA的文章

feed_dict

企業(yè)走混合云之路有什么好處？

虛擬主機(jī)怎么搭建免流-怎樣選擇免備案虛擬主機(jī)空間？

三文讀透指針語法【上篇】@指針的進(jìn)階---字符指針+數(shù)組指針+指針數(shù)組+數(shù)組傳參和指針傳參

不可思議的純 CSS 實(shí)現(xiàn)鼠標(biāo)跟隨效果

CSS 中重要的層疊概念

前端每日實(shí)戰(zhàn)：118# 視頻演示如何用純 CSS 創(chuàng)作一個(gè)沙漏 loader

【叢林】HTML Table 表格淺談（邊框、隔行變色

最新活動(dòng)

資訊專欄INFORMATION COLUMN

上云采購季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺、長期優(yōu)惠，快來選購！

對python并發(fā)編程的思考

相關(guān)文章

發(fā)表評論

0條評論

男|高級講師

TA的文章

最新活動(dòng)

上云采購季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺、長期優(yōu)惠，快來選購！