python實現(xiàn)mapreduce模式的例子

CoreDump 發(fā)布于2019-07-31 10:53 / 1372人閱讀

摘要：當(dāng)前的軟件實現(xiàn)是指定一個映射函數(shù)，用來把一組鍵值對映射成一組新的鍵值對，指定并發(fā)的歸納函數(shù)，用來保證所有映射的鍵值對中的每一個共享相同的鍵組。下面使用模式實現(xiàn)了一個簡單的統(tǒng)計日志中單詞出現(xiàn)次數(shù)的程序

MapReduce是一種從函數(shù)式編程語言借鑒過來的模式，在某些場景下，它可以極大地簡化代碼。先看一下什么是MapReduce：

MapReduce是Google提出的一個軟件架構(gòu)，用于大規(guī)模數(shù)據(jù)集（大于1TB）的并行運算。概念“Map（映射）”和“Reduce（歸納）”，及他們的主要思想，都是從函數(shù)式編程語言借來的，還有從矢量編程語言借來的特性。
當(dāng)前的軟件實現(xiàn)是指定一個Map（映射）函數(shù)，用來把一組鍵值對映射成一組新的鍵值對，指定并發(fā)的Reduce（歸納）函數(shù)，用來保證所有映射的鍵值對中的每一個共享相同的鍵組。
簡單來說，MapReduce就是把待處理的問題分解為Map和Reduce兩個部分。而待處理的數(shù)據(jù)作為一個序列，每一個序列里的數(shù)據(jù)通過Map的函數(shù)進行運算，再通過Reduce的函數(shù)進行聚合成最終的結(jié)果。

下面使用mapreduce模式實現(xiàn)了一個簡單的統(tǒng)計日志中單詞出現(xiàn)次數(shù)的程序:

from functools import reduce
from multiprocessing import Pool
from collections import Counter

def read_inputs(file):
    for line in file:
        line = line.strip()
        yield line.split()

def count(file_name):
    file = open(file_name)
    lines = read_inputs(file)
    c = Counter()
    for words in lines:
        for word in words:
            c[word] += 1
    return c

def do_task():
    job_list = ["log.txt"] * 10000
    pool = Pool(8)
    return reduce(lambda x, y: x+y, pool.map(count, job_list))

if __name__ == "__main__":
    rv = do_task()

GPU云服務(wù)器云服務(wù)器編程語言的實現(xiàn)模式簡單的python例子單例模式實現(xiàn) python 例子

文章版權(quán)歸作者所有，未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為，您可以聯(lián)系管理員刪除。

轉(zhuǎn)載請注明本文地址：http://m.hztianpu.com/yun/44275.html

發(fā)表評論

登陸后可評論

0條評論

CoreDump

男|高級講師

我要關(guān)注我要私信

TA的文章

鴻蒙之后，華為宣布再將捐贈歐拉，鴻蒙和歐拉的捐贈預(yù)計將給業(yè)界帶來哪些影響？

閱讀 2107·2021-11-11 16:54
在使用新的JavaScript庫時需要考慮的12件事

閱讀 2176·2019-08-30 15:55
前端面試題整理（定期更新）

閱讀 3673·2019-08-30 15:54
編寫可維護的前端代碼

閱讀 456·2019-08-30 15:44
css繪制各種形狀圖形（第二版）

閱讀 2291·2019-08-30 10:58
JavaScript自定義事件

閱讀 487·2019-08-26 10:30
重繪、回流

閱讀 3110·2019-08-23 14:46
Mac聯(lián)機調(diào)試移動端頁面方法和移動端IOS遇到的兼容性問題

閱讀 3314·2019-08-23 13:46

成人无码视频,亚洲精品久久久久av无码,午夜精品久久久久久毛片,亚洲中文字幕日韩无码

資訊專欄INFORMATION COLUMN

上云采購季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺、長期優(yōu)惠，快來選購！

python實現(xiàn)mapreduce模式的例子

相關(guān)文章

PySpark SQL 相關(guān)知識介紹

發(fā)表評論

0條評論

CoreDump

男|高級講師

TA的文章

鴻蒙之后，華為宣布再將捐贈歐拉，鴻蒙和歐拉的捐贈預(yù)計將給業(yè)界帶來哪些影響？

在使用新的JavaScript庫時需要考慮的12件事

前端面試題整理（定期更新）

編寫可維護的前端代碼

css繪制各種形狀圖形（第二版）

JavaScript自定義事件

重繪、回流

Mac聯(lián)機調(diào)試移動端頁面方法和移動端IOS遇到的兼容性問題

最新活動

資訊專欄INFORMATION COLUMN

上云采購季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺、長期優(yōu)惠，快來選購！

python實現(xiàn)mapreduce模式的例子

相關(guān)文章

發(fā)表評論

0條評論

男|高級講師

TA的文章

最新活動

上云采購季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺、長期優(yōu)惠，快來選購！