摘要:到年,這一數據將急劇上升至。為了了解當今大數據的背景,重要的是要了解每個階段如何對大數據的當代意義做出貢獻。數據庫管理和數據倉庫被視為大數據第階段的核心組件。
自1990年代初以來,一直使用“大數據”一詞。盡管尚不清楚最初使用該術語的人是誰,但大多數人都贊揚John R. Mashey(當時在Silicon Graphics工作)。
從本質上講,大數據不是全新的東西,也不只是過去二十年的東西。幾個世紀以來,人們一直在嘗試使用數據分析和分析技術來支持他們的決策過程。公元前300年左右的古埃及人已經嘗試捕獲亞歷山大圖書館中所有現有的“數據”。此外,羅馬帝國過去曾仔細分析其軍隊的統(tǒng)計數據,以確定其軍隊的最佳分配。
但是,在過去的二十年中,生成數據的數量和速度發(fā)生了變化-超出了人類的理解范圍。2013年,全球數據總量為4.4 ZB。到2020年,這一數據將急劇上升至44 ZB。從這個角度來看,44 ZB相當于44萬億千兆字節(jié)。即使采用當今最先進的技術,也無法分析所有這些數據。處理這些越來越大(和非結構化)數據集的需求是過去十年中傳統(tǒng)數據分析如何轉變?yōu)椤按髷祿薄?/p>
為了說明隨著時間的發(fā)展,大數據的發(fā)展大致可以分為三個主要階段。每個階段都有自己的特征和功能。為了了解當今大數據的背景,重要的是要了解每個階段如何對大數據的當代意義做出貢獻。
大數據階段1.0
數據分析,數據分析和大數據源于數據庫管理的長期領域。它在很大程度上依賴于關系數據庫管理系統(tǒng)(RDBMS)中存儲的數據中常見的存儲,提取和優(yōu)化技術。
數據庫管理和數據倉庫被視為大數據第1階段的核心組件。它使用諸如數據庫查詢,在線分析處理和標準報告工具之類的眾所周知的技術,為我們今天所知的現代數據分析奠定了基礎。
大數據階段2.0
自2000年代初以來,Internet和Web開始提供獨特的數據收集和數據分析機會。隨著網絡流量和在線商店的擴展,雅虎,亞馬遜和eBay等公司開始通過分析點擊率,特定于IP的位置數據和搜索日志來分析客戶行為。這為可能性開辟了一個全新的世界。
從數據分析,數據分析和大數據的角度來看,基于HTTP的Web流量導致半結構化和非結構化數據的大量增加。除了標準的結構化數據類型,組織現在還需要找到新方法和存儲解決方案來處理這些新數據類型,以便對其進行有效分析。社交媒體數據的到來和增長極大地加劇了對工具,技術和分析技術的需求,這些工具,技術和分析技術能夠從這種非結構化數據中提取出有意義的信息。
大數據階段3.0
盡管基于Web的非結構化內容仍然是許多組織在數據分析,數據分析和大數據中的主要重點,但是從移動設備中發(fā)現了檢索有價值的信息的當前可能性。
移動設備不僅可以分析行為數據(例如點擊和搜索查詢),而且還可以存儲和分析基于位置的數據(GPS數據)。隨著這些移動設備的進步,可以跟蹤運動,分析身體行為甚至健康相關數據(每天要執(zhí)行的步驟數)。這些數據為交通,城市設計和醫(yī)療保健提供了全新的機會。
同時,基于傳感器的基于Internet的設備的興起正以前所未有的速度增加了數據的生成。成千上萬的電視,恒溫器,可穿戴設備,甚至是冰箱,都被稱為“物聯網”(IoT),現在每天都在生成ZB數據。從這些新數據源中提取有意義和有價值的信息的競賽才剛剛開始。
下圖列出了大數據的三個階段的摘要:
文章版權歸作者所有,未經允許請勿轉載,若此文章存在違規(guī)行為,您可以聯系管理員刪除。
轉載請注明本文地址:http://m.hztianpu.com/yun/125905.html
摘要:直到年月日,金蝶微博品牌正式升級為云之家,從打造社交化工作空間,向提升企業(yè)的運營和管理效率傾斜。所以客觀地說,隨著這幾年金蝶的不斷發(fā)力,深耕大樣板客戶和產品,給了云之家更多顛覆的勇氣和信心。提起OA市場大家更多的會想到的是泛微、致遠、藍凌,自從泛微上市以來原本三分天下的格局被打破。泛微在市場上對另外兩家采取高壓態(tài)勢,藍凌選擇緊抱阿里的大腿尋找避風港灣,致遠則選擇差異化競爭,放棄OA這個名詞轉...
摘要:前段時間重構一個頁面,頁面中存在通過第三方代碼插入的動態(tài)廣告正常的產品需求,上線后發(fā)現第三方的廣告資源存在重復請求的問題。所以,同一個請求會觸發(fā)兩次的原因頁面加載時渲染元素會觸發(fā)第一次請求,執(zhí)行代碼導致重新渲染觸發(fā)第二次請求。 前段時間重構一個頁面,頁面中存在通過第三方JavaScript代碼插入的動態(tài)廣告(正常的產品需求),上線后發(fā)現第三方的廣告資源存在重復請求的問題。由于控制廣告插...
摘要:前段時間重構一個頁面,頁面中存在通過第三方代碼插入的動態(tài)廣告正常的產品需求,上線后發(fā)現第三方的廣告資源存在重復請求的問題。所以,同一個請求會觸發(fā)兩次的原因頁面加載時渲染元素會觸發(fā)第一次請求,執(zhí)行代碼導致重新渲染觸發(fā)第二次請求。 前段時間重構一個頁面,頁面中存在通過第三方JavaScript代碼插入的動態(tài)廣告(正常的產品需求),上線后發(fā)現第三方的廣告資源存在重復請求的問題。由于控制廣告插...
閱讀 3771·2023-04-25 20:09
閱讀 3920·2022-06-28 19:00
閱讀 3298·2022-06-28 19:00
閱讀 3321·2022-06-28 19:00
閱讀 3461·2022-06-28 19:00
閱讀 3095·2022-06-28 19:00
閱讀 3366·2022-06-28 19:00
閱讀 2888·2022-06-28 19:00