{eval=Array;=+count(Array);}

成人无码视频,亚洲精品久久久久av无码,午夜精品久久久久久毛片,亚洲 中文字幕 日韩 无码

問答專欄Q & A COLUMN

一般用哪些工具做大數(shù)據(jù)分析?

bang590bang590 回答0 收藏1
收藏問題

8條回答

IntMain

IntMain

回答于2022-06-28 14:56

謝邀~

本君自薦一下。我們的產(chǎn)品諸葛io(www.zhugeio.com)可能更偏向于非技術(shù)人員的業(yè)務分析,比如產(chǎn)品經(jīng)理、市場、運營人員。

從某種意義上也具有可視化分析的特性,但區(qū)別于其他工具的是我們面向互聯(lián)網(wǎng)產(chǎn)品推廣運營過程中的分析需求定義了一些分析模型,比如事件、漏斗、自定義留存、粘性、用戶分群等,很多工具可以任意拖拽去做分析,但很多時候客戶也會因為太靈活反而有一定門檻,所以,當一些模型被標準化以后,基本可以解決互聯(lián)網(wǎng)產(chǎn)品設計、推廣、運營、營銷過程中的絕大多數(shù)分析需求,這也大大提供了業(yè)務人員的工作效率。

附圖幾張:

用戶模型

全行為路徑分析模型

粘性分析模型自定義留存分析模型

關(guān)于一些分析模型,我們整理出了常用的八大數(shù)據(jù)分析模型,過去兩個月,每周二都會更新一個模型,很多模型大家都比較了解,但可能他又增加了一些新特性,感興趣可戳鏈接:

八大數(shù)據(jù)分析模型之——用戶模型(一)

八大數(shù)據(jù)分析模型之——事件模型(二)

八大數(shù)據(jù)分析模型之——漏斗模型(三)

八大數(shù)據(jù)分析模型之——熱圖模型(四)

八大數(shù)據(jù)分析模型之——自定義留存分析模型(五)

八大數(shù)據(jù)分析模型之——粘性分析模型(六)

八大數(shù)據(jù)分析模型之——全行為路徑模型(七)

......

當然,我們也面向有高級使用需求的用戶,比如數(shù)據(jù)分析師或是有一定數(shù)據(jù)查詢能力的人員提供了SQL查詢功能,因為還有20%的分析需求無法通過標準的模型解決,需要自己去定義。

數(shù)據(jù)都是開放的,原始數(shù)據(jù)的導出,實時數(shù)據(jù)的調(diào)用在諸葛都是支持的。數(shù)據(jù)來源于客戶,數(shù)據(jù)屬于客戶。

1、前端表格導出

2、SQL查詢平臺支持

3、查詢API按需調(diào)用

4、直連數(shù)據(jù)倉庫

5、Kafka實時訂閱

6、原始數(shù)據(jù)全量導出

以上~

評論0 贊同0
  •  加載中...
seasonley

seasonley

回答于2022-06-28 14:56

有很多開源的產(chǎn)品,如果有研發(fā)能力的,可以直接使用開源產(chǎn)品來自己搭建數(shù)據(jù)分析平臺,開發(fā)自己的數(shù)據(jù)分析軟件,不過這樣需要較強的技術(shù)能力,付出較大的成本。

也可以使用東軟平臺云(https://cloud.neusoft.com/)的DataViz可視化數(shù)據(jù)分析軟件,這樣的專業(yè)的尅時候數(shù)據(jù)分析軟件,不需要專業(yè)的分析師和技術(shù)人員,業(yè)務人員通過簡單的拖拽就可以實現(xiàn)數(shù)據(jù)分析,還支持多種數(shù)據(jù)源,支持動態(tài)傳統(tǒng)圖表和高級可視化圖表,多種科技、商務主題自由切換,支持拖拽圖表組合布局,設置圖表聯(lián)動交互,分析結(jié)果支持適應各種分辨率的大屏展示。

評論0 贊同0
  •  加載中...
騫諱護

騫諱護

回答于2022-06-28 14:56

MongoDB—— 一種流行的,跨平臺的面向文檔的數(shù)據(jù)庫。

Elasticsearch——專為云而構(gòu)建的分布式REST風格搜索引擎。

Cassandra——一個開源的分布式數(shù)據(jù)庫管理系統(tǒng),最初由Facebook開發(fā),被設計用來處理橫跨多個商用服務器的大量數(shù)據(jù),提供了無單點故障的高度可用性。

Redis—— 一個開源的(BSD許可),內(nèi)存數(shù)據(jù)結(jié)構(gòu)存儲,作為數(shù)據(jù)庫、緩存和消息代理使用。

Hazelcast——基于Java的開源內(nèi)存數(shù)據(jù)網(wǎng)格。

EHCache——一種被廣泛使用的開源Java分布式緩存,用于通用緩存、Java EE和輕量級容器。Ehcache相關(guān)介紹

Hadoop——用Java編寫的一個開源軟件框架,用于分布式存儲和對在計算機集群上的超大型數(shù)據(jù)集的分布式處理。

Solr——一個開源的企業(yè)搜索平臺,用Java編寫的,來自于ApacheLucene項目。

Spark——Apache Software Foundation中最活躍的項目,一個開源的集群計算框架。

Memcached—— 一個通用的分布式內(nèi)存緩存系統(tǒng)。

Apache Hive——提供了Hadoop之上類似于SQL的層。

Apache Kafka—— 一個高通量、分布式的發(fā)布-訂閱式消息系統(tǒng),最初開發(fā)在LinkedIn上。Windows上脫離Cygwin運行Apache Kafka

Akka—— 一個工具包和運行時,用于在JVM上構(gòu)建高度并行的、分布式的、有彈性的消息驅(qū)動的應用程序。

HBase—— 一個開源的,非關(guān)系型的,分布式數(shù)據(jù)庫,在谷歌的BigTable后建模,用Java編寫,并運行在HDFS上。

Neo4j——用Java實現(xiàn)的開源圖形數(shù)據(jù)庫。

CouchBase——一個開源的、面向文檔的分布式NoSQL數(shù)據(jù)庫,特別為了交互式應用而優(yōu)化。

Apache Storm——開源的分布式實時計算系統(tǒng)。

CouchDB——使用JSON來存儲數(shù)據(jù)的面向文檔的開源NoSQL數(shù)據(jù)庫。

Oracle Coherence—— 一個內(nèi)存的數(shù)據(jù)網(wǎng)格解決方案,通過提供快速訪問常用數(shù)據(jù)的渠道,使得企業(yè)可預測地擴展關(guān)鍵任務應用程序。

Titan—— 一個可擴展的圖形數(shù)據(jù)庫,優(yōu)化的目的在于存儲和查詢包含數(shù)千億頂點和邊的圖形,分布在多機集群。

Amazon DynamoDB——一個快速、靈活、完全管理的NoSQL數(shù)據(jù)庫服務,用于在任何規(guī)模需要一致的、個位數(shù)毫秒延遲的所有應用程序。

Amazon Kinesis—— 用于在AWS上的流數(shù)據(jù)的實時平臺。

Datomic—— 一個用Clojure寫的完全事務式的,支持云的,分布式數(shù)據(jù)庫。


原文鏈接:https://blog.csdn.net/zhinengxuexi/article/details/90056986

評論0 贊同0
  •  加載中...
helloworldcodin

helloworldcodin

回答于2022-06-28 14:56

按需求選擇吧:

19個超贊的數(shù)據(jù)科學和機器學習工具:https://www.toutiao.com/i6585379544813797901/

3大開源Python數(shù)據(jù)分析工具

https://www.toutiao.com/i6589410805932884493/

評論0 贊同0
  •  加載中...
sunny5541

sunny5541

回答于2022-06-28 14:56

看你問的是可視化工具類還是說數(shù)據(jù)處理框架。具體指的是哪方面的數(shù)據(jù),可以評論我說明。

評論0 贊同0
  •  加載中...
qpal

qpal

回答于2022-06-28 14:56


在推薦工具之前,我們要先把數(shù)據(jù)可視化和 信息可視化分清楚,狹義上的數(shù)據(jù)可視化指的是將數(shù)據(jù)用統(tǒng)計圖表方式呈現(xiàn),而信息可視化則是將非數(shù)字的信息進行可視化。

我們常常聽說的數(shù)據(jù)可視化大多指狹義的數(shù)據(jù)可視化以及部分信息可視化。根據(jù)數(shù)據(jù)類型和性質(zhì)的差異,經(jīng)常分為以下幾種類型:

  • 統(tǒng)計數(shù)據(jù)可視化:用于對統(tǒng)計數(shù)據(jù)進行展示、分析,一般都是以數(shù)據(jù)庫表的形式提供,常見的有 HighCharts、ECharts、G2、Chart.js 、FineBI等等;
  • 關(guān)系數(shù)據(jù)可視化:主要表現(xiàn)為節(jié)點和邊的關(guān)系,比如流程圖、網(wǎng)絡圖、UML 圖、力導圖等。常見的關(guān)系可視化類庫有 mxGraph、JointJS、GoJS、G6 等;
  • 地理空間數(shù)據(jù)可視化:常見類庫如 Leaflet、Turf、Polymaps 等等;
  • 還有時間序列數(shù)據(jù)可視化(如 timeline)、文本數(shù)據(jù)可視化(如 worldcloud)等等;

然后下面我再來盤點幾個大數(shù)據(jù)可視化常用的工具:

一、D3

D3.js 是一個基于數(shù)據(jù)操作文檔的 JavaScript 庫。 D3 可以將強大的可視化組件和數(shù)據(jù)驅(qū)動的 DOM 操作方法完美結(jié)合。

D3 的優(yōu)劣:

  • 強大的 SVG 操作能力,可以非常容易的將數(shù)據(jù)映射為 SVG 屬性
  • 集成了大量數(shù)據(jù)處理、布局算法和計算圖形的工具方法
  • 強大的社區(qū)和豐富的 demo
  • API 太底層,復用性低,學習與使用成本高

D3 沒有提供封裝好的組件,在復用性、易用性方面不佳,社區(qū)里有很多基于 D3 的可視化組件庫:

  • nvd3.js: 基于 D3 封裝了常見的折線圖、散點圖、餅圖,功能比較簡單
  • dc.js: 除了提供了常見的圖表外還提供了一些數(shù)據(jù)處理能力
  • c3.js: 一個輕量級的基于狀態(tài)管理的圖表庫

D3 有著 Stanford 的血脈淵源,在學術(shù)界享有很高聲譽,靈活強大使得它成為目前領域內(nèi)使用最廣泛的可視化類庫,但偏底層的 API 和數(shù)據(jù)驅(qū)動模式,使得上手 D3 存在一定門檻,基于 D3 的工程實現(xiàn)上需要自己考慮和處理更多內(nèi)容,如動畫、交互、統(tǒng)一樣式等,研發(fā)成本較高。

二、FineBI

簡潔明了的數(shù)據(jù)分析工具,優(yōu)點是零代碼可視化、可視化圖表豐富,只需要拖拖拽拽就可以完成十分炫酷的可視化效果,擁有數(shù)據(jù)整合、可視化數(shù)據(jù)處理、探索性分析、數(shù)據(jù)挖掘、可視化分析報告等功能,更重要的是個人版免費。

評價:

FineBI做到了自助式分析,圖表類型豐富,數(shù)據(jù)分析功能較強大,鉆取,篩選,分組等功能都有。但是對于普通沒有IT基礎的人來說,要想真正熟練地掌握finebi,還是有一定的難度的,需要花上幾天,但是這個難度相比Excel的VBA學習還是低不少的。

三、HighCharts

HighCharts 是一個用純 JavaScript 編寫的圖表庫, 能夠簡單便捷的在 Web 應用上添加交互性圖表。這是在 Web 上使用最廣泛的圖表,企業(yè)使用需要購買商業(yè)授權(quán)。

HighCharts 的優(yōu)劣:

  • 使用門檻極低,兼容性好
  • 使用廣泛,非常成熟
  • 樣式比較陳舊、圖表難以擴展
  • 商業(yè)上使用需要購買版權(quán)

這是圖表界的 jQuery,在世界范圍內(nèi)是使用最多最廣的一個可視化類庫,但整體圖表設計比較陳舊難以擴展,同時商業(yè)公司使用需要按照使用人數(shù)購買版權(quán),比較昂貴,ucloud有購買過,目前已不推薦使用。

四、ECharts

ECharts 縮寫自 Enterprise Charts,企業(yè)級圖表,開源來自百度數(shù)據(jù)可視化團隊,是一個純 Javascript 的圖表庫,可以流暢的運行在 PC 和移動設備上,兼容當前絕大部分瀏覽器,底層依賴另一個也是該團隊自主研發(fā)的輕量級的 Canvas 類庫 ZRender,提供直觀,生動,可交互,可高度個性化定制的數(shù)據(jù)可視化圖表。ECharts 是目前國內(nèi)唯一一個入選 GitHub 全球可視化榜單的開源項目,2w+ star 全球排名第三,社區(qū)活躍,覆蓋主流前端框架和 8 種編程語言的擴展,目前國內(nèi)市場占有率處于絕對領先地位。

ECharts 的優(yōu)劣:

  • 豐富的圖表類型,覆蓋主流常規(guī)的統(tǒng)計圖表
  • 配置項驅(qū)動,三級個性化圖表樣式管理
  • 移動端優(yōu)化,交互和布局適配,按需打包
  • 深度的交互式數(shù)據(jù)探索
  • 地理特效(百度遷徙,百度人氣,公交軌跡等效果)
  • 靈活性上不如 Vega 等基于圖形語法的類庫
  • 復雜關(guān)系型圖表比較難定制

ECharts 能很好滿足傳統(tǒng)圖表需求,但在高度靈活多樣化的可視需求面前,需要另尋出路。

五、Leaflet

Leaflet 是面向移動設備的交互式地圖的 JavaScript 庫。 測量的 JS 只有大約 38 KB,它具有大多數(shù)開發(fā)人員需要的所有映射功能。

Leaflet 的優(yōu)劣:

  • 專門針對地圖應用
  • mobile 兼容性良好
  • API 簡潔、支持插件機制
  • 功能比較簡單,需要具備二次開發(fā)能力

地圖專用,其他領域使用不上。目前 Google 地圖、高德地圖、百度地圖都擁有自研的 JS 庫。

六、Vega

Vega 是華盛頓大學計算機學院數(shù)據(jù)交互實驗室(IDL)開發(fā)的一套交互圖形語法,定義了數(shù)據(jù)到圖形的映射規(guī)則、常見的交互語法和常見的圖形元素,用戶可以自由使用 Vega 語法進行組合構(gòu)建出各種各樣的圖表。

Vega 的優(yōu)劣:

  • 完全基于 JSON 語法,提供從數(shù)據(jù)到圖形的映射規(guī)則
  • 支持常見的交互語法
  • 復雜的語法設計,使用和學習成本很高

Vega 在學術(shù)上有著比較完美的語法設計,但在工程易用性上比較欠缺。

七、deck.gl

deck.gl 是 Uber 可視化團隊基于 WebGL 開發(fā)的面向大數(shù)據(jù)分析的可視化類庫。

deck.gl 的優(yōu)劣:

  • 主要以 3D 地圖可視化為主,內(nèi)置了地理信息可視化常見的場景
  • 支持大規(guī)模數(shù)據(jù)的可視化
  • 需要具備 WebGL 的知識,層的擴展比較復雜

deck.gl 在 3D 地圖領域效果很贊,在其他領域不適用。

基于 Web 的可視化工具還有很多,上面是幾個一直以來使用比較多的類庫工具,以及最近涌現(xiàn)的一些新秀。各個類庫工具特性不同,定位不同,關(guān)鍵要看應用場景的適用性。

八、AntV

AntV 是螞蟻金服全新一代數(shù)據(jù)可視化解決方案,主要面向從事數(shù)據(jù)可視化應用相關(guān)的工程師和設計師,目前包括:

  • 底層繪圖引擎 G:目前基于 canvas 2d 提供基礎繪圖能力,基于 webgl 的版本正在規(guī)劃中;
  • 可視化語法類庫 G2:一套數(shù)據(jù)驅(qū)動的高交互可視化圖形語法,提供了豐富的圖表、專業(yè)的數(shù)據(jù)處理能力、便利的擴展方式和強大交互能力;
  • 關(guān)系可視化類庫 G6:專注解決流程與關(guān)系分析的圖表庫,集成了大量的交互,可以輕松的進行動態(tài)流程圖和關(guān)系網(wǎng)絡的開發(fā);
  • 移動端圖表類庫 F2:是一套精簡、高效易擴展的移動端圖表庫,適于對性能、體積、擴展性要求嚴苛的移動應用場景下使用;
  • 可視化設計指引與使用規(guī)范:統(tǒng)計圖表以及常用場景下的可視化設計指引和使用規(guī)范;
九、G2

G2 (The Grammar Of Graphics) 是一個由純 JavaScript 編寫、強大的語義化圖表語法類庫,提供了一整套圖形語法,可以讓用戶通過簡單的語法搭建出無數(shù)種圖表,并集成了大量的統(tǒng)計工具,支持多種坐標系繪制,可以讓用戶自由地定制各種圖表。

G2 的優(yōu)劣:

  • 簡單、易用
  • 完備的可視化編碼
  • 強大的擴展能力
  • 語法需要一定學習成本
十、G6

G6 是一個由純 JavaScript 編寫的關(guān)系數(shù)據(jù)可視化類庫,提供了基本的網(wǎng)圖和樹圖功能,并支持多種內(nèi)置布局。G6 提供了查看和編輯兩種視圖,開發(fā)者可基于 G6 對關(guān)系圖快速進行二次開發(fā)。

G6 的優(yōu)劣:

  • 簡單的語法,強大的交互能力
  • 支持多種視圖,易于使用的編輯視圖
  • 強大的邊和節(jié)點的擴展能力
  • 現(xiàn)階段上層封裝比較少,使用成本比較高

評論0 贊同0
  •  加載中...
mgckid

mgckid

回答于2022-06-28 14:56

1、奧威BI工具

多用于億級數(shù)據(jù)量的大數(shù)據(jù)智能可視化分析,如大中型企業(yè)、集團項目等。

有標準化的數(shù)據(jù)分析解決方案,預設數(shù)據(jù)分析模板;無縫對接金蝶、用友等主流ERP;可做必要的個性化設計。

說白了就是給你一個標準化的、系統(tǒng)化的解決方案,你拿過來稍微改改就能得到一個適合自己的大數(shù)據(jù)可視分析平臺。這可比自己從零開始做藍圖設計、搭建分析模型、測試要省事多了。

2、SpeedBI數(shù)據(jù)分析云

多用于小微企業(yè)、個人用戶。免下載安裝,在線使用。

從瀏覽器中登錄即可免費用。拖拉拽+點擊即可應用智能分析功能、可視化圖表等,完成智能數(shù)據(jù)可視化分析報表。

評論0 贊同0
  •  加載中...
xingqiba

xingqiba

回答于2022-06-28 14:56

大數(shù)據(jù)分析的前瞻性使得很多公司以及企業(yè)都開始使用大數(shù)據(jù)分析對公司的決策做出幫助,而大數(shù)據(jù)分析是去分析海量的數(shù)據(jù),所以就不得不借助一些工具去分析大數(shù)據(jù),。一般來說,數(shù)據(jù)分析工作中都是有很多層次的,這些層次分別是數(shù)據(jù)存儲層、數(shù)據(jù)報表層、數(shù)據(jù)分析層、數(shù)據(jù)展現(xiàn)層。對于不同的層次是有不同的工具進行工作的。下面小編就對大數(shù)據(jù)分析工具給大家好好介紹一下。

首先我們從數(shù)據(jù)存儲來講數(shù)據(jù)分析的工具。我們在分析數(shù)據(jù)的時候首先需要存儲數(shù)據(jù),數(shù)據(jù)的存儲是一個非常重要的事情,如果懂得數(shù)據(jù)庫技術(shù),并且能夠操作好數(shù)據(jù)庫技術(shù),這就能夠提高數(shù)據(jù)分析的效率。而數(shù)據(jù)存儲的工具主要是以下的工具。

1、MySQL數(shù)據(jù)庫,這個對于部門級或者互聯(lián)網(wǎng)的數(shù)據(jù)庫應用是必要的,這個時候關(guān)鍵掌握數(shù)據(jù)庫的庫結(jié)構(gòu)和SQL語言的數(shù)據(jù)查詢能力。

2、SQL Server的最新版本,對中小企業(yè),一些大型企業(yè)也可以采用SQL Server數(shù)據(jù)庫,其實這個時候本身除了數(shù)據(jù)存儲,也包括了數(shù)據(jù)報表和數(shù)據(jù)分析了,甚至數(shù)據(jù)挖掘工具都在其中了。

3、DB2,Oracle數(shù)據(jù)庫都是大型數(shù)據(jù)庫了,主要是企業(yè)級,特別是大型企業(yè)或者對數(shù)據(jù)海量存儲需求的就是必須的了,一般大型數(shù)據(jù)庫公司都提供非常好的數(shù)據(jù)整合應用平臺;

接著說數(shù)據(jù)報表層。一般來說,當企業(yè)存儲了數(shù)據(jù)后,首先要解決報表的問題。解決報表的問題才能夠正確的分析好數(shù)據(jù)庫。關(guān)于數(shù)據(jù)報表所用到的數(shù)據(jù)分析工具就是以下的工具。

1、Crystal Report水晶報表,Bill報表,這都是全球最流行的報表工具,非常規(guī)范的報表設計思想,早期商業(yè)智能其實大部分人的理解就是報表系統(tǒng),不借助IT技術(shù)人員就可以獲取企業(yè)各種信息——報表。

2、Tableau軟件,這個軟件是近年來非常棒的一個軟件,當然它已經(jīng)不是單純的數(shù)據(jù)報表軟件了,而是更為可視化的數(shù)據(jù)分析軟件,因為很多人經(jīng)常用它來從數(shù)據(jù)庫中進行報表和可視化分析。

第三說的是數(shù)據(jù)分析層。這個層其實有很多分析工具,當然我們最常用的就是Excel,我經(jīng)常用的就是統(tǒng)計分析和數(shù)據(jù)挖掘工具;

1、Excel軟件,首先版本越高越好用這是肯定的;當然對Excel來講很多人只是掌握了5%Excel功能,Excel功能非常強大,甚至可以完成所有的統(tǒng)計分析工作!但是我也常說,有能力把Excel玩成統(tǒng)計工具不如專門學會統(tǒng)計軟件;

2、SPSS軟件:當前版本是18,名字也改成了PASW Statistics;我從3.0開始Dos環(huán)境下編程分析,到現(xiàn)在版本的變遷也可以看出SPSS社會科學統(tǒng)計軟件包的變化,從重視醫(yī)學、化學等開始越來越重視商業(yè)分析,現(xiàn)在已經(jīng)成為了預測分析軟件。

最后說表現(xiàn)層的軟件。一般來說表現(xiàn)層的軟件都是很實用的工具。表現(xiàn)層的軟件就是下面提到的內(nèi)容。

1、PowerPoint軟件:大部分人都是用PPT寫報告。

2、Visio、SmartDraw軟件:這些都是非常好用的流程圖、營銷圖表、地圖等,而且從這里可以得到很多零件;

3、Swiff Chart軟件:制作圖表的軟件,生成的是Flash。

評論0 贊同0
  •  加載中...

您已邀請0人回答 查看邀請

我的邀請列表

  • 擅長該話題
  • 回答過該話題
  • 我關(guān)注的人
向幫助了您的網(wǎng)友說句感謝的話吧!
付費偷看金額在0.1-10元之間
<