成人无码视频,亚洲精品久久久久av无码,午夜精品久久久久久毛片,亚洲 中文字幕 日韩 无码

資訊專(zhuān)欄INFORMATION COLUMN

精讀《Tableau 入門(mén)》

svtter / 1452人閱讀

摘要:可以看到,遙遙領(lǐng)先的城市有三個(gè),加州是銷(xiāo)售之王。將再拖拽到,并右鍵將其粒度改為月。從上圖可以看到,指定了個(gè)分類(lèi),最右上角加州就是最突出的一組,整個(gè)聚類(lèi)只有它一個(gè)元素,而畫(huà)面偏左下角的也是一類(lèi),這些是業(yè)績(jī)較差的一組數(shù)據(jù)。

1. 引言

引用著名瑞典統(tǒng)計(jì)學(xué)家 Hans Rosling 的一句話:想法來(lái)源于數(shù)字、信息,再到理解。

分析數(shù)據(jù)的最好方式是可視化,因?yàn)榭梢暬休d的信息密度更高,甚至可以從不同維護(hù)對(duì)數(shù)據(jù)進(jìn)行交互式分析。今天要精讀的文章就分析了經(jīng)典可視化分析工具 Tableau:data-visualisation-made-easy。

2. 精讀

Tableau 是一款廣泛用于智能商業(yè)的強(qiáng)大數(shù)據(jù)分析工具,通過(guò)不同可交互的圖表和儀表盤(pán)幫助你獲得業(yè)務(wù)洞見(jiàn)。

安裝

Tableau 提供了三種使用方式:

Tableau Desktop

擁有 14 天免費(fèi)試用的桌面版,可以將工作數(shù)據(jù)存儲(chǔ)在計(jì)算機(jī)本地,如果你是學(xué)生或老師可以獲得一年的免費(fèi)使用權(quán)。

Tableau Public

公開(kāi)版完全免費(fèi),和桌面版的唯一區(qū)別是,所有數(shù)據(jù)都無(wú)法保存在本地,只能保存在 Tableau 服務(wù)器的云端,而且是公開(kāi)的。

Tableau Online

網(wǎng)頁(yè)版也完全免費(fèi),是 Tableau Public 的網(wǎng)頁(yè)版。

連接數(shù)據(jù)源

安裝好 Tableau 后,第一步就是連接數(shù)據(jù)源。它支持連接本地或云端的數(shù)據(jù)源,本地最常用的數(shù)據(jù)源可以從 Excel 轉(zhuǎn)換。這里是一份 樣例數(shù)據(jù),包含了一個(gè)超市幾年內(nèi)的銷(xiāo)售情況,我們可以用這份數(shù)據(jù)練手。

下載好這份數(shù)據(jù)后,選擇從 Excel 導(dǎo)入,確認(rèn)后將 Orders 表拖拽到右側(cè)區(qū)域,如下圖所示:

可以看到表結(jié)構(gòu)已經(jīng)正常了,在數(shù)據(jù)清洗的過(guò)程中,Tableau 強(qiáng)大的數(shù)據(jù)分析功能已經(jīng)初見(jiàn)端倪。你甚至可以點(diǎn)擊 Review ths results 看看它是如何清洗數(shù)據(jù)的:點(diǎn)擊后會(huì)下載一份分析 Excel,其中過(guò)濾掉的數(shù)據(jù)會(huì)被標(biāo)記,自動(dòng)分析出的表結(jié)構(gòu)會(huì)被高亮。

數(shù)據(jù)可視化

在頁(yè)面最底部有幾個(gè)切換項(xiàng),依次是 Data Source:數(shù)據(jù)源、Sheet:工作簿,后面跟隨的三個(gè)按鈕可以繼續(xù)創(chuàng)建多個(gè) Sheet、Dashboard、Story,這些后面都會(huì)講到。首先點(diǎn)擊 Sheet 進(jìn)入可視化分析的工作簿:

可以看到,總利潤(rùn)大概是總銷(xiāo)量的 10%。如果想展示橫向表格,將 Measure Names 從 Rows 拖拽到 Columns 即可。

Tips: 為了方便區(qū)分,Tableau 貼心的將維度標(biāo)記為藍(lán)色,度量標(biāo)記為綠色。
同時(shí)可以看到,Tableau 對(duì)于單指標(biāo)拖拽,默認(rèn)采取表格方式渲染。

接下來(lái)我們要看每一年的詳細(xì)銷(xiāo)量與利潤(rùn):

將 Order Date 與 Sales 拖拽到 Rows。

右鍵 Sales,將類(lèi)型從連續(xù)改成非連續(xù),這樣就會(huì)自動(dòng)變成表格展示。

為了展示利潤(rùn),將 Profit 字段拖拽到 Marks 的 Text 字段上。

我們可以看到,銷(xiāo)量較高的月份分布在:3、9、11、12 月。注意由于沒(méi)有對(duì)年份做篩選,這里的每月統(tǒng)計(jì)數(shù)據(jù)是整合了 2013~2016 四年份的。也就是 1 月的數(shù)據(jù)其實(shí)代表了 2013.1 + 2014.1 + 2015.1 + 2016.1 共四個(gè) 1 月份數(shù)據(jù)的總和。

接下來(lái)我們想了解銷(xiāo)量與利潤(rùn)增長(zhǎng)的趨勢(shì):

將 Order Date 拖拽到 Columns。

將 Sales 拖拽到 Rows,此時(shí)會(huì)出現(xiàn)一條線。接下來(lái)將 Profit 拖拽到 左 Y 軸。

上圖可以明顯看到三個(gè)峰值出現(xiàn)在 3、9、11 月份,然而這段期間利潤(rùn)增長(zhǎng)幅度卻不大,可以看出這段期間采取了薄利多銷(xiāo)的手段。

再?gòu)牡貐^(qū)維度分析數(shù)據(jù):

將 Regions 和 Sales 拖拽到 Columns。

切換到餅圖。

將 Sales 拖拽到 Marks Pane 的 Label 上。

可以看到數(shù)值越大的區(qū)域一般顏色也越深,但這不是分析利潤(rùn)/銷(xiāo)量性?xún)r(jià)比的最佳方式,我們先只看到加州和紐約是銷(xiāo)售業(yè)績(jī)最好的區(qū)域,而科羅拉多州雖然銷(xiāo)量不錯(cuò),但利潤(rùn)卻是負(fù)的。

上面的地圖對(duì)地形比較直觀,但要分析銷(xiāo)售健康度,還是用散點(diǎn)圖更合適。我們想看看城市銷(xiāo)量/利潤(rùn)的健康度分布:

Profit 拖拽到 Columns,Sales 拖拽到 Rows,此時(shí)散點(diǎn)圖出現(xiàn),但只有一個(gè)點(diǎn)(之所以出現(xiàn)散點(diǎn)圖,是因?yàn)闄M縱軸拖拽的都是度量)。

我們想按城市下鉆,只要把 State 拖拽到 Detail 即可。

可以看到,辦公套件和科技產(chǎn)品業(yè)績(jī)最好,其中辦公套件在 2015 年 12 月銷(xiāo)量利潤(rùn)雙豐收,科技產(chǎn)品在 2015 年 10 月與 2016 年 3 月銷(xiāo)量利潤(rùn)雙豐收。整體來(lái)看前半年是淡季。

但這張圖無(wú)法看到銷(xiāo)量與利潤(rùn)性?xún)r(jià)比關(guān)系,我們要找出利潤(rùn)率最高的商品和利潤(rùn)率最低的商品:

將 Proft 拖拽到 Columns。

將 Sub-Category 拖拽到 Rows。

切換到 Horizontal Bars。

將銷(xiāo)量 Sales 拖拽到 Color。

Tablueau 這種交互等價(jià)于 Sql 中 in 語(yǔ)句,當(dāng)然 Tablueau 還支持更復(fù)雜的條件或代碼表達(dá)式,這里只是將更友好的篩選方式優(yōu)先展示區(qū)來(lái)。

上卷下鉆

Tableau 支持任意維度之間的上卷下鉆,只要你將他們分好組。

比如將 Order Date、Order ID、Ship Date、Ship Mode 拖拽到一起,成為 Orders 組;將 Category、Sub-Category、Product ID Product Name 形成 Product 組:

上卷下鉆是順序相關(guān)的,比如 Product - Order Date 表示在產(chǎn)品類(lèi)目基礎(chǔ)上,對(duì)每個(gè)類(lèi)目按日期下鉆。而 Order Date - Product 這個(gè)順序,表示在日期分布的基礎(chǔ)上,對(duì)日期按產(chǎn)品類(lèi)目下鉆,了解不同日期下每個(gè)產(chǎn)品的分布情況。

趨勢(shì)線

為使用趨勢(shì)線,先制作一個(gè)雙軸圖:

將 Sales 與 Profit 拖拽到 Rows。

將 Order Date 拖拽到 Columns 并切換到月維度。

選擇 Show Me 的 Dual Combination 即混合圖。

趨勢(shì)圖有幾種算法,比如線性,Log 或指數(shù),因此在做趨勢(shì)分析前,首先要判斷自己的業(yè)務(wù)屬于哪種增長(zhǎng)階段,如果是爆發(fā)期可以選擇指數(shù),平穩(wěn)期可以選擇線性等等。

預(yù)測(cè)

回到按月分布的圖表,如果我們想預(yù)測(cè)未來(lái)銷(xiāo)量和利潤(rùn)的走勢(shì),可以使用預(yù)測(cè)功能:

切換到 Analytics Tab,并將 Forecast 拖拽到圖表中。

可以點(diǎn)擊右鍵配置預(yù)測(cè)參數(shù)。

從上圖可以看到,指定了 4 個(gè)分類(lèi),最右上角加州就是最突出的一組,整個(gè)聚類(lèi)只有它一個(gè)元素,而畫(huà)面偏左下角的也是一類(lèi),這些是業(yè)績(jī)較差的一組數(shù)據(jù)。使用了 K 均值聚類(lèi)算法,并且當(dāng)你點(diǎn)擊右鍵查看詳細(xì)星系時(shí),還能把組間、組內(nèi)方差展示出來(lái):

Tableau 的所有圖表都支持點(diǎn)選,排除等操作,那么點(diǎn)選這類(lèi)操作本質(zhì)上其實(shí)是個(gè)篩選的過(guò)程,比如柱狀圖點(diǎn)擊了某根柱子,可以認(rèn)為是選擇了這根柱子當(dāng)前的維度值作為篩選條件。

當(dāng)一個(gè) Sheet 作為篩選條件后,類(lèi)似點(diǎn)選這種操作產(chǎn)生的篩選就會(huì)作用于其他同數(shù)據(jù)集的圖表,因此如上圖所示,當(dāng)點(diǎn)擊了條形圖的某一根柱子時(shí),上面的銷(xiāo)量地圖也自動(dòng)做了篩選,僅展示當(dāng)前選中的產(chǎn)品的銷(xiāo)量分布。

故事

Story 更像是 PPT,將分析后有價(jià)值或有意義的圖表組合在一起,再配合上說(shuō)明,得出一些結(jié)論:

版權(quán)聲明:自由轉(zhuǎn)載-非商用-非衍生-保持署名(創(chuàng)意共享 3.0 許可證)

文章版權(quán)歸作者所有,未經(jīng)允許請(qǐng)勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。

轉(zhuǎn)載請(qǐng)注明本文地址:http://m.hztianpu.com/yun/106665.html

相關(guān)文章

  • 精讀Tableau 探索式模型》

    摘要:比如我們對(duì)調(diào)與會(huì)怎樣我們得到了三個(gè)不同類(lèi)目近個(gè)月的趨勢(shì),之所以是折線圖,因?yàn)閳D表的維度軸列是連續(xù)的。在正式介紹標(biāo)記區(qū)域前,先理解一下為何會(huì)發(fā)生這種轉(zhuǎn)變表格類(lèi)組件是雙維度組件,折線圖是單維度組件。 1. 引言 Tableau 探索式分析功能非常強(qiáng)大,各種功能組合似乎有著無(wú)限的可能性。 今天筆者會(huì)分析這種探索式模型解題思路,一起看看這種探索式分析功能是如何做到的。 2. 精讀 要掌握探索式...

    curried 評(píng)論0 收藏0
  • 精讀《前端未來(lái)展望》

    摘要:精讀前端可以從多個(gè)角度理解,比如規(guī)范框架語(yǔ)言社區(qū)場(chǎng)景以及整條研發(fā)鏈路。同是前端未來(lái)展望,不同的文章側(cè)重的格局不同,兩個(gè)標(biāo)題相同的文章內(nèi)容可能大相徑庭。作為使用者,現(xiàn)在和未來(lái)的主流可能都是微軟系,畢竟微軟在操作系統(tǒng)方面人才儲(chǔ)備和經(jīng)驗(yàn)積累很多。 1. 引言 前端展望的文章越來(lái)越不好寫(xiě)了,隨著前端發(fā)展的深入,需要擁有非常寬廣的視野與格局才能看清前端的未來(lái)。 筆者根據(jù)自身經(jīng)驗(yàn),結(jié)合下面幾篇文章...

    MadPecker 評(píng)論0 收藏0
  • 精讀《正則 ES2018》

    摘要:雖然正則中可以匹配任何字符,但卻無(wú)法匹配換行符。精讀文中列舉的四個(gè)新特性是加入到正則中的。討論地址是精讀正則如果你想?yún)⑴c討論,請(qǐng)點(diǎn)擊這里,每周都有新的主題,周末或周一發(fā)布。 1. 引言 本周精讀的文章是 regexp-features-regular-expressions。 這篇文章介紹了 ES2018 正則支持的幾個(gè)重要特性: Lookbehind assertions - 后行...

    JellyBool 評(píng)論0 收藏0
  • 精讀《談?wù)?Web Workers》

    摘要:可以將耗時(shí)任務(wù)拆解出去,降低主線程的壓力,避免主線程無(wú)響應(yīng)。主線程接收發(fā)消息每個(gè)實(shí)例通過(guò)接收消息,通過(guò)發(fā)送消息。收發(fā)主線程消息和主線程代碼類(lèi)似,在代碼中,也是接收消息,這個(gè)消息來(lái)自主線程或者其它。 1 引言 本周精讀的文章是 speedy-introduction-to-web-workers,是一篇 Web Workers 快速入門(mén)的文章,借精讀這篇文章的機(jī)會(huì),談?wù)剬?duì) Web Wor...

    myeveryheart 評(píng)論0 收藏0

發(fā)表評(píng)論

0條評(píng)論

閱讀需要支付1元查看
<