成人无码视频,亚洲精品久久久久av无码,午夜精品久久久久久毛片,亚洲 中文字幕 日韩 无码

資訊專欄INFORMATION COLUMN

python大數(shù)據(jù)可視化制作趨勢(shì)線和界限統(tǒng)計(jì)圖表

89542767 / 802人閱讀

  本文關(guān)鍵闡述了python大數(shù)據(jù)可視化制作趨勢(shì)線和界限統(tǒng)計(jì)圖表,python制作趨勢(shì)線,呈現(xiàn)2個(gè)自變量的關(guān)系,當(dāng)數(shù)據(jù)信息包括多個(gè)時(shí),應(yīng)用不一樣顏色形狀區(qū)別


  一、制作趨勢(shì)線


  實(shí)現(xiàn)方案:


  python制作趨勢(shì)線,呈現(xiàn)2個(gè)自變量的關(guān)系,當(dāng)數(shù)據(jù)信息包括多個(gè)時(shí),應(yīng)用不一樣顏色形狀區(qū)別。


  實(shí)現(xiàn)代碼:


  import numpy as np
  import pandas as pd
  import matplotlib as mpl
  import matplotlib.pyplot as plt
  import seaborn as sns
  import warnings
  warnings.filterwarnings(action='once')
  plt.style.use('seaborn-whitegrid')
  sns.set_style("whitegrid")
  print(mpl.__version__)
  print(sns.__version__)
  def draw_scatter(file):
  #Import dataset
  midwest=pd.read_csv(file)
  #Prepare Data
  #Create as many colors as there are unique midwest['category']
  categories=np.unique(midwest['category'])
  colors=[plt.cm.Set1(i/float(len(categories)-1))for i in range(len(categories))]
  #Draw Plot for Each Category
  plt.figure(figsize=(10,6),dpi=100,facecolor='w',edgecolor='k')
  for i,category in enumerate(categories):
  plt.scatter('area','poptotal',data=midwest.loc[midwest.category==category,:],s=20,c=colors<i>,label=str(category))
  #Decorations
  plt.gca().set(xlim=(0.0,0.1),ylim=(0,90000),)
  plt.xticks(fontsize=10)
  plt.yticks(fontsize=10)
  plt.xlabel('Area',fontdict={'fontsize':10})
  plt.ylabel('Population',fontdict={'fontsize':10})
  plt.title("Scatterplot of Midwest Area vs Population",fontsize=12)
  plt.legend(fontsize=10)
  plt.show()
  draw_scatter("F:數(shù)據(jù)雜壇datasetsmidwest_filter.csv")


  實(shí)現(xiàn)效果:

01.png

  二、繪制邊界氣泡圖


  實(shí)現(xiàn)功能:


  氣泡圖是散點(diǎn)圖中的一種類型,可以展現(xiàn)三個(gè)數(shù)值變量之間的關(guān)系,之前的文章介紹過一般的散點(diǎn)圖都是反映兩個(gè)數(shù)值型變量的關(guān)系,所以如果還想通過散點(diǎn)圖添加第三個(gè)數(shù)值型變量的信息,一般可以使用氣泡圖。氣泡圖的實(shí)質(zhì)就是通過第三個(gè)數(shù)值型變量控制每個(gè)散點(diǎn)的大小,點(diǎn)越大,代表的第三維數(shù)值越高,反之亦然。而邊界氣泡圖則是在氣泡圖添加第四個(gè)類別型變量的信息,將一些重要的點(diǎn)選出來并連接。


  實(shí)現(xiàn)代碼:


  import numpy as np
  import pandas as pd
  import matplotlib as mpl
  import matplotlib.pyplot as plt
  import seaborn as sns
  import warnings
  from scipy.spatial import ConvexHull
  warnings.filterwarnings(action='once')
  plt.style.use('seaborn-whitegrid')
  sns.set_style("whitegrid")
  print(mpl.__version__)
  print(sns.__version__)
  def draw_scatter(file):
  #Step 1:Prepare Data
  midwest=pd.read_csv(file)
  #As many colors as there are unique midwest['category']
  categories=np.unique(midwest['category'])
  colors=[plt.cm.Set1(i/float(len(categories)-1))for i in range(len(categories))]
  #Step 2:Draw Scatterplot with unique color for each category
  fig=plt.figure(figsize=(10,6),dpi=80,facecolor='w',edgecolor='k')
  for i,category in enumerate(categories):
  plt.scatter('area','poptotal',data=midwest.loc[midwest.category==category,:],s='dot_size',c=colors<i>,label=str(category),edgecolors='black',linewidths=.5)
  #Step 3:Encircling
  #https://stackoverflow.com/questions/44575681/how-do-i-encircle-different-data-sets-in-scatter-plot
  def encircle(x,y,ax=None,**kw):#定義encircle函數(shù),圈出重點(diǎn)關(guān)注的點(diǎn)
  if not ax:ax=plt.gca()
  p=np.c_[x,y]
  hull=ConvexHull(p)
  poly=plt.Polygon(p[hull.vertices,:],**kw)
  ax.add_patch(poly)
  #Select data to be encircled
  midwest_encircle_data1=midwest.loc[midwest.state=='IN',:]
  encircle(midwest_encircle_data1.area,midwest_encircle_data1.poptotal,ec="pink",fc="#74C476",alpha=0.3)
  encircle(midwest_encircle_data1.area,midwest_encircle_data1.poptotal,ec="g",fc="none",linewidth=1.5)
  midwest_encircle_data6=midwest.loc[midwest.state=='WI',:]
  encircle(midwest_encircle_data6.area,midwest_encircle_data6.poptotal,ec="pink",fc="black",alpha=0.3)
  encircle(midwest_encircle_data6.area,midwest_encircle_data6.poptotal,ec="black",fc="none",linewidth=1.5,linestyle='--')
  #Step 4:Decorations
  plt.gca().set(xlim=(0.0,0.1),ylim=(0,90000),)
  plt.xticks(fontsize=12)
  plt.yticks(fontsize=12)
  plt.xlabel('Area',fontdict={'fontsize':14})
  plt.ylabel('Population',fontdict={'fontsize':14})
  plt.title("Bubble Plot with Encircling",fontsize=14)
  plt.legend(fontsize=10)
  plt.show()
  draw_scatter("F:數(shù)據(jù)雜壇datasetsmidwest_filter.csv")


  實(shí)現(xiàn)效果:

02.png

  綜上所述,這篇文章就給大家介紹到這里了,希望可以給大家?guī)韼椭?/p>

文章版權(quán)歸作者所有,未經(jīng)允許請(qǐng)勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。

轉(zhuǎn)載請(qǐng)注明本文地址:http://m.hztianpu.com/yun/130271.html

相關(guān)文章

  • 常用的數(shù)據(jù)視化工具

    摘要:俗話說,不會(huì)使用工具來完成任務(wù)的都是進(jìn)化不完全的表現(xiàn),大數(shù)據(jù)時(shí)代,可視化已經(jīng)深深鉆進(jìn)我們的生活,使用可視化工具也變的相當(dāng)普遍,今天我們來總結(jié)下當(dāng)下可視化工具都有哪些。是一個(gè)地圖庫,主要面向數(shù)據(jù)可視化用戶。 俗話說,不會(huì)使用工具來完成任務(wù)的都是進(jìn)化不完全的表現(xiàn),大數(shù)據(jù)時(shí)代,可視化已經(jīng)深深鉆進(jìn)我們的生活,使用可視化工具也變的相當(dāng)普遍,今天我們來總結(jié)下當(dāng)下可視化工具都有哪些。 showImg...

    philadelphia 評(píng)論0 收藏0
  • 小企業(yè)需要數(shù)據(jù)分析嗎?

    摘要:這些功能和詞匯聽起來非常復(fù)雜,似乎對(duì)業(yè)務(wù)人員要求很高,但像網(wǎng)易有數(shù)這樣的敏捷可視化分析工具不僅具備這樣的能力,而且易學(xué)易用,業(yè)務(wù)人員只需簡單拖拽,就能輕松制作出兼具敏捷分析與精美展示的報(bào)告。 歡迎訪問網(wǎng)易云社區(qū),了解更多網(wǎng)易技術(shù)產(chǎn)品運(yùn)營經(jīng)驗(yàn)。 在回答小企業(yè)是否需要數(shù)據(jù)分析這個(gè)問題之前,不妨先想想下面兩個(gè)問題: 你在電腦上建過表格嗎? 你基于表格中的數(shù)據(jù)畫過柱形圖、餅狀圖、折線圖嗎? 可...

    baishancloud 評(píng)論0 收藏0
  • 這里有8個(gè)流行的Python視化工具包,你喜歡哪個(gè)?

    摘要:下面,作者介紹了八種在中實(shí)現(xiàn)的可視化工具包,其中有些包還能用在其它語言中。當(dāng)提到這些可視化工具時(shí),我想到三個(gè)詞探索數(shù)據(jù)分析。還可以選擇樣式,它模擬了像和等很流行的美化工具。有很多數(shù)據(jù)可視化的包,但沒法說哪個(gè)是最好的。 showImg(https://segmentfault.com/img/remote/1460000019029121); 作者:Aaron Frederick 喜歡用...

    testbird 評(píng)論0 收藏0

發(fā)表評(píng)論

0條評(píng)論

閱讀需要支付1元查看
<