摘要:一關(guān)于是基于構(gòu)建,經(jīng)許可的開(kāi)源庫(kù),為開(kāi)發(fā)者提供高性能,易用的數(shù)據(jù)結(jié)構(gòu)和數(shù)據(jù)分析工具。官網(wǎng)二數(shù)據(jù)結(jié)構(gòu)一維標(biāo)記的數(shù)組,能夠保存任何數(shù)據(jù)類型整數(shù),字符串,浮點(diǎn)數(shù),對(duì)象等。軸標(biāo)簽統(tǒng)稱為索引。二維的表格型數(shù)據(jù)結(jié)構(gòu)。
一、關(guān)于pandas
pandas是基于NumPy構(gòu)建,經(jīng)BSD許可的開(kāi)源庫(kù),為Python開(kāi)發(fā)者提供高性能,易用的數(shù)據(jù)結(jié)構(gòu)和數(shù)據(jù)分析工具。pandas官網(wǎng)
二、數(shù)據(jù)結(jié)構(gòu)1、Series:一維標(biāo)記的數(shù)組,能夠保存任何數(shù)據(jù)類型(整數(shù),字符串,浮點(diǎn)數(shù),Python對(duì)象等)。軸標(biāo)簽統(tǒng)稱為索引。
import pandas as pd import numpy as np # 傳入數(shù)據(jù)可以是 ndarray或列表, # 此時(shí)傳入index時(shí),需要滿足len(index)=len(data) # data = np.random.randn(4) # data = ["a",2,3.1,True] # 傳入數(shù)據(jù)可以是 標(biāo)量值 # data = 6 # 傳入數(shù)據(jù)可以是 字典 data = {"b":1,"a":6,"c":15} # 如果沒(méi)有傳遞index或index=None,將自動(dòng)創(chuàng)建index=[0, ..., len(data) - 1]。 index = ["a", "b", "c", "d", "e"] # 創(chuàng)建 Series s = pd.Series(data,index=index,name="my_series") print(s) # a 6.0 # b 1.0 # c 15.0 # d NaN --> pandas缺失數(shù)據(jù)標(biāo)記 # e NaN # Name: my_series, dtype: float64
# Series切片操作 print(s[0]) # 6.0 print(s[:2]) # a 6.0 # b 1.0 # Name: my_series, dtype: float64 print(s[[1,4]]) # b 1.0 # e NaN # Name: my_series, dtype: float64 # Series類似字典操作 print(s["d"]) # nan s["d"] = 2 # 設(shè)置指定index的值 print(s["d"]) # 2.0 print("e" in s) # True,判斷是否含有指定index # print(s["f"]) # KeyError: "f" print(s.get("f", np.nan)) # 類似字典get取值 print(s.name) # my_series 獲取name print(s.index) # Index(["a", "b", "c", "d", "e"], dtype="object")
2、Time- Series:以時(shí)間為索引的Series。
3、DataFrame:二維的表格型數(shù)據(jù)結(jié)構(gòu)。很多功能與R中的data.frame類似??梢詫ataFrame理解為Series的容器。
4、Panel :三維的數(shù)組,可以理解為DataFrame的容器。
文章版權(quán)歸作者所有,未經(jīng)允許請(qǐng)勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請(qǐng)注明本文地址:http://m.hztianpu.com/yun/42718.html
摘要:寫(xiě)在前面在此總結(jié)一些在數(shù)據(jù)分析挖掘中可能用到的功能,方便大家索引或者從一種語(yǔ)言遷移到另一種。概率圖模型文本基本操作類別英中中文分詞未知主題模型類別未知未知未知值得留意的是的新第三方模塊,與其他分析可視化挖掘報(bào)表工具的交互類別實(shí)際是的服務(wù)包 寫(xiě)在前面 在此總結(jié)一些在數(shù)據(jù)分析/挖掘中可能用到的功能,方便大家索引或者從一種語(yǔ)言遷移到另一種。當(dāng)然,這篇博客還會(huì)隨時(shí)更新(不會(huì)另起一篇,為了方便大...
摘要:本次分享將介紹如何在中使用庫(kù)實(shí)現(xiàn)數(shù)據(jù)庫(kù)的讀寫(xiě)。提供了工具包及對(duì)象關(guān)系映射工具,使用許可證發(fā)行。模塊實(shí)現(xiàn)了與不同數(shù)據(jù)庫(kù)的連接,而模塊則使得能夠操作數(shù)據(jù)庫(kù)。 ??本次分享將介紹如何在Python中使用Pandas庫(kù)實(shí)現(xiàn)MySQL數(shù)據(jù)庫(kù)的讀寫(xiě)。首先我們需要了解點(diǎn)ORM方面的知識(shí)。 ORM技術(shù) ??對(duì)象關(guān)系映射技術(shù),即ORM(Object-Relational Mapping)技術(shù),指的是把關(guān)...
摘要:下面,作者介紹了八種在中實(shí)現(xiàn)的可視化工具包,其中有些包還能用在其它語(yǔ)言中。當(dāng)提到這些可視化工具時(shí),我想到三個(gè)詞探索數(shù)據(jù)分析。還可以選擇樣式,它模擬了像和等很流行的美化工具。有很多數(shù)據(jù)可視化的包,但沒(méi)法說(shuō)哪個(gè)是最好的。 showImg(https://segmentfault.com/img/remote/1460000019029121); 作者:Aaron Frederick 喜歡用...
閱讀 1585·2025-02-07 13:29
閱讀 1010·2024-11-07 18:25
閱讀 131506·2024-02-01 10:43
閱讀 1381·2024-01-31 14:58
閱讀 1150·2024-01-31 14:54
閱讀 83577·2024-01-29 17:11
閱讀 3880·2024-01-25 14:55
閱讀 2396·2023-06-02 13:36