PythonpandasDataFrame基礎(chǔ)運算及空值填充詳解

89542767 發(fā)布于2022-09-27 17:04 / 1184人閱讀

　　小編寫這篇文章的主要目的，是給大家介紹一下關(guān)于python中的一些實例，比如，其中，會給大家講到，Python中基礎(chǔ)值的一些運算，以及當我們遇到空的數(shù)值的時候，一些處理方法，下面給大家做一個詳細的解答。

　　前言

　　今天我們一起來聊聊DataFrame中的索引。

　　上一篇文章當中我們介紹了DataFrame數(shù)據(jù)結(jié)構(gòu)當中一些常用的索引的使用方法，比如iloc、loc以及邏輯索引等等。今天的文章我們來看看DataFrame的一些基本運算。

　　數(shù)據(jù)對齊

　　我們可以計算兩個DataFrame的加和，pandas會自動將這兩個DataFrame進行數(shù)據(jù)對齊，如果對不上的數(shù)據(jù)會被置為Nan（notanumber）。

　　首先我們來創(chuàng)建兩個DataFrame：

　importnumpyasnp
　　importpandasaspd
　　df1=pd.DataFrame(np.arange(9).reshape((3,3)),columns=list('abc'),index=['1','2','3'])
　　df2=pd.DataFrame(np.arange(12).reshape((4,3)),columns=list('abd'),index=['2','3','4','5'])

　　得到的結(jié)果和我們設(shè)想的一致，其實只是通過numpy數(shù)組創(chuàng)建DataFrame，然后指定index和columns而已，這應(yīng)該算是很基礎(chǔ)的用法了。

　　然后我們將兩個DataFrame相加，會得到：

　　我們發(fā)現(xiàn)pandas將兩個DataFrame加起來合并了之后，凡是沒有在兩個DataFrame都出現(xiàn)的位置就會被置為Nan。這其實是很有道理的，實際上不只是加法，我們可以計算兩個DataFrame的加減乘除的四則運算都是可以的。如果是計算兩個DataFrame相除的話，那么除了對應(yīng)不上的數(shù)據(jù)會被置為Nan之外，除零這個行為也會導致異常值的發(fā)生（可能不一定是Nan，而是inf）。

　　fill_value

　　如果我們要對兩個DataFrame進行運算，那么我們當然不會希望出現(xiàn)空值。這個時候就需要對空值進行填充了，我們直接使用運算符進行運算是沒辦法傳遞參數(shù)進行填充的，這個時候我們需要使用DataFrame當中為我們提供的算術(shù)方法。

　　DataFrame當中常用的運算符有這么幾種：

　　add、sub、div這些我們都很好理解，那么這里的radd、rsub方法又是什么意思呢，為什么前面要加上一個r呢？

　　看起來費解，但是說白了一文不值，radd是用來翻轉(zhuǎn)參數(shù)的。舉個例子，比如說我們希望得到DataFrame當中所有元素的倒數(shù)，我們可以寫成1/df。由于1本身并不是一個DataFrame，所以我們不能用1來呼叫DataFrame當中的方法，也就不能傳遞參數(shù)，為了解決這種情況，我們可以把1/df寫成df.rdiv(1)，這樣我們就可以在其中傳遞參數(shù)了。

　　由于在算除法的過程當中發(fā)生了除零，所以我們得到了一個inf，它表示無窮大。

　　我們可以在add、div這些方法當中傳入一個fill_value的參數(shù)，這個參數(shù)可以在計算之前對于一邊出現(xiàn)缺失值的情況進行填充。也就是說對于對于只在一個DataFrame中缺失的位置會被替換成我們指定的值，如果在兩個DataFrame都缺失，那么依然還會是Nan。

　　我們對比下結(jié)果就能發(fā)現(xiàn)了，相加之后的(1,d),(4,c)以及(5,c)的位置都是Nan，因為df1和df2兩個DataFrame當中這些位置都是空值，所以沒有被填充。

　　fill_value這個參數(shù)在很多api當中都有出現(xiàn)，比如reindex等，用法都是一樣的，我們在查閱api文檔的時候可以注意一下。

　　那么對于這種填充了之后還出現(xiàn)的空值我們應(yīng)該怎么辦呢？難道只能手動找到這些位置進行填充嗎？當然是不現(xiàn)實的，pandas當中還為我們提供了專門解決空值的api。

　　空值api

　　在填充空值之前，我們首先要做的是發(fā)現(xiàn)空值。針對這個問題，我們有isna這個api，它會返回一個bool型的DataFrame，DataFrame當中的每一個位置表示了原DataFrame對應(yīng)的位置是否是空值。

　　dropna

　　當然只是發(fā)現(xiàn)是否是空值肯定是不夠的，我們有時候會希望不要空值的出現(xiàn)，這個時候我們可以選擇drop掉空值。針對這種情況，我們可以使用DataFrame當中的dropna方法。

　　我們發(fā)現(xiàn)使用了dropna之后，出現(xiàn)了空值的行都被拋棄了。只保留了沒有空值的行，有時候我們希望拋棄是的列而不是行，這個時候我們可以通過傳入axis參數(shù)進行控制。

　　這樣我們得到的就是不含空值的列，除了可以控制行列之外，我們還可以控制執(zhí)行drop的嚴格程度。我們可以通過how這個參數(shù)來判斷，how支持兩種值傳入，一種是'all'，一種是'any'。all表示只有在某一行或者是某一列全為空值的時候才會拋棄，any與之對應(yīng)就是只要出現(xiàn)了空值就會拋棄。默認不填的話認為是any，一般情況下我們也用不到這個參數(shù)，大概有個印象就可以了。

　　fillna

　　pandas除了可以drop含有空值的數(shù)據(jù)之外，當然也可以用來填充空值，事實上這也是最常用的方法。

　　我們可以很簡單地傳入一個具體的值用來填充：

　　fillna會返回一個新的DataFrame，其中所有的Nan值會被替換成我們指定的值。如果我們不希望它返回一個新的DataFrame，而是直接在原數(shù)據(jù)進行修改的話，我們可以使用inplace參數(shù)，表明這是一個inplace的操作，那么pandas將會在原DataFrame上進行修改。

df3.fillna(3,inplace=True)

　　除了填充具體的值以外，我們也可以和一些計算結(jié)合起來算出來應(yīng)該填充的值。比如說我們可以計算出某一列的均值、最大值、最小值等各種計算來填充。fillna這個函數(shù)不僅可以使用在DataFrame上，也可以使用在Series上，所以我們可以針對DataFrame中的某一列或者是某些列進行填充：

　　除了可以計算出均值、最大最小值等各種值來進行填充之外，還可以指定使用缺失值的前一行或者是后一行的值來填充。實現(xiàn)這個功能需要用到method這個參數(shù)，它有兩個接收值，ffill表示用前一行的值來進行填充，bfill表示使用后一行的值填充。

　　我們可以看到，當我們使用ffill填充的時候，對于第一行的數(shù)據(jù)來說由于它沒有前一行了，所以它的Nan會被保留。同樣當我們使用bfill的時候，最后一行也無法填充。

　　總結(jié)

　　今天的文章當中我們主要介紹了DataFrame的一些基本運算，比如最基礎(chǔ)的四則運算。在進行四則運算的時候由于DataFrame之間可能存在行列索引不能對齊的情況，這樣計算得到的結(jié)果會出現(xiàn)空值，所以我們需要對空值進行處理。我們可以在進行計算的時候通過傳入fill_value進行填充，也可以在計算之后對結(jié)果進行fillna填充。

　　在實際的運用當中，我們一般很少會直接對兩個DataFrame進行加減運算，但是DataFrame中出現(xiàn)空置是家常便飯的事情。因此對于空值的填充和處理非常重要，可以說是學習中的重點，大家千萬注意。

云服務(wù)器 GPU云服務(wù)器位運算詳解三元運算符詳解空值的空值或

文章版權(quán)歸作者所有，未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為，您可以聯(lián)系管理員刪除。

轉(zhuǎn)載請注明本文地址：http://m.hztianpu.com/yun/127849.html

發(fā)表評論

登陸后可評論

0條評論

89542767

男|高級講師

我要關(guān)注我要私信

TA的文章

pythontime控制模塊時間格式與結(jié)構(gòu)型時長詳細說明

閱讀 1068·2023-01-14 11:38
OpenMV與JSON編碼問題分析

閱讀 1064·2023-01-14 11:04
python中的特性管理模式詳細說明

閱讀 906·2023-01-14 10:48
Python運用fastapi完成上傳圖片

閱讀 2383·2023-01-14 10:34
pythonopencv圖象高通濾波和低通濾波器的范例編碼

閱讀 1151·2023-01-14 10:24
Python根據(jù)ssh遠程桌面連接Mysql數(shù)據(jù)庫操作

閱讀 1029·2023-01-14 10:18
本文輕輕松松掌握Python中類的繼承

閱讀 657·2023-01-14 10:09
python中wordcloud組裝方式總結(jié)

閱讀 736·2023-01-14 10:02

成人无码视频,亚洲精品久久久久av无码,午夜精品久久久久久毛片,亚洲中文字幕日韩无码

資訊專欄INFORMATION COLUMN

上云采購季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺、長期優(yōu)惠，快來選購！

PythonpandasDataFrame基礎(chǔ)運算及空值填充詳解

相關(guān)文章

**C語言基礎(chǔ)之操作符詳解**

ECMAScript6(6)：數(shù)組的擴展

發(fā)表評論

0條評論

89542767

男|高級講師

TA的文章

pythontime控制模塊時間格式與結(jié)構(gòu)型時長詳細說明

OpenMV與JSON編碼問題分析

python中的特性管理模式詳細說明

Python運用fastapi完成上傳圖片

pythonopencv圖象高通濾波和低通濾波器的范例編碼

Python根據(jù)ssh遠程桌面連接Mysql數(shù)據(jù)庫操作

本文輕輕松松掌握Python中類的繼承

python中wordcloud組裝方式總結(jié)

最新活動

資訊專欄INFORMATION COLUMN

上云采購季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺、長期優(yōu)惠，快來選購！

PythonpandasDataFrame基礎(chǔ)運算及空值填充詳解

相關(guān)文章

發(fā)表評論

0條評論

男|高級講師

TA的文章

最新活動

上云采購季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺、長期優(yōu)惠，快來選購！