小編寫這篇文章的一個主要目的,主要是給大家去做一個解答,繼續(xù)給大家解答關于Python pandas的相關內容,比如使用Python pandas去替換指定的一些數據,那么,具體的方法是什么呢?下面就給大家解答下。
一、構造dataframe
import pandas as pd import numpy as np df=pd.DataFrame(np.arange(16).reshape(4,4),columns=["sh","bj","sz","gz"],index=["one","two","three","four"]) df.iloc[0,1]=np.nan
二、替換指定數據(fillna、isin、replace)
1、用"sz"列的同行數據將"bj"列的空值替換掉
df["bj"].fillna(df["sz"],inplace=True)
2、在1的基礎上,將"sz"列為2或者6的數據替換成-4
法一:直接替換
df.loc[df["sz"].isin([2,6]),"sz"]=-4
法二:函數replace()替換
df.replace({"sz":{2:-4,6:-4}},inplace=True)
三、替換函數replace()詳解
原dataframe如下:
1、全局替換元素
1)替換單個元素
df.replace(-4,0)#將所有的-4元素替換為0,返回dataframe
2)替換多個元素
法一:在字典中指定
df.replace({-4:0,4:1})#將-4替換為0,4替換為1
法二:在列表中指定
df.replace([-4,4],[0,1])#將-4替換為0,4替換為1
其中法二在列表中指定的方式,如果多個元素替換為相同的值,會更方便。
df.replace([-4,4],1)#將-4和4替換為1
2、通過指定條件替換元素
df.replace({"bj":{5:10,9:50},"gz":{7:10}})#將"bj"列的5替換為10,9替換為50,將gz列的7替換為10
也可通過直接索引列的方式來替換指定列的元素
df["bj"].replace({5:10,9:50})#將"bj"列的5替換為10,9替換為50
3、通過模糊條件替換指定元素
法一:通過字符串方法替換str.replace()
df["bj"]=df["bj"].str.replace("北","南").fillna(df["bj"])#將"bj"列中的"北"字替換成"南"字,若無"北"值,則不替換
法二:通過正則匹配替換
df.replace("(.*)北(.*)","南京",regex=True)#將"bj"列中的含有"北"字的元素替換成"南京"
最后,如果需要在原始數據上完成替換,可以通過設置參數inplace=True。
綜上所述,這篇文章就給大家介紹到這里了,希望可以給大家?guī)韼椭?/p>
文章版權歸作者所有,未經允許請勿轉載,若此文章存在違規(guī)行為,您可以聯系管理員刪除。
轉載請注明本文地址:http://m.hztianpu.com/yun/128356.html
摘要:數據規(guī)整化清理轉換合并重塑數據聚合與分組運算數據規(guī)整化清理轉換合并重塑合并數據集可根據一個或多個鍵將不同中的行鏈接起來。函數根據樣本分位數對數據進行面元劃分。字典或,給出待分組軸上的值與分組名之間的對應關系。 本篇內容為整理《利用Python進行數據分析》,博主使用代碼為 Python3,部分內容和書本有出入。 在前幾篇中我們介紹了 NumPy、pandas、matplotlib 三個...
摘要:中面向行和面向列的操作基本是平衡的。用層次化索引,將其表示為更高維度的數據。使用浮點值表示浮點和非浮點數組中的缺失數據。索引的的格式化輸出形式選取數據子集在內層中進行選取層次化索引在數據重塑和基于分組的操作中很重要。 我們在上一篇介紹了 NumPy,本篇介紹 pandas。 pandas入門 Pandas 是基于Numpy構建的,讓以NumPy為中心的應用變的更加簡單。 pandas...
摘要:的名稱來自于面板數據和數據分析。以下的內容主要以為主。終端輸入導入相關模塊是一種類似于一維數組的對象,它由一組數據各種數據類型以及一組與之相關的數據標簽即索引組成。如果僅傳入一個序列,則會重新索引行函數的參數參數說明用作索引的新序列。 原文鏈接 numPy pandas的數據結構介紹 簡介 Pandas [1] 是python的一個數據分析包,最初由AQR Capital Mana...
Pandas是一個python數據分析庫,它提供了許多函數和方法來加快數據分析過程,下面這篇文章主要給大家介紹了關于python基礎篇之pandas常用基本函數的相關資料,需要的朋友可以參考下 前言 這篇主要整理pandas常用的基本函數,主要分為五部分: 匯總函數 特征統(tǒng)計函數 唯一值函數 替換函數 排序函數 1、匯總函數 常用的主要是4個: tail():返回表或序列的后...
閱讀 1069·2023-01-14 11:38
閱讀 1066·2023-01-14 11:04
閱讀 906·2023-01-14 10:48
閱讀 2384·2023-01-14 10:34
閱讀 1152·2023-01-14 10:24
閱讀 1029·2023-01-14 10:18
閱讀 657·2023-01-14 10:09
閱讀 736·2023-01-14 10:02