小編寫這篇文章的一個主要目的,主要是給大家去做一個解答,繼續(xù)給大家解答關(guān)于Python pandas的相關(guān)內(nèi)容,比如使用Python pandas去替換指定的一些數(shù)據(jù),那么,具體的方法是什么呢?下面就給大家解答下。
一、構(gòu)造dataframe
import pandas as pd import numpy as np df=pd.DataFrame(np.arange(16).reshape(4,4),columns=["sh","bj","sz","gz"],index=["one","two","three","four"]) df.iloc[0,1]=np.nan
二、替換指定數(shù)據(jù)(fillna、isin、replace)
1、用"sz"列的同行數(shù)據(jù)將"bj"列的空值替換掉
df["bj"].fillna(df["sz"],inplace=True)
2、在1的基礎(chǔ)上,將"sz"列為2或者6的數(shù)據(jù)替換成-4
法一:直接替換
df.loc[df["sz"].isin([2,6]),"sz"]=-4
法二:函數(shù)replace()替換
df.replace({"sz":{2:-4,6:-4}},inplace=True)
三、替換函數(shù)replace()詳解
原dataframe如下:
1、全局替換元素
1)替換單個元素
df.replace(-4,0)#將所有的-4元素替換為0,返回dataframe
2)替換多個元素
法一:在字典中指定
df.replace({-4:0,4:1})#將-4替換為0,4替換為1
法二:在列表中指定
df.replace([-4,4],[0,1])#將-4替換為0,4替換為1
其中法二在列表中指定的方式,如果多個元素替換為相同的值,會更方便。
df.replace([-4,4],1)#將-4和4替換為1
2、通過指定條件替換元素
df.replace({"bj":{5:10,9:50},"gz":{7:10}})#將"bj"列的5替換為10,9替換為50,將gz列的7替換為10
也可通過直接索引列的方式來替換指定列的元素
df["bj"].replace({5:10,9:50})#將"bj"列的5替換為10,9替換為50
3、通過模糊條件替換指定元素
法一:通過字符串方法替換str.replace()
df["bj"]=df["bj"].str.replace("北","南").fillna(df["bj"])#將"bj"列中的"北"字替換成"南"字,若無"北"值,則不替換
法二:通過正則匹配替換
df.replace("(.*)北(.*)","南京",regex=True)#將"bj"列中的含有"北"字的元素替換成"南京"
最后,如果需要在原始數(shù)據(jù)上完成替換,可以通過設(shè)置參數(shù)inplace=True。
綜上所述,這篇文章就給大家介紹到這里了,希望可以給大家?guī)韼椭?/p>
文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請注明本文地址:http://m.specialneedsforspecialkids.com/yun/128356.html
摘要:數(shù)據(jù)規(guī)整化清理轉(zhuǎn)換合并重塑數(shù)據(jù)聚合與分組運算數(shù)據(jù)規(guī)整化清理轉(zhuǎn)換合并重塑合并數(shù)據(jù)集可根據(jù)一個或多個鍵將不同中的行鏈接起來。函數(shù)根據(jù)樣本分位數(shù)對數(shù)據(jù)進行面元劃分。字典或,給出待分組軸上的值與分組名之間的對應(yīng)關(guān)系。 本篇內(nèi)容為整理《利用Python進行數(shù)據(jù)分析》,博主使用代碼為 Python3,部分內(nèi)容和書本有出入。 在前幾篇中我們介紹了 NumPy、pandas、matplotlib 三個...
摘要:中面向行和面向列的操作基本是平衡的。用層次化索引,將其表示為更高維度的數(shù)據(jù)。使用浮點值表示浮點和非浮點數(shù)組中的缺失數(shù)據(jù)。索引的的格式化輸出形式選取數(shù)據(jù)子集在內(nèi)層中進行選取層次化索引在數(shù)據(jù)重塑和基于分組的操作中很重要。 我們在上一篇介紹了 NumPy,本篇介紹 pandas。 pandas入門 Pandas 是基于Numpy構(gòu)建的,讓以NumPy為中心的應(yīng)用變的更加簡單。 pandas...
摘要:的名稱來自于面板數(shù)據(jù)和數(shù)據(jù)分析。以下的內(nèi)容主要以為主。終端輸入導(dǎo)入相關(guān)模塊是一種類似于一維數(shù)組的對象,它由一組數(shù)據(jù)各種數(shù)據(jù)類型以及一組與之相關(guān)的數(shù)據(jù)標(biāo)簽即索引組成。如果僅傳入一個序列,則會重新索引行函數(shù)的參數(shù)參數(shù)說明用作索引的新序列。 原文鏈接 numPy pandas的數(shù)據(jù)結(jié)構(gòu)介紹 簡介 Pandas [1] 是python的一個數(shù)據(jù)分析包,最初由AQR Capital Mana...
Pandas是一個python數(shù)據(jù)分析庫,它提供了許多函數(shù)和方法來加快數(shù)據(jù)分析過程,下面這篇文章主要給大家介紹了關(guān)于python基礎(chǔ)篇之pandas常用基本函數(shù)的相關(guān)資料,需要的朋友可以參考下 前言 這篇主要整理pandas常用的基本函數(shù),主要分為五部分: 匯總函數(shù) 特征統(tǒng)計函數(shù) 唯一值函數(shù) 替換函數(shù) 排序函數(shù) 1、匯總函數(shù) 常用的主要是4個: tail():返回表或序列的后...
閱讀 918·2023-01-14 11:38
閱讀 890·2023-01-14 11:04
閱讀 749·2023-01-14 10:48
閱讀 2030·2023-01-14 10:34
閱讀 955·2023-01-14 10:24
閱讀 831·2023-01-14 10:18
閱讀 505·2023-01-14 10:09
閱讀 582·2023-01-14 10:02