Python Pandas作為常見的應(yīng)用Python的一門工具,常常是作為聚合函數(shù)去進(jìn)行使用的,那么,我們應(yīng)該怎么去使用這類聚合函數(shù)呢?下面就具體的一類應(yīng)用實例,下面給大家詳細(xì)解答一下,大家要仔細(xì)的閱讀哦。
Python Pandas聚合函數(shù)
在前一節(jié),我們重點介紹了窗口函數(shù)。我們知道,窗口函數(shù)可以與聚合函數(shù)一起使用,聚合函數(shù)指的是對一組數(shù)據(jù)求總和、最大值、最小值以及平均值的操作,本節(jié)重點講解聚合函數(shù)的應(yīng)用。
應(yīng)用聚合函數(shù)
首先讓我們創(chuàng)建一個DataFrame對象,然后對聚合函數(shù)進(jìn)行應(yīng)用。
import pandas as pd import numpy as np df=pd.DataFrame(np.random.randn(5,4),index=pd.date_range('12/14/2020',periods=5),columns=['A','B','C','D']) print(df) #窗口大小為3,min_periods最小觀測值為1 r=df.rolling(window=3,min_periods=1) print(r)
輸出結(jié)果:
A B C D
2020-12-14 0.941621 1.205489 0.473771-0.348169
2020-12-15-0.276954 0.076387 0.104194 1.537357
2020-12-16 0.582515 0.481999-0.652332-1.893678
2020-12-17-0.286432 0.923514 0.285255-0.739378
2020-12-18 2.063422-0.465873-0.946809 1.590234
Rolling[window=3,min_periods=1,center=False,axis=0]
1)對整體聚合
您可以把一個聚合函數(shù)傳遞給DataFrame,示例如下:
import pandas as pd import numpy as np df=pd.DataFrame(np.random.randn(5,4),index=pd.date_range('12/14/2020',periods=5),columns=['A','B','C','D']) print(df) #窗口大小為3,min_periods最小觀測值為1 r=df.rolling(window=3,min_periods=1) #使用aggregate()聚合操作 print(r.aggregate(np.sum))
輸出結(jié)果:
A B C D
2020-12-14 0.133713 0.746781 0.499385 0.589799
2020-12-15-0.777572 0.531269 0.600577-0.393623
2020-12-16 0.408115-0.874079 0.584320 0.507580
2020-12-17-1.033055-1.185399-0.546567 2.094643
2020-12-18 0.469394-1.110549-0.856245 0.260827
A B C D
2020-12-14 0.133713 0.746781 0.499385 0.589799
2020-12-15-0.643859 1.278050 1.099962 0.196176
2020-12-16-0.235744 0.403971 1.684281 0.703756
2020-12-17-1.402513-1.528209 0.638330 2.208601
2020-12-18-0.155546-3.170027-0.818492 2.863051
2)對任意某一列聚合
import pandas as pd import numpy as np df=pd.DataFrame(np.random.randn(5,4),index=pd.date_range('12/14/2020',periods=5),columns=['A','B','C','D']) #窗口大小為3,min_periods最小觀測值為1 r=df.rolling(window=3,min_periods=1) #對A列聚合 print(r['A'].aggregate(np.sum))
輸出結(jié)果:
2020-12-14 1.051501
2020-12-15 1.354574
2020-12-16 0.896335
2020-12-17 0.508470
2020-12-18 2.333732
Freq:D,Name:A,dtype:float64
3)對多列數(shù)據(jù)聚合
import pandas as pd import numpy as np df=pd.DataFrame(np.random.randn(5,4),index=pd.date_range('12/14/2020',periods=5),columns=['A','B','C','D']) #窗口大小為3,min_periods最小觀測值為1 r=df.rolling(window=3,min_periods=1) #對A/B兩列聚合 print(r['A','B'].aggregate(np.sum))
輸出結(jié)果:
A B
2020-12-14 0.639867-0.229990
2020-12-15 0.352028 0.257918
2020-12-16 0.637845 2.643628
2020-12-17 0.432715 2.428604
2020-12-18-1.575766 0.969600
4)對單列應(yīng)用多個函數(shù)
import pandas as pd import numpy as np df=pd.DataFrame(np.random.randn(5,4),index=pd.date_range('12/14/2020',periods=5),columns=['A','B','C','D']) #窗口大小為3,min_periods最小觀測值為1 r=df.rolling(window=3,min_periods=1) #對A/B兩列聚合 print(r['A','B'].aggregate([np.sum,np.mean]))
輸出結(jié)果:
sum mean
2020-12-14-0.469643-0.469643
2020-12-15-0.626856-0.313428
2020-12-16-1.820226-0.606742
2020-12-17-2.007323-0.669108
2020-12-18-0.595736-0.198579
5)對不同列應(yīng)用多個函數(shù)
import pandas as pd import numpy as np df=pd.DataFrame(np.random.randn(5,4), index=pd.date_range('12/11/2020',periods=5), columns=['A','B','C','D']) r=df.rolling(window=3,min_periods=1) print(r['A','B'].aggregate([np.sum,np.mean]))
輸出結(jié)果:
A B
sum mean sum mean
2020-12-14-1.428882-1.428882-0.417241-0.417241
2020-12-15-1.315151-0.657576-1.580616-0.790308
2020-12-16-2.093907-0.697969-2.260181-0.753394
2020-12-17-1.324490-0.441497-1.578467-0.526156
2020-12-18-2.400948-0.800316-0.452740-0.150913
6)對不同列應(yīng)用不同函數(shù)
import pandas as pd import numpy as np df=pd.DataFrame(np.random.randn(3,4), index=pd.date_range('12/14/2020',periods=3), columns=['A','B','C','D']) r=df.rolling(window=3,min_periods=1) print(r.aggregate({'A':np.sum,'B':np.mean}))
輸出結(jié)果:
A B
2020-12-14 0.503535-1.301423
2020-12-15 0.170056-0.550289
2020-12-16-0.086081-0.140532
綜上所述,這篇文章就給大家介紹到這里了,希望可以給大家?guī)韼椭?/p>
文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請注明本文地址:http://m.specialneedsforspecialkids.com/yun/128342.html
摘要:數(shù)據(jù)規(guī)整化清理轉(zhuǎn)換合并重塑數(shù)據(jù)聚合與分組運算數(shù)據(jù)規(guī)整化清理轉(zhuǎn)換合并重塑合并數(shù)據(jù)集可根據(jù)一個或多個鍵將不同中的行鏈接起來。函數(shù)根據(jù)樣本分位數(shù)對數(shù)據(jù)進(jìn)行面元劃分。字典或,給出待分組軸上的值與分組名之間的對應(yīng)關(guān)系。 本篇內(nèi)容為整理《利用Python進(jìn)行數(shù)據(jù)分析》,博主使用代碼為 Python3,部分內(nèi)容和書本有出入。 在前幾篇中我們介紹了 NumPy、pandas、matplotlib 三個...
pandas其實匯集了python函數(shù)的一個數(shù)據(jù)庫,主要是用來調(diào)用數(shù)據(jù)的,作為其中的聚合函數(shù),那么,其中的函數(shù)agg的具體用法是怎么樣的呢?下面就給大家詳細(xì)的解答下。 今天看到pandas的聚合函數(shù)agg,比較陌生,平時的工作中處理數(shù)據(jù)的時候使用的也比較少,為了加深印象,總結(jié)一下使用的方法,其實還是挺好用的。 DataFrame.agg(func,axis=0,*args,**kwargs...
摘要:全棧數(shù)據(jù)之門前言自強不息,厚德載物,自由之光,你是我的眼基礎(chǔ),從零開始之門文件操作權(quán)限管理軟件安裝實戰(zhàn)經(jīng)驗與,文本處理文本工具的使用家族的使用綜合案例數(shù)據(jù)工程,必備分析文件探索內(nèi)容探索交差并補其他常用的命令批量操作結(jié)語快捷鍵,之門提高效率光 showImg(https://segmentfault.com/img/bVK0aK?w=350&h=350); 全棧數(shù)據(jù)之門 前言 自強不息,...
閱讀 919·2023-01-14 11:38
閱讀 891·2023-01-14 11:04
閱讀 750·2023-01-14 10:48
閱讀 2039·2023-01-14 10:34
閱讀 956·2023-01-14 10:24
閱讀 835·2023-01-14 10:18
閱讀 506·2023-01-14 10:09
閱讀 583·2023-01-14 10:02