摘要:官方文檔連接像其他函數一樣,官方文檔中的參數有很多,具體如下寫在前面,如果要對透視表中的字段進行計數,有時候用會報錯,可以用實例運用簡單版透視表上面以部門為索引,下面有二級索引,部門小組。
本節學習數據透視表
引用激勵數據,連接數據庫jili表,jili這幾個太難打了,下文用df代表激勵數據(代碼省略)
之前在excel中用爛了的透視表,終于用python來實現了,其實主要是講pivot_table里面的參數怎么使用,但書中講的不是詳細,還是要自己找一些文檔或者視頻輔助學習。
pivot_table 官方文檔連接
像其他函數一樣,官方文檔中的參數有很多,具體如下:
df.pivot_table(data, values=None, index=None, columns=None, aggfunc="mean", fill_value=None, margins=False, dropna=True, margins_name="All")
寫在前面,如果要對透視表中的字段進行計數,有時候用count會報錯,可以用len
實例運用:
1、簡單版透視表df.pivot_table(index="dep",aggfunc="sum") #上面以部門為索引,下面有二級索引,部門、小組。 不知道是不是叫二級索引,暫且這么命名吧 df.pivot_table(index=["dep","group"],aggfunc="sum")2、升級版透視表:金額分組
對金額進行分組,然后再來透視表(看了就懂了):
#金額分組 amount = pd.cut(df["allbones"],[0,1000,5000,10000,20000,40000]) df.pivot_table(index=["dep",amount],values= "allbones", aggfunc="count")
因為指定了值values = "allbones",所以結果中只包含allbones的計算結果,如果不指定values,則會像上面一樣計算滿足條件的所有字段的count值。
進行多個值的計算,并指定計算方法。 如果有需要,還可以增加計算值。
為了方便查看每個參數的內容,所以換行了。
df.pivot_table(index =[ "dep",amount], values = ["allbones","oldrate"], aggfunc = {"allbones":[np.sum,len,np.mean], #一個字段進行3中運算 "oldrate":np.sum})4、在透視表最后加一個匯總
df.pivot_table(index =[ "dep",amount], values = ["allbones","oldrate"], aggfunc = [np.sum,np.mean,len], margins = True) #margins默認為false,改成True后在表的最后顯示匯總5、大boss版,在每個部門下面進行分類匯總:不會
還沒找到方法
文章版權歸作者所有,未經允許請勿轉載,若此文章存在違規行為,您可以聯系管理員刪除。
轉載請注明本文地址:http://m.specialneedsforspecialkids.com/yun/44999.html
摘要:聚合后沒有用函數,會返回一個用函數后會顯示計算結果組合之后,切片,查看的和。可以設定計算方法對列進行了切片,如果的均值小于,則不顯示二部的均值低于,所以結果中沒有二部數據。 本節學習groupby 引用激勵數據,連接數據庫jili表(代碼省略)數字簡單計算本節內容前面是運用sum/mean等函數對數字簡單計算 jili.mean() #求均值 jili.mean(axis = col...
摘要:時間序列,日期格式處理原以為本章是講怎么用處理時間格式,比如提取年月之類的。新增一列日期,不要時分新增兩列年,月,以便后續分析。這個方法太復雜,而且處理時間可能會更長,看下面的簡單方法新增月份年。 時間序列,日期格式處理 原以為本章是講怎么用python處理時間格式,比如提取年月之類的。 但本節寫的是時間格式已經工整后的事,暫時不是我想學的,所以跳過,就沒有寫公式了。 下面的函數時之前...
摘要:第章合并連接數據集包含三個函數省略,在頁。沒有對默認合并兩個表的所有列,如果有列,有列,則結果為列多對保留多條記錄多對多會交叉每一條記錄通過參數設定連接方式兩個表都有兩個字段,則通過連接兩個表。 第3章 7-8:合并、連接數據集 包含三個函數:numpy:concatenate 省略,在126頁。pandas:concat/ append(略過) /merge 主要是講merge函數...
摘要:主成分分析就是降維,通過線性組合,把多個原始變量合并成若干個主成分,這樣每個主成分都變成原始變量的線性組合。相關系數系數為為為。從結果看,這個數據可能不太適合用來分析,因為降到維后的代筆性不足。 這兩天用學了主成分分析,用的是PCA。主成分分析就是降維,通過線性組合,把多個原始變量合并成若干個主成分,這樣每個主成分都變成原始變量的線性組合。所以你想看具體哪個特征對結果的影響大,通過PC...
摘要:數據規整化清理轉換合并重塑數據聚合與分組運算數據規整化清理轉換合并重塑合并數據集可根據一個或多個鍵將不同中的行鏈接起來。函數根據樣本分位數對數據進行面元劃分。字典或,給出待分組軸上的值與分組名之間的對應關系。 本篇內容為整理《利用Python進行數據分析》,博主使用代碼為 Python3,部分內容和書本有出入。 在前幾篇中我們介紹了 NumPy、pandas、matplotlib 三個...
閱讀 2853·2021-11-22 15:22
閱讀 19264·2021-09-22 15:00
閱讀 1443·2021-09-07 09:58
閱讀 1245·2019-08-30 13:01
閱讀 2439·2019-08-29 16:27
閱讀 2353·2019-08-26 13:25
閱讀 1625·2019-08-26 12:13
閱讀 944·2019-08-26 11:53