{eval=Array;=+count(Array);}
這個非常簡單,pandas內(nèi)置了大量函數(shù)和類型,可以快速處理日常各種文件,下面我以txt,excel,csv,json和mysql這5種類型文件為例,簡單介紹一下pandas是如何快速讀取這些文件的:
這是最常見的一種文本文件格式,讀取的話,直接使用read_table函數(shù)就行,測試代碼如下,這里必須保證txt文件是格式化的,不然讀取的結(jié)果會有誤,filename是文件名,header是否包含列標(biāo)題,sep是每行數(shù)據(jù)的分隔符,最終讀取的數(shù)據(jù)類型是DataFrame,方便后面程序進(jìn)行處理:
這也是一種比較常見的文件格式,讀取的話,直接使用read_excel函數(shù)就行,測試代碼如下,非常簡單,直接傳入文件名就行,最終返回結(jié)果也是DataFrame類型:
這也是一種比較常見的文件格式,讀取的話,直接使用read_csv函數(shù)就行,測試代碼如下,也非常簡單,filename為文件名,header為是否包含列標(biāo)題,最終返回結(jié)果也是DataFrame類型:
這也是一種比較常用的數(shù)據(jù)存儲格式,讀取的話,直接使用read_json函數(shù)就行,測試代碼如下,filename為文件名,如果出現(xiàn)中文亂碼的話,設(shè)置encoding編碼為uft-8就行,最終結(jié)果也是DataFrame類型:
這里首先需要安裝sqlalchemy框架,之后才能借助read_sql_query函數(shù)直接從mysql數(shù)據(jù)庫讀取數(shù)據(jù),安裝的話,直接輸入命令“pip install sqlalchemy”就行,測試代碼如下,也非常簡單,先創(chuàng)建一個connect連接,然后根據(jù)sql查詢語句,直接從數(shù)據(jù)庫中讀取數(shù)據(jù)就行:
至此,我們就完成了利用python的pandas模塊來讀取txt,excel,csv,json和mysql這5種類型文件的數(shù)據(jù)。總的來說,pandas這個模塊功能非常強(qiáng)大,尤其對于數(shù)據(jù)處理來說,可以說是一個利器,在數(shù)據(jù)分析與處理中經(jīng)常會用到,只要你熟悉一下相關(guān)文檔和示例,很快就能掌握的,網(wǎng)上也有相關(guān)資料和教程,介紹的非常詳細(xì),感興趣的話,可以搜一下,希望以上分享的內(nèi)容能對你有所幫助吧,也歡迎大家評論、留言進(jìn)行補(bǔ)充。
0
回答0
回答0
回答0
回答0
回答0
回答0
回答0
回答0
回答10
回答