摘要:時(shí)間序列,日期格式處理原以為本章是講怎么用處理時(shí)間格式,比如提取年月之類的。新增一列日期,不要時(shí)分新增兩列年,月,以便后續(xù)分析。這個(gè)方法太復(fù)雜,而且處理時(shí)間可能會(huì)更長,看下面的簡(jiǎn)單方法新增月份年。
時(shí)間序列,日期格式處理
原以為本章是講怎么用python處理時(shí)間格式,比如提取年月之類的。
但本節(jié)寫的是時(shí)間格式已經(jīng)工整后的事,暫時(shí)不是我想學(xué)的,所以跳過,就沒有寫公式了。
下面的函數(shù)時(shí)之前谷歌之后學(xué)到的,先放上來,書里面的在分割線后面:
--1、把列表中 str 轉(zhuǎn)為datetime格式:pd.to_datetime這次使用的是trd的數(shù)據(jù),對(duì)用戶名,產(chǎn)品,姓名做了處理。
要改變df中times的格式
cycle 3576 non-null object
amount 3576 non-null float64
times 3576 non-null object
#修改時(shí)間格式 # datetime.strptime(df.times, %Y%m%d) 這行代碼是先測(cè)試是否修改成功 df["times"] = pd.to_datetime(df["times"], format="%Y/%m/%d")
更改后
cycle 3576 non-null object
amount 3576 non-null float64
times 3576 non-null datetime64[ns]
*講了asfreq() 和 resample() 的使用方法,但是沒有g(shù)et到意思,略過。
--2、只取日期,不要時(shí)分新增一列date,保留年月日,不要小時(shí)和分。
#新增一列日期,不要時(shí)分 df["date"] = pd.to_datetime(df["times"]).dt.normalize() df
新增兩列:年,月,以便后續(xù)分析。
(-- 這個(gè)方法太復(fù)雜,而且處理時(shí)間可能會(huì)更長,看下面的簡(jiǎn)單方法?。。。?/p>
#新增月份、年。在月份補(bǔ)齊為兩位數(shù),要先把原來的month改為字符串,再補(bǔ)齊原month,最后循環(huán) df["year"] = [i.year for i in df["date"]] df["month"] = [str(i.month).zfill(2) for i in df["date"]] df
數(shù)據(jù)處理完成之后,就可以用年月創(chuàng)建透視表了。
畫了一個(gè)17年每天交易量的圖,順便引出下一章的內(nèi)容,畫圖。
df.groupby(["date"])["amount"].count().plot()
把圖刪了,下一章全是講的圖,而且要突出下面的內(nèi)容。
3、讀取日期中的年、月、日、小時(shí)、分、等等等等啊啊啊啊啊啊?。。。。?!這個(gè)真的找了好久的方法怎么讀取dataframe中的小時(shí)和分,搜索之后全是讀取現(xiàn)在的,妹的,你要現(xiàn)在的有鬼用啊,你的數(shù)據(jù)里面不是已經(jīng)有具體的時(shí)間了嗎,分析現(xiàn)在的時(shí)分干嘛?找了2個(gè)小時(shí),翻來覆去都是這些沒用的,越找越暴躁,最后還是在stackoverflow上找到了,感恩
文章版權(quán)歸作者所有,未經(jīng)允許請(qǐng)勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請(qǐng)注明本文地址:http://m.specialneedsforspecialkids.com/yun/44990.html
摘要:貢獻(xiàn)者飛龍版本最近總是有人問我,把這些資料看完一遍要用多長時(shí)間,如果你一本書一本書看的話,的確要用很長時(shí)間。為了方便大家,我就把每本書的章節(jié)拆開,再按照知識(shí)點(diǎn)合并,手動(dòng)整理了這個(gè)知識(shí)樹。 Special Sponsors showImg(https://segmentfault.com/img/remote/1460000018907426?w=1760&h=200); 貢獻(xiàn)者:飛龍版...
摘要:一周沒寫文了,之前干什么去了呢本周前半部分卡在畫圖了,然后的時(shí)間在處理數(shù)據(jù),處理數(shù)據(jù)是我目前在畫圖和機(jī)器學(xué)習(xí)上一個(gè)重大的障礙,處理各種報(bào)錯(cuò)各種不適合,等我學(xué)會(huì)了和你再來堵我呀 一周沒寫文了,之前干什么去了呢?本周前半部分卡在畫圖了,然后1/3的時(shí)間在處理數(shù)據(jù),處理數(shù)據(jù)是我目前在畫圖和機(jī)器學(xué)習(xí)上一個(gè)重大的障礙,python處理各種報(bào)錯(cuò)各種不適合,等我學(xué)會(huì)了kettle和spark你再來堵...
摘要:保存打開執(zhí)行打開的時(shí)候要先加載一個(gè)包第二節(jié)畫個(gè)圖的方法風(fēng)格面向?qū)ο螽媹D第節(jié)簡(jiǎn)易線型圖先設(shè)置。是一個(gè)可以裝圖形文字的容器是帶有刻度和標(biāo)簽的矩形。 第 4 章是講用matplotlib畫圖 期待已久的內(nèi)容,用可視化展示數(shù)據(jù)比丟一張數(shù)據(jù)表給他好的多,在建模的時(shí)候先畫個(gè)圖會(huì)清晰不少,下面進(jìn)入正題: 數(shù)據(jù)源:當(dāng)然是上一章最后一節(jié)的提取了小時(shí)的sougou數(shù)據(jù) 第一節(jié):保存就是教你怎么保存畫的圖,...
摘要:比如中國,從西到東橫跨東五東六東七東八和東九五個(gè)時(shí)區(qū),中華人民共和國成立以后,全國統(tǒng)一采用首都北京所在的東八時(shí)區(qū)的區(qū)時(shí)作為標(biāo)準(zhǔn)時(shí)間,稱為北京時(shí)間。全球所有國家根據(jù)時(shí)間和各自國家所在的時(shí)區(qū)確定當(dāng)?shù)貢r(shí)間,以此來保證全球時(shí)間的低誤差同步。 我們?cè)诰幊虝r(shí),不可避免地會(huì)和時(shí)間打交道。 比如要完成一次秒殺活動(dòng), 就會(huì)涉及到時(shí)間存取,時(shí)間同步和時(shí)間差值計(jì)算等諸多細(xì)節(jié)。一個(gè)JavsScript的簡(jiǎn)單例...
摘要:年月日,由中國信息通信研究院以下簡(jiǎn)稱中國信通院中國通信學(xué)會(huì)中國通信標(biāo)準(zhǔn)化協(xié)會(huì)共同主辦的可信云大會(huì)在北京國際會(huì)議中心召開。兩日內(nèi),共有人次參與了本屆會(huì)議。2018年8月14-15日,由中國信息通信研究院(以下簡(jiǎn)稱中國信通院)、中國通信學(xué)會(huì)、中國通信標(biāo)準(zhǔn)化協(xié)會(huì)共同主辦的2018可信云大會(huì)在北京國際會(huì)議中心召開。兩日內(nèi),共有5000人次參與了本屆會(huì)議。會(huì)上公布了第十批通過可信云評(píng)估的服務(wù)名單,揭曉...
閱讀 3174·2023-04-25 19:09
閱讀 3885·2021-10-22 09:54
閱讀 1757·2021-09-29 09:35
閱讀 2914·2021-09-08 09:45
閱讀 2256·2021-09-06 15:00
閱讀 2773·2019-08-29 15:32
閱讀 1038·2019-08-28 18:30
閱讀 375·2019-08-26 13:43