相信大多數數據分析師在入手Python的時候,在學習到time庫與datetime庫時,都會對兩個庫裡面長得很像,又相互有關聯的各種類和方法感到非常窩心。當接觸到pandas處理時間序列的方法時,再次發現其中各種類和方法又和前面兩個時間庫的方法「長得好像又似乎有點不同」,此時,想必每個強迫症內心早已經發出「土撥鼠吶喊」。
趁著宅在家躲疫情的間隙,託福司機重新對這3塊知識內容重新梳理,及時制止內心的土撥鼠繼續吶喊,現分享給大家。
(一) time庫
1. time庫與datetime庫的關係
在 Python 文檔裡,time是歸類在Generic Operating System Services中,換句話說,它提供的功能是更加接近於作業系統層面的。
而datetime庫比time庫高級了不少,提供了更多實用的方法,可以理解為datetime基於time進行了封裝。
我們先看一下time庫。
time庫主要圍繞unix時間戳進行操作,主要包含一個類:struct_time。
那什麼是unix時間戳?它是指格林威治時間1970年01月01日00分00秒(北京時間1970年01月01日08時00分00秒)起至現在的總秒數,比如格林威治時間1970年01月01日00分01秒就以數值1來記載。
time庫中只要有四個函數可以獲得時間函數,其中time.time()方法就可以獲得當前時間戳:
比如我們想獲得當前unix時間戳,unix時間戳以浮點數記載:
獲得當地時區的unix時間戳:
這裡我們會發現,上面的unix時間戳不再以浮點數記載,而是struct_time對象,裡面一共記載了九個時間元素,分別是年月日時分秒,tm_wday是這周的第幾天(周一是0),tm_yday是這年的第幾天,tm_isdst是夏令時。
除此以外,time.localtime()還可以把unix時間戳轉化為struct_time格式:
2. struct_time對象的格式化
time庫中對時間進行格式化的方法主要是通過time.strftime()方法,基本用法如下:
l time.strftime(tpl,ts)
§ tpl:格式化模塊字符串,用來定義輸出效果
§ ts:計算機內部時間類型變量,一般使用struct_time對象
該方法返回的對象其實是字符串,比如將上面的struct_time對象gmtime進行時間格式轉化:
上面的'%Y-%m-%d %H:%M:%S'是用來轉化strcut_time對象的格式化字符串,除此以外還有:
這個表很重要,我們後面在datetime庫中的對象以及pandas的datetime型Series對象在日期格式化操作的時候,都能用得上。
而如果我們想要將字符型的時間轉化為struct_time對象,可以用time.strptime()方法,格式剛好與time.strftime()方法對應。
比如,如果有字符串時間'2020-02-01 16:49:11',要將其轉化為struct_time對象:
3. time庫中的休眠時間
time庫中最常用的方法還有time.sleep(),比如,如果我們想要程序等待3.3秒之後再輸出,可以寫time.sleep(3.3)
time.sleep()方法在爬蟲等各種程序中應用較廣,再次不在累述。
(二) datetime庫
datetime庫可以說是time庫的高級封裝,在各種日期數據處理方面,相對於time庫,datetime庫作了進一步的升級。
datetime庫主要記載時間的類有datetime.date類、datetime.time、datetime.datetime類。
1. datetime.date類
在datetime庫中,可以通過datetime.date()方法生成年、月、日時間,返回的對象是datetime.date類。
這裡要注意,datetime.date類只記錄年、月、日這三個時間元素,不記錄時分秒等其他時間元素。
通過datetime.date()方法中的參數year、month、day指定年、月、日三個時間元素。
我們可以通過datetime.date.today()方法來獲得當前的日期,該方法返回的對象也是datetime.date類。
(1) datetime.date類的屬性
另外,datetime.date類常用的屬性有year、month、day。參數都為整數:
(2) datetime.date類時間格式化方法
datetime.date類的時間格式化方法也叫strftime(),比如當前我們有datetime.date對象date_samp如下:
通過datetime.date對象直接調用.strftimie()方法進行指定時間格式轉換如下:
而格式化字符串可以參考前面time庫的表格。這裡大家會發現,雖然格式化方法的strftime()的名字和前面一樣,且格式化字符串也和前面time庫的是一樣的,但是其調用方式卻又不相同,這也是為什麼很多同學兩個時間庫的格式化方法總是不小心寫錯的原因。
當然,像上面這種常見的字符串日期類型,每次都要使用這麼複雜的格式化字符串來轉換,未免太過繁瑣,其實datetime.date對象可以直接使用方法.isoformat()來轉化:
和datetime.date類的屬性相似,datetime.time類也有類似的屬性:
而時間格式化的方法和datetime.date類一樣,也是通過datetime.time對象的.strftime()方法來調用:
(3) unix時間戳轉換
time庫中的unix時間戳,如何轉化為datetime.date類?用實例的方法.fromtimestamp()即可,比如我們當前的時間戳current_timestamp:
上面的時間戳我們如果想獲得其中的日期的話,可以使用datetime.date.fromtimestamp()方法直接轉換:
當然,返回來的也是datetime.date類的對象。
4. datetime.time類
datetime庫中的datetime.time類用來記載時間,包括時、分、秒、毫秒。
datetime.time()方法可以創建datetime.time類的對象,參數包括hour、minute、second、microsecond。
datetime.time類的屬性:
而時間格式化的方法和datetime.date類一樣,也是通過datetime.time對象的.strftime()方法來調用:
上面可以看到,datetime.time對象的.strftime()方法返回來的對象也是字符串。
同樣地,datetime.time對象也有.isoformat()方法:
但是需要留意的是, datetime.time對象並沒有.fromtimestamp()方法來進行時間戳轉換。
5. datetime.datetime類
datetime.datetime類的對象主要是用作記錄年月日、時分秒等時間單位,我們可以把它看做是datetime.date類和datetime.time類的「結合體」。
創建datetime.datetime類對象的方法和datetime.time類也是基本一致的,參數包含year、month、day、hour、minute、second、microsecond。 但是至少要包含year、month、day三個參數。
而datetime.datetime類的時間格式化的方法,也是.strftime(),格式化字符串和前面也是一致的:
datetime.datetime對象的.isoformat()方法返回結果會有點「與眾不同」,日期和時間之間多了一個字符『T』:
而如果想快速獲得當前的日期時間,可以使用datetime.datetime.now():
6. datetime.timedelta類
datetime.timedelta類用來記錄時間間隔類,給一個時間點加減此類,即可得到一個新的時間。
datetime.timedelta()方法可以用來創建datetime.timedelta對象,參數包含days、hours、minutes、seconds、microseconds。
比如我們創建一個45天零6小時的時間間隔:
時間間隔對象生成後,就可以使用datetime對象對其進行加減:
(三) time庫與datetime庫時間對象互轉
看到這裡,相信很多同學內心的土撥鼠都在慘叫:太多東西要記了,我太難啦~
確實,使用Python寫爬蟲等程序時,時常需要用到time庫與datetime庫中的各種時間對象,最為頭疼的地方往往是各種時間格式轉換。其實,在了解time庫和datetime庫的各種類和屬性方法後,記住下面這張圖可以事半功倍:
我們通過一下過程捋一下思路:
字符串型時間轉datetime.datetime對象,用datetime.datetime.strptime()方法:
datetime.datetime轉字符串,用datetime.datetime實例的.strftime()方法:
字符串型時間轉struct_time,用time.strptime()方法:
struct_time轉字符串型時間,用time.strftime()方法:
struct_time轉unix時間戳,用time.mktime()方法:
unix時間戳轉struct_time,用time.gmtime()或time.localtime()方法:
今天我們把time庫與datetime庫幾個主要的時間對象的方法都理清楚了,同時將其互轉的規律也作了總結和歸納。篇幅有限,我們在下一系列的文章裡,繼續探討pandas庫中的時間對象和time庫、datetime庫的對象相互之間的關聯性。