摘要:字典和集合都是基于散列表實(shí)現(xiàn)的,散列表也就是表,了解過(guò)數(shù)據(jù)結(jié)構(gòu)的應(yīng)該知道。而使用另一種辦法,任何鍵在找不到的情況下都會(huì)用中的值數(shù)據(jù)類型比如替換。在設(shè)計(jì)時(shí)就可以使用創(chuàng)建你的數(shù)據(jù)接口。
這次主要說(shuō)說(shuō)字典和集合這兩種數(shù)據(jù)類型。
字典和集合都是基于散列表實(shí)現(xiàn)的,散列表也就是hash表,了解過(guò)數(shù)據(jù)結(jié)構(gòu)的應(yīng)該知道。與散列表相關(guān)的一個(gè)概念叫做可散列,什么是可散列?在python官方定義中是這樣說(shuō)的:如果一個(gè)對(duì)象是可散列的,那么在這個(gè)對(duì)象的生命周期中,它的散列值是不變的,而且這個(gè)對(duì)象需要實(shí)現(xiàn)__hash__()方法。
python中,原子不可變類型(str、bytes和數(shù)值類型)都是可散列類型,同時(shí)所有的不可變類型也是可散列的。
集合什么是集合?在數(shù)學(xué)中指的是具有某種特定性質(zhì)的事物的總體,在python中集合指許多唯一對(duì)象的聚集。注意這個(gè)唯一,也就是說(shuō)集合中不允許重復(fù)值出現(xiàn),所以集合可以用來(lái)去重。
在python中,用大括號(hào)括起來(lái)表示一個(gè)集合。
data = [11, 11, 2, 3, 4, 4, 5, 4, 6] set(data)
{2, 3, 4, 5, 6, 11}
將列表類型的data轉(zhuǎn)換為集合類型后,重復(fù)值被去掉了。
在數(shù)學(xué)中,集合可以求并集、交集、差集等,python也可以做同樣的事。比如:
data1 = {1, 2, 3, 4, 5} data2 = {3, 4, 5, 6, 7} # 交集 print(data1 & data2) # 差集 print(data1 - data2) # 并集 print(data1 | data2)
{3, 4, 5} {1, 2} {1, 2, 3, 4, 5, 6, 7}
上面說(shuō)過(guò),集合類型用大括號(hào)表示,如果我需要?jiǎng)?chuàng)建一個(gè)空集合,是不是用{ }表示就行了?問(wèn)題來(lái)了,空集合用{ }表示,空字典也用{ }表示,這肯定不行。python中,創(chuàng)建一個(gè)空集合使用set()生成,{ }只會(huì)創(chuàng)建一個(gè)空的字典。
還有一個(gè)要提到的是集合推導(dǎo)。和列表推導(dǎo)、字典推導(dǎo)類似,這里就不講了。
字典字典中有幾個(gè)方法需要說(shuō)一下,看個(gè)例子。
a = {"x": 1, "y": 2, "z": 3} # a.keys()返回所有鍵的集合,a.items()返回鍵值對(duì)集合,a.values返回值集合 # 可對(duì)字典進(jìn)行集合運(yùn)算,比較大小等運(yùn)算 b = {"w" : 10,"x" : 11,"y" : 2} # 直接進(jìn)行集合操作,a.values()不可以 print(a.keys() & b.keys()) print(a.items() & b.items()) print(a.keys() - b.keys())
{"x", "y"} {("y", 2)} {"z"}
在字典中,可以使用a.keys()返回所有鍵的集合,a.items()返回鍵值對(duì)集合,a.values返回值集合,既然返回的是集合,就可以使用上面集合中說(shuō)到的運(yùn)算,大大簡(jiǎn)化操作。
在查找字典中的某個(gè)鍵時(shí),如果鍵不存在就會(huì)報(bào)錯(cuò),影響程序運(yùn)行,為了避免不必要的麻煩,我們可以使用d.get(k, default),給找不到的鍵一個(gè)默認(rèn)值。使用get的問(wèn)題是,它不太符合python的哲學(xué),d[k]比d.get(k)更加直觀和簡(jiǎn)潔。
其實(shí)我們還可以這樣,使用setdefault(k, default)來(lái)指定一個(gè)默認(rèn)值,這個(gè)方法比get方法更高效,但是我們需要指定特殊的鍵。而使用另一種辦法defaultdict(),任何鍵在找不到的情況下都會(huì)用defaultdict()中的值(數(shù)據(jù)類型比如list、str)替換。
d = {1: "a", 2: "b", 3: "c"} d.get(4, "d") import collections from collections import defaultdict d.setdefault(4, "d") d[4] # 如果查詢5找不到,還要指定默認(rèn)值 # 找不到的話用空字符串替換 d = defaultdict(str) d[5]
""
第二個(gè)要說(shuō)的是OrderedDict,它可以保持字典中的順序,插入時(shí)是什么樣就是什么樣,不會(huì)改變。在設(shè)計(jì)API時(shí)就可以使用OrderDict創(chuàng)建你的數(shù)據(jù)接口。
怎么合并兩個(gè)或者多個(gè)字典?使用ChainMap,接受字典作為參數(shù),如果參數(shù)中某個(gè)鍵重復(fù)了,ChainMap會(huì)返回第一個(gè)字典中的值,這個(gè)方法也是放在collections模塊下。
a = {"x": 1, "z": 3 } b = {"y": 2, "z": 4 } from collections import ChainMap c = ChainMap(a,b) print(c["x"]) print(c["y"]) # 只會(huì)返回第一個(gè)參數(shù)a中的z print(c["z"])
1 2 3
本人才疏學(xué)淺,上文中難免有些錯(cuò)誤,還請(qǐng)各位品評(píng)指正。如果覺(jué)得寫的還行,歡迎關(guān)注我的公眾號(hào)MLGroup,帶你走進(jìn)機(jī)器學(xué)習(xí)的世界。
文章版權(quán)歸作者所有,未經(jīng)允許請(qǐng)勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請(qǐng)注明本文地址:http://m.specialneedsforspecialkids.com/yun/41049.html
摘要:找出列表中小于的數(shù)據(jù)除了列表推導(dǎo)式,還有字典推導(dǎo)式,集合推導(dǎo)式,用法都一樣。如果你的數(shù)據(jù)量很大的話,考慮使用生成器表達(dá)式。切片不僅對(duì)列表有用,同樣適用于元組和字符串。切片命名使用方法,內(nèi)部參數(shù)與切片一樣。對(duì)剩余的的數(shù)據(jù),使用星號(hào)代替即可。 上次我們講了幾個(gè)不常見(jiàn)的數(shù)據(jù)類型,每個(gè)都有自己特殊的用途,雖然不經(jīng)常用到,了解一下也好。比如我們提到的數(shù)組類型,如果在數(shù)據(jù)量很大的時(shí)候同時(shí)要效率,就...
摘要:擠掉了堆中實(shí)現(xiàn)了堆排序。你可以用堆排序來(lái)查找一個(gè)序列中最大的或者最小的幾個(gè)元素。除了使用堆排序,中還有排序和,這兩個(gè)排序最終生成以列表表示的排序結(jié)果,堆排序也是。 這次我們來(lái)說(shuō)說(shuō)python中的數(shù)據(jù)結(jié)構(gòu)。當(dāng)然了,不會(huì)講很基礎(chǔ)的內(nèi)容。 用過(guò)python的都知道,python有著與其他語(yǔ)言很不一樣的數(shù)據(jù)類型,像什么列表、元組、集合、字典之類。這些數(shù)據(jù)類型造就了python簡(jiǎn)單易用同時(shí)又很強(qiáng)...
摘要:在中,特殊方法以雙下劃線開(kāi)始,以雙下劃線結(jié)束。真假值,如果向量模為,返回實(shí)現(xiàn)向量加法實(shí)現(xiàn)向量乘法,例如返回向量的模返回歐幾里德范數(shù)找個(gè)例子運(yùn)行下。怎么辦中有個(gè)特殊方法,可以修改控制臺(tái)輸出的樣式。 什么是特殊方法?當(dāng)我們?cè)谠O(shè)計(jì)一個(gè)類的時(shí)候,python中有一個(gè)用于初始化的方法$__init__$,類似于java中的構(gòu)造器,這個(gè)就是特殊方法,也叫作魔術(shù)方法。簡(jiǎn)單來(lái)說(shuō),特殊方法可以給你設(shè)計(jì)的...
摘要:來(lái)說(shuō)說(shuō)迭代器和生成器,還有可迭代對(duì)象和生成器表達(dá)式。有點(diǎn)繞是不是,其實(shí),一般只要知道可迭代對(duì)象以及它是如何實(shí)現(xiàn)的就行了,中常常用生成器來(lái)代替迭代器,可以說(shuō),生成器就是迭代器。 來(lái)說(shuō)說(shuō)迭代器和生成器,還有可迭代對(duì)象和生成器表達(dá)式。 之前簡(jiǎn)單的提到過(guò),一個(gè)對(duì)象是可迭代的可以理解為能夠使用for循環(huán)。這樣說(shuō)其實(shí)不太準(zhǔn)確,某個(gè)對(duì)象可迭代是因?yàn)樗鼉?nèi)部實(shí)現(xiàn)了$__iter__$這個(gè)特殊方法。比如在...
摘要:先不講數(shù)據(jù)結(jié)構(gòu)了,這次來(lái)說(shuō)說(shuō)中一些不被注意的功能。直接交換第二個(gè)功能。對(duì)的長(zhǎng)度使用生成一個(gè)序列,然后遍歷或者這樣第三個(gè)功能。其實(shí)還接受第二個(gè)參數(shù),它的作用是在迭代的過(guò)程中如果碰到第二個(gè)參數(shù)則停止。 先不講數(shù)據(jù)結(jié)構(gòu)了,這次來(lái)說(shuō)說(shuō)python中一些不被注意的功能。 在python的設(shè)計(jì)哲學(xué)中,有這么一條內(nèi)容:Simple is better than complex,簡(jiǎn)單的代碼比復(fù)雜的要好...
閱讀 3216·2021-11-23 09:51
閱讀 3678·2021-09-22 15:35
閱讀 3656·2021-09-22 10:02
閱讀 2965·2021-08-30 09:49
閱讀 520·2021-08-05 10:01
閱讀 3388·2019-08-30 15:54
閱讀 1641·2019-08-30 15:53
閱讀 3567·2019-08-29 16:27