Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

資料結構

1,084 views

Published on

《Python 3.5 技術手冊》第 9 章投影片

Published in: Software
  • Be the first to comment

資料結構

  1. 1. 9.資料結構 • 學習目標 – 認識 hashable、iterable、 orderable – 對物件進行排序 – 認識群集架構 – 運用 collections 模組 – 運用 collections.abc 模組
  2. 2. hashable 協定 • 試圖在 set 中置放這些型態的實例,就會 引發 TypeError:
  3. 3. • 一個物件能被稱為 hashable,它必須有個 hash 值 • 這個值在整個執行時期都不會變化, 而且 必須可以進行相等比較 • 具體來說, 一個物件能被稱為 hashable, 必須實作 __hash__() 與 __eq__() 方法
  4. 4. • set 會對加入之物件,呼叫其 __hash__() 方法取得 hash 值 • 看它是否與目前 set 中既有物件的 hash 值都不相同 – 如果相同就會直接排除而不加入 – 若都不相同,則進一步使用 __eq__() 比較 相等性,以確定是否要加入 set 之中
  5. 5. • 對於 Python 內建型態來說,只要是建立後 – 狀態就無法變動(Immutable)的型態,它的 實例都是 hashable – 可變動(Muttable)的型態之實例,都是 unhashable
  6. 6. • 一個自定義的類別建立的實例,預設也是 hashable 的 – 其 __hash__() 實作,基本上是根據 id() 計 算而來 – 而 __eq__() 實作,預設是使用 is 來比較 – 因此,兩個分別建立的實例,hash 值必然不相 同,而且相等性比較一定不成立
  7. 7. • 什麼樣的狀態會被認定為重複,還是要自 行定義 __hash__() 與 __eq__():
  8. 8. • hashable 物件,建議狀態是不可變動 • 兩個物件若是相等性比較成立,那麼也必 須有相同的 hash 值 • 然而 hash 值相同,兩個物件的相等性比較 不一定是成立的
  9. 9. iterable 協定 • 具有 __iter__() 方法的物件,就是一個 iterable 物件 • 傳回的迭代器具有 __next__() 方法,可 以逐一迭代出物件中,的資訊,若無法進 一步迭代,會引發 StopIteration • 迭代器也會具有 __iter__() 方法,傳回 迭代器自身,因此,每個迭代器本身也是 個 iterable 物件
  10. 10. • 對於狀態比較複雜的物件來說,有時產生 器不見得適合時,就會親自實作 __iter__()等方法來建立迭代器
  11. 11. • 同樣的需求,也可以使用產生器來實作
  12. 12. • 標準程式庫有許多情況下,都接受iterable 物件,在內部自動呼叫 __iter__() • 若 lt 是[1, 2, 3, 4, 5]: –set(lt) 會建立 {1, 2, 3} –tuple(lt) 會建立 (1, 2, 3, 4, 5)
  13. 13. • 標準程式庫中提供了 itertools 模組,當 中許多函式,可協助建立迭代器或產生器
  14. 14. • accumulate() 可在迭代的過程中進行累 加或指定的運算: • chain() 或 chain.from_iterable() 可將指定的序列攤平逐一迭代:
  15. 15. • dropwhile()、takewhile()、 filterfalse()
  16. 16. • 有時候會需要依某個鍵來進行分類
  17. 17. • 使用 itertools 的 groupby() 函式可以 省事許多:
  18. 18. orderable 協定 • 如果打算對一個 list 進行排序,可以直接 呼叫它的 sort() 方法,這會在既有的 list 上進行排序:
  19. 19. • 也可以使用 key 參數,指定要使用哪個值 進行排序:
  20. 20. • list 才有 sort() 方法 • 對於其他 iterable 物件,若想進行排序的 話,可以使用 sorted() 函式,可指定的 參數同樣也有 reverse 與 key 參數 • 此函式不會變動原有的函式,排序的結果 會以新的 list 傳回
  21. 21. • 如果是自訂的類別實例,它們怎麼會知道 該怎麼排序呢?
  22. 22. • 如果希望自訂型態在 sorted() 或者是使 用 list 的 sort() 時,可以有預設的排 序定義,必須實作 __lt__() 方法:
  23. 23. • 可以指定 operator 模組的 itemgetter,、 attrgetter,前者可以針對具有索引的 結構,後者可以針對物件的屬性:
  24. 24. 認識群集架構 • 群集分為三種類型: – 循序類型(Sequences type) – 集合類型(Set type) – 映射類型(Mapping type)
  25. 25. • 循序類型都是有序、具備索引的資料結構, 循序類型都是 iterable 物件
  26. 26. • tuple、str 與 bytes 是不可變動的循序 類型,具有預設的 hash()實作 • 可變動循序結構,還會有以下的操作行為:
  27. 27. • 集合類型是無序,而且元素必須都是 hashable 物件而且不會重複,它們是 iterable 物件 • 可以使用 x in set、x not in set、 len(set),以及交集、聯集、差集與對稱 差集等操作 • set 本身是可變動的,如果想要不可變動 的集合類型,可以使用 frozenset() 來 建立
  28. 28. • 映射類型可以將 hashable 物件映射至一個 任意值 • Python 中的內建型態就是 dict
  29. 29. • 如果想實作先進後出的堆疊結構,可以使 用 list,運用 append() 與 pop() 方法
  30. 30. • 對於佇列或雙向佇列來說,使用 list 的效 率並不好 • 建議使用 collections 模組中提供的 deque 類別
  31. 31. • 有個 rotate()方法,可實作出環狀佇列
  32. 32. • 如果想要有個簡單類別,以便建立的實例 能擁有欄位名稱,實際上不用自行定義, 而可以使用 collections 模組的 namedtuple() 函式
  33. 33. • 如果來源是個 iterable 物件, 除了 Point(*iterable) 的方式之外,還可 以使用 Point._make(iterable) 建立 Point 實例
  34. 34. • 若想以一定的順序來走訪 dict 中鍵值
  35. 35. • 如果想要在建立 dict 時保有最初鍵值加入 的順序,可以使用 collections 模組的 OrderedDict
  36. 36. • 依鍵排序或依值排序的常見需求:
  37. 37. • 用 collections 的 defaultdict 類別 • defaultdict 接受一個函式,它建立的實 例在當指定的鍵不存在時,就會使用指定 的函式來產生,並直接設定為鍵的對應值
  38. 38. • 使用 defaultdict 來設計一個計數器
  39. 39. • collections 模組中就個 Counter 類別
  40. 40. • 可以指定一個 dict 給 Counter,它會依 dict 中值的指定,建立對應數量的鍵
  41. 41. • 有多個 dict 物件,想要將它們合併在一起
  42. 42. • 可以使用 collections 的 ChainMap 來 達到相同的目的
  43. 43. • 如果透過 ChainMap 指定更新某對鍵值, 會在底層中第一個找到鍵的 dict 中更新對 應的值 • 若底層全部的 dict 都找不到對應的鍵時, 就會直接在第一個 dict 新增鍵值
  44. 44. • ChainMap 底層維護的 list,可以透過 maps 屬性來取得
  45. 45. • new_child() 方法可以指定dict,這會 建立一個新的 ChainMap,當中來源 ChainMap 中的 dict 並包含指定的 dict • 如果想建立新 ChainMap,不包含來源 ChainMap 的第一個 dict,可以使用 parents 屬性
  46. 46. • 想要實現 [] 取值,可以實作 __getitem__() • 想要實現 [] 設值, 可以實作 __setitem__() • 若想透過del 與 [] 來刪除, 可以實作 __delitem__()
  47. 47. • collections.abc 模組中提供了許多實 作群集時的基礎類別 • 開發者繼承這些類別,可以避免遺忘了必 須實作的方法,也可以有一些基本的共用 實作
  48. 48. • 方才自行實作的 ChainMap,可以改繼承 MutableMapping,以更符合 dict 的物 件協定:
  49. 49. • Mapping 並不是 dict 的子類別,只是擁 有 dict 的行為 • Sequence 也不是 list 的子類別,只是 擁有 list 的行為 • Set 也不是 set 的子類別,只是擁有 set 的行為
  50. 50. • 只是想要基於 str、list、dict 等行為,增 加一些自定義方法,可以使用 collections 的 UserString、UserList、UserDict

×