python-基本數據結構

python為何這么簡潔方便

python非常的簡潔,如果用C語言100行才能干的事兒,python只需要10行、5行甚至一行。很重要的一個原因就是python支持的這些高級數據結構,節省了很多代碼量。

List

列表是python中最常用的數據類型。list是有序的集合,可以隨時添加刪除元素

[item1,item2 ...] 語法上是 [] 中的元素組成的有序集合,元素不必是同一類型,List中可以有List元素。

>>>language=['c','java','python']
>>>language
['c','java','python']

字符串 一樣,List同樣可以被索引和切片,List也是可迭代對象,不同的是List是可變數據類型。

常用API

  • list(obj) 將對象強制轉成list,比如 list(range(5))
  • list.append(obj) 在列表尾追加 obj
  • list.insert(index,obj) index索引處插入 obj
  • list.pop(obj=list[-1]) 移除列表中的元素(默認最后一個)
  • list.remove(obj) 移除obj匹配的第一個對象
>>>s=[1,2,3,4,5,[6,7,8],9]

>>>s.append(0)
[1, 2, 3, 4, 5, [6, 7, 8], 9, 0]
>>>s.insert(-1,-1)
[1, 2, 3, 4, 5, [6, 7, 8], 9, -1, 0]
>>>s.pop(-5)
[1, 2, 3, 4, 5, 9,-1, 0]
>>>s.sort()
[-1, 0, 1, 2, 3, 4, 5, 5, 9]
>>>s.reverse()
[9, 5, 5, 4, 3, 2, 1, 0, -1]
>>>s.count(5)
2

利用python為list提供的這些API,我們可以很輕松實現棧和隊列這兩個數據結構,當然是在你不考慮插入查找操作的復雜度基礎上。python的 collections [1] 這個庫中的隊列是更好的選擇。

>>> from collections import deque
>>> queue = deque(["Eric", "John", "Michael"])
>>> queue.append("Terry")           # Terry arrives
>>> queue.append("Graham")          # Graham arrives
>>> queue.popleft()                 # The first to arrive now leaves
'Eric'
>>> queue.popleft()                 # The second to arrive now leaves
'John'
>>> queue                           # Remaining queue in order of arrival
deque(['Michael', 'Terry', 'Graham'])

List的生成

1.直接定義

直接用[item1,item2, ...] 窮舉法來構造處List

2.迭代

在Python中,迭代是通過for ... in來完成的,而很多語言比如C或者Java,迭代list是通過下標索引完成的。python的抽象程度更高,對于 dict{key:value} 可以用 for key in dict 來進行迭代另一方面,python的迭代更加的通用,它適用于所有可迭代對象。可以用下面方法判斷是否為可迭代對象

>>> from collections import Iterable
>>> isinstance(List, Iterable) 
True

生成一個List很簡單,結合之前的API和 for 關鍵字

>>> squares = []
>>> for x in range(10):
...     squares.append(x**2)
...
>>> squares
[0, 1, 4, 9, 16, 25, 36, 49, 64, 81]

當然對于python而言,這種寫法已經算是復雜了,之后會接觸很多實用的python高級函數。

3.列表生成式

上面的迭代寫法,如果用列表生成式來寫,那就是

squares = [x**2 for x range(10)]

python的語義已經非常清楚了,多寫幾次就能很快熟悉了。

列表生成式很大程度的體現了python的簡潔高效的特點,還可以在表達式中添加過濾條件,處理函數等等。

>>> vec = [-4, -2, 0, 2, 4]

>>> [x*2 for x in vec]
[-8, -4, 0, 4, 8]

>>> [x for x in vec if x >= 0]
[0, 2, 4]

>>> [abs(x) for x in vec]
[4, 2, 0, 2, 4]

稍微復雜一些的用法

>>> freshfruit = ['  banana', '  loganberry ', 'passion fruit  ']
>>> [weapon.strip() for weapon in freshfruit]
['banana', 'loganberry', 'passion fruit']

>>> [(x, x**2) for x in range(6)]
[(0, 0), (1, 1), (2, 4), (3, 9), (4, 16), (5, 25)]

>>> vec = [[1,2,3], [4,5,6], [7,8,9]]
>>> [num for elem in vec for num in elem]
[1, 2, 3, 4, 5, 6, 7, 8, 9]

Tuple

元組是不可變對象,初始化之后就不可更改。所以,tuple 沒有list中append() insert()這樣的操作函數,tuple中的元素不可修改。在代碼中,tuple帶來的好處很多,要大膽的使用它。構造語句:

>>> t=(1,2,3,4,5)

tuple的概念有一點很繞,tuple對象不可變,但是tuple可以包含list這種可變的對象。

>>> t = 12345, 54321, 'hello!'
>>> t[0] = 1
...會提示修改失敗
>>> t = ([1,2,3],4,5)
>>> t[0][2] = 4
>>> t
t = ([1,2,4],4,5)

上面的例子,t這個tuple本身并沒有變,只是其中的第一個元素內容變了。因為t[0]指向了list類型的可變對象。理解這一點,tuple就很簡單了。

Set

set可以看成是無重復,無序key的集合,它和數學中的集合一樣,兩個set之間可以進行交并的操作。

使用 set() 或者 { } 來創建,經常用于重復測試或者關系測試。

重復插入雖然不犯錯,但不實際存儲。

>>> basket = {'apple', 'orange', 'apple', 'pear', 'orange', 'banana'}
>>> print(basket)                      # show that duplicates have been removed
{'orange', 'banana', 'pear', 'apple'}

>>> a = set('abracadabra')
>>> b = set('alacazam')
>>> a                                  # unique letters in a
{'a', 'r', 'b', 'c', 'd'}
>>> a - b                              # letters in a but not in b
{'r', 'd', 'b'}
>>> a | b                              # letters in either a or b
{'a', 'c', 'r', 'd', 'b', 'm', 'z', 'l'}
>>> a & b                              # letters in both a and b
{'a', 'c'}
>>> a ^ b                              # letters in a or b but not both
{'r', 'd', 'b', 'm', 'z', 'l'}

Dict

python內置了dict,也就是以 key:value 的形式存儲數據,具有極快的查找速度

  • dict在內部通過 hash 直接計算處 key 對用的 value 的地址,所以查找很快
  • key 的值不可變,所以不能用List來作為 key
  • dict占用大量內存,這是肯定的,以空間換時間了
  • 同一個字典不能有重復的key,新的會覆蓋舊的

對一個字典執行 list(d.keys()) 將返回一個字典中所有關鍵字組成的無序列表(如果你想要排序,只需使用 sorted(d.keys()) )。使用 in 關鍵字可以檢查字典中是否存在某個關鍵字(指字典)

>>> tel = {'jack': 4098, 'sape': 4139}
>>> tel['guido'] = 4127
>>> tel
{'sape': 4139, 'guido': 4127, 'jack': 4098}
>>> tel['jack']
4098
>>> del tel['sape']
>>> tel['irv'] = 4127
>>> tel
{'guido': 4127, 'irv': 4127, 'jack': 4098}
>>> list(tel.keys())
['irv', 'guido', 'jack']
>>> sorted(tel.keys())
['guido', 'irv', 'jack']
>>> 'guido' in tel
True
>>> 'jack' not in tel
False

>>> d = {}  #initialize
>>> dict(sape=4139, guido=4127, jack=4098)  #可以直接利用關鍵字參數傳入
{'sape': 4139, 'jack': 4098, 'guido': 4127}

TIPs

  • 利用 del 語句來批量刪除List 中的元素

  • 元組只有一個元素時的定義 t=(0) 會有歧義,與 t=0 作用相同,所以用 t=(0,) 來消除沖突。

  • dict和set也有與列表生成式相似的生成式

    >>> {x: x**2 for x in (2, 4, 6)}
    {2: 4, 4: 16, 6: 36}
    
    >>> {x for x in 'abracadabra' if x not in 'abc'}
    {'r', 'd'}
    

    ?


  1. collections是Python內建的一個集合模塊,提供了許多有用的集合類。 ?

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。

推薦閱讀更多精彩內容