一、引入Numpy
默認的方式是:
import numpy as np
一般不推薦采用其他方式,上面是默認的方法。
二、ndarray
n維數組對象,是一個大數據集容器,是一中同構數據多維容器,也即是說,ndarray中的數據都是相同類型的。
創建ndaray的方法
array函數是最重要的方法,接受一切序列型的對象。
import numpy as np
data1=[6,7.5,8,0,1]
arr1=np.array(data1)
print(arr1)
[ 6. 7.5 8. 0. 1. ]
ndim屬性會返回array的維度,shape屬性會返回array的構型,比如說是(2,3)的數組。dtype屬性會返回array中元素的數據類型,比如int32.
arr1.ndim
arr1.shape
arr1.dtype
zeros和ones函數分別可以創建指定長度或形狀的全0或全1的數組。empty函數可以創建沒有任何具體數值的數組。eye函數可以創建一個正方的N*N單位矩陣。
print(np.zeros(10))
print(np.ones((3,6)))
print(np.empty((2,3,2)))
arange函數類似于內置的range,但返回一個ndarray。
print(np.arange(15))
print(np.arange(1,10).reshape(3,3))
數組和標量的運算
大小相等的數組之間的任何運算都會應用到元素層面,比如:
arr=np.arange(1,10).reshape(3,3)
print(arr*arr)
print(arr-arr)
-------------------
[[ 1 4 9]
[16 25 36]
[49 64 81]]
[[0 0 0]
[0 0 0]
[0 0 0]]
基本的索引和切片
arr=np.arange(0,10)
print(arr)
print(arr[5])
print(arr[5:8])
arr[5:8]=12
print(arr)
--------------------------
[0 1 2 3 4 5 6 7 8 9]
5
[5 6 7]
[ 0 1 2 3 4 12 12 12 8 9]
如果將一個值賦給一個切片,這個值就會自動傳播給這個切片里面的所有值。
對于二維數組,基本上是同樣的方式,比如:
arr2d=np.arange(15).reshape(3,5)
print(arr2d)
print(arr2d[2])
print(arr2d[2,4])
---------------------------------
[[ 0 1 2 3 4]
[ 5 6 7 8 9]
[10 11 12 13 14]]
[10 11 12 13 14]
14
在多維數組中,如果省略了后面的索引,那么會返回一個維度低的ndarray,比如:
arr3d=np.arange(12).reshape(2,2,3)
print(arr3d)
print(arr3d[0])
print(arr3d[1,0])
----------------------------
[[[ 0 1 2]
[ 3 4 5]]
[[ 6 7 8]
[ 9 10 11]]]
[[0 1 2]
[3 4 5]]
[6 7 8]
二維數組的切片索引范例如下圖:
布爾型索引,將存儲數據的數組以及存儲字符的數組對應起來,比如:
names=np.array(['Bob','Joe','Will','Bob','Will','Joe','Joe'])
data=np.random.randn(7,4)
print(names)
print(data)
假如每個名字都對應data數組中的一行,而我們想要選出對應‘Bob’的所有行。數組的比較運算==也是矢量化的。
print(names=='Bob')
返回的將是一個布爾型數組:
[ True False False True False False False]
這個布爾型數組可用于數組索引:
print(data[names=='Bob',2:])
返回的將是這樣的一個數組:
[[-0.74744123 0.14274993]
[ 1.04196354 -0.48137007]]
又比如將data的所有負值都設置為0,如此操作:
data[data<0]=0
print(data)
可以看出array后的[]中可以設置的內容太多了。
數組轉置和軸對換
arr.T是最簡單的方法。矩陣運行的點乘方法是np.dot。