Python科學計算神器之numpy-1

這個系列主要集中在python做科學計算的Numpy、Scipy等庫,當然原汁原味的知識才是最好的,請查看https://docs.scipy.org/
Numpy系列包含ndarray、ufunc、矩陣運算和文件存取

Numpy主要包含兩種數據結構:Array和Matrix,以及對應的的Ufunc函數

1. 安裝numpy

#終端命令 或用canda,以包含numpy、scipy等
sudo pip install numpy

2. 導入numpy

import numpy as np

3. 創建對象

Numpy最主要的對象是均勻的多維數組,我們可以通過給array函數傳遞Python的序列對象創建數組,如果傳遞的是多層嵌套的序列,將創建多維數組。Numpy的array類叫做ndarray,也就是通常說的array,numpy.array與python的array.array是不同的,它僅提供一維數組和少量函數。

3.1 ndarray最常用的屬性

  • ndarray.ndim
    --array的維數,及數組維數,python中被稱為秩rank
  • ndarray.shape
    --array的每個維度的長度,及各個維度數組的長度,是一個tuple,eg:(4, 5),tuple的長度即為rank
  • ndarray.size
    --array的元素個數
  • ndarray.dtype
    --array元素的類型,常見的numpy.int64, numpy.int32, numpy.int16, numpy.float64, Numpy默認數據類型為numpy.int64(不同版本會有區別)
  • ndarray.itemsize
    --array元素的字節長,例如,float64為8字節(=64/8),complex32為4字節 (=32/8). 它等同于ndarray.dtype.itemsize.
  • ndarray.data
    --緩存中存有的實際array元素,一般不用這個屬性對array進行索引取值
# 采用python list, numpy默認dtype為int64,默認的dtype不顯示
>>>a = np.array([[1, 2, 3], [4, 5, 6]])  
>>>a
array([[1, 2, 3],
        [4, 5, 6]])
# 下面返回一個tuple
>>>a.ndim, a.shape, a.size, a.dtype, a.itemsize
(2, (2, 3), 6, dtype('int64'), 8)
 >>>a.data
<read-write buffer for 0x7f79d8655c60, size 48, offset 0 at 0x7f79d8647e30>
# 利用reshape函數可以修改array尺寸產生新array,總elements不變
>>>a.reshape(3,2)
array([[1, 2],
        [3, 4],
        [5, 6]])

3.2 創建array對象—根據python序列對象和數據類型創建

# 一種參考3.1的例子,第二種是python對象: list + float
>>>b = np.array([[1, 2, 3], [4, 5, 6.0]])  
>>>b
array([[ 1.,  2.,  3.],
        [ 4.,  5.,  6.]])
# python tuple + float
>>>np.array((1, 2, 3.1))   
array([ 1. ,  2. ,  3.1])
# python 混合對象 list+tuple
>>>np.array(([1, 2, 3], (4, 5, 6)))  
array([[1, 2, 3],
        [4, 5, 6]])
# 創建2維array對象,Minimum dimensions 2,等同 np.array([[1, 2, 3]])
>>>np.array([1, 2, 3], ndmin=2)   
array([[1, 2, 3]])
# 復數類型
>>>np.array([1, 2, 3], dtype=complex)
array([ 1.+0.j,  2.+0.j,  3.+0.j])
# 自定義數據類型 字節順序:>為big-edian <為little-endian, i4:int32,及4個字節
>>>x = np.array([(1, 2), (3, 4), (5, 6)],dtype=[('a','<i4'),('b','<i8')])
>>>x['a']
array([1, 3, 5], dtype=int32)
# Numpy默認類型為int64
>>>x['b']
array([2, 4, 6])
>>>x['b'].dtype
dtype('int64')

3.3 創建matrix對象 / matrix轉為array對象

# 同樣可以用 python對象來創建
>>>np.mat([(1,2),(3,4)])
matrix([[1, 2],
        [3, 4]])
# !可以用數值字符串創建matrix, 并將其轉為array對象
>>>np.array(np.mat('1 2; 3 4'))
array([[1, 2],
        [3, 4]])
# 用數值字符串創建array,整體仍為字符類型的一個元素
>>>np.array(('1 2;3 4', 'a'))
array(['1 2;3 4', 'a'], dtype='|S7')
# 仍為matrix對象
>>>np.array(np.mat('1 2; 3 4'), subok=True)
matrix([[1, 2],
        [3, 4]])

3.4 利用函數創建array對象

Numpy專門提供了很多函數來創建數組,常用的有arange、linspace、logspace、zeros、ones、empty等函數通過數值創建數組(類同matlab),以及frombuffer, fromstring, fromfile等函數可以從字節序列創建數組,還可以通過fromfunction來通過函數創建數組.

3.4.1 通過arange、linspace、logspace等函數創建數組

arange與linspace最主要的區別是,arange第三個參數為step,linspace/logspace第三個參數為元素個數

  • arange函數類似于python的range函數,通過指定開始值、終值和步長來創建一維數組,注意數組不包括終值:
>>>np.arange(0, 1, 0.1)
array([ 0. ,  0.1,  0.2,  0.3,  0.4,  0.5,  0.6,  0.7,  0.8,  0.9])
  • linspace函數通過指定開始值、終值和元素個數來創建一維數組,可以通過endpoint關鍵字指定是否包括終值,缺省設置是包括終值:
# linspace在生成數組需計算好數組的size,生成類似range步長的數組通常size比range()的大1,
# 或者將終值設為range()終值-step. 最后一個等同于 np.arange(0, 1, 0.1)
>>>np.linspace(0, 1, 10), np.linspace(0, 1, 11), np.linspace(0, 0.9, 10)
(array([ 0.        ,  0.11111111,  0.22222222,  0.33333333,  0.44444444,
        0.55555556,  0.66666667,  0.77777778,  0.88888889,  1.        ]),
array([ 0. ,  0.1,  0.2,  0.3,  0.4,  0.5,  0.6,  0.7,  0.8,  0.9,  1. ]),
array([ 0. ,  0.1,  0.2,  0.3,  0.4,  0.5,  0.6,  0.7,  0.8,  0.9]))
  • logspace函數和linspace類似,不過它創建等比數列,下面的例子產生1(100)到100(102)、有20個元素的等比數列:
>>>np.logspace(0, 2, 20)
array([   1.        ,    1.27427499,    1.62377674,    2.06913808,
       2.6366509 ,    3.35981829,    4.2813324 ,    5.45559478,
       6.95192796,    8.8586679 ,   11.28837892,   14.38449888,
       18.32980711,   23.35721469,   29.76351442,   37.92690191,
       48.32930239,   61.58482111,   78.47599704,  100.        ])
# 可以指定dtype
>>>np.zeros( (3,4) )
array([[ 0.,  0.,  0.,  0.],
       [ 0.,  0.,  0.,  0.],
       [ 0.,  0.,  0.,  0.]])
>>>np.ones( (2,3,4), dtype=np.int16 )
array([[[1, 1, 1, 1],
        [1, 1, 1, 1],
        [1, 1, 1, 1]],
    
        [[1, 1, 1, 1],
        [1, 1, 1, 1],
        [1, 1, 1, 1]]], dtype=int16)
>>>np.empty( (2,3) ) 
array([[  6.92492661e-310,   6.92492661e-310,   9.01700787e+223],
        [  3.42702482e-062,   1.12958007e+277,   7.28193369e+223]])
3.4.2 通過frombuffer, fromstring, fromfile等函數從字節序列創建array,以fromstring為例
# Python的字符串實際上是字節序列,每個字符占一個字節,
# 因此如果從字符串s創建一個8bit的整數數組的話,所得到的數組正好就是字符串中每個字符的ASCII編碼
s = 'abcdefgh'
>>>>np.fromstring(s, dtype=np.int8),  np.fromstring(s, dtype=np.int64), 
np.fromstring(s, dtype=np.float64)
(array([ 97,  98,  99, 100, 101, 102, 103, 104], dtype=int8),
 array([7523094288207667809]),
 array([  8.54088322e+194]))
3.4.3 通過fromfunction創建array
# 創建 9×9 乘法表, 是不是很類似與 裝飾器?
>>>def multi_2(i, j):
        return (i+1) * (j+1)
>>>c = np.fromfunction(multi_2, (9,9))
>>>c
array([[  1.,   2.,   3.,   4.,   5.,   6.,   7.,   8.,   9.],
        [  2.,   4.,   6.,   8.,  10.,  12.,  14.,  16.,  18.],
        [  3.,   6.,   9.,  12.,  15.,  18.,  21.,  24.,  27.],
        [  4.,   8.,  12.,  16.,  20.,  24.,  28.,  32.,  36.],
        [  5.,  10.,  15.,  20.,  25.,  30.,  35.,  40.,  45.],
        [  6.,  12.,  18.,  24.,  30.,  36.,  42.,  48.,  54.],
        [  7.,  14.,  21.,  28.,  35.,  42.,  49.,  56.,  63.],
        [  8.,  16.,  24.,  32.,  40.,  48.,  56.,  64.,  72.],
        [  9.,  18.,  27.,  36.,  45.,  54.,  63.,  72.,  81.]])

Numpy彌補了Python自身的array的大量不足,為Python提供了數值計算的基礎庫,衍生出了大量做大數據分析的庫,這奠定了Python做大數據分析的地位,也是在機器學習、深度學習逐漸進入應用領域中最常用的語言,趕快摟起袖子加油干!

Enjoy it~

Python科學計算神器之Numpy-2

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。

推薦閱讀更多精彩內容