奇異值分解(SVD) --- 幾何意義

原文:http://blog.sciencenet.cn/blog-696950-699432.html

關于線性變換部分的一些知識可以猛戳這里奇異值分解(SVD) --- 線性變換幾何意義

奇異值分解( The singular value decomposition )

該部分是從幾何層面上去理解二維的SVD:對于任意的 2 x 2 矩陣,通過SVD可以將一個相互垂直的網格(orthogonal grid)變換到另外一個相互垂直的網格。

我們可以通過向量的方式來描述這個事實: 首先,選擇兩個相互正交的單位向量v1v2, 向量Mv1Mv2正交。

u1u2分別表示Mv1Mv2的單位向量,σ1*u1=Mv1和 σ2*u2=Mv2。σ1和 σ2分別表示這不同方向向量上的模,也稱作為矩陣 M 的奇異值。

這樣我們就有了如下關系式

Mv1= σ1u1

Mv2= σ2u2

我們現在可以簡單描述下經過?M?線性變換后的向量?x?的表達形式。由于向量v1v2是正交的單位向量,我們可以得到如下式子:

x= (v1x)v1+ (v2x)v2

這就意味著:

Mx= (v1x)Mv1+ (v2x)Mv2

Mx= (v1x) σ1u1+ (v2x) σ2u2

向量內積可以用向量的轉置來表示,如下所示

vx=vTx

最終的式子為

Mx=u1σ1v1Tx+u2σ2v2Tx

M=u1σ1v1T+u2σ2v2T

上述的式子經常表示成

M=UΣVT

u矩陣的列向量分別是u1,u2,Σ?是一個對角矩陣,對角元素分別是對應的σ1和?σ2,V矩陣的列向量分別是v1,v2。上角標T表示矩陣V的轉置。

這就表明任意的矩陣?M?是可以分解成三個矩陣。V表示了原始域的標準正交基,u表示經過?M?變換后的co-domain的標準正交基,Σ?表示了V中的向量與u中相對應向量之間的關系。(V describes an orthonormal basis in the domain, and U describes an orthonormal basis in the co-domain, and Σ describes how much the vectors in V are stretched to give the vectors in U.)

如何獲得奇異值分解?( How do we find the singular decomposition? )

事實上我們可以找到任何矩陣的奇異值分解,那么我們是如何做到的呢?假設在原始域中有一個單位圓,如下圖所示。經過 M 矩陣變換以后在co-domain中單位圓會變成一個橢圓,它的長軸(Mv1)和短軸(Mv2)分別對應轉換后的兩個標準正交向量,也是在橢圓范圍內最長和最短的兩個向量。

換句話說,定義在單位圓上的函數|Mx|分別在v1v2方向上取得最大和最小值。這樣我們就把尋找矩陣的奇異值分解過程縮小到了優化函數|Mx|上了。結果發現(具體的推到過程這里就不詳細介紹了)這個函數取得最優值的向量分別是矩陣 MT M 的特征向量。由于MTM是對稱矩陣,因此不同特征值對應的特征向量都是互相正交的,我們用vi 表示MTM的所有特征向量。奇異值σi= |Mvi|?, 向量uiMvi方向上的單位向量。但為什么ui也是正交的呢?

推導如下:

σi和?σj分別是不同兩個奇異值

Mvi= σiui

Mvj= σjuj.

我們先看下MviMvj,并假設它們分別對應的奇異值都不為零。一方面這個表達的值為0,推到如下

MviMvj=viTMTMvj=viMTMvj= λjvivj= 0

另一方面,我們有

MviMvj= σiσjuiuj= 0

因此,uiuj是正交的。但實際上,這并非是求解奇異值的方法,效率會非常低。這里也主要不是討論如何求解奇異值,為了演示方便,采用的都是二階矩陣。

應用實例(Another example)

現在我們來看幾個實例。

實例一

經過這個矩陣變換后的效果如下圖所示

在這個例子中,第二個奇異值為 0,因此經過變換后只有一個方向上有表達。

M =u1σ1v1T.

換句話說,如果某些奇異值非常小的話,其相對應的幾項就可以不同出現在矩陣?M?的分解式中。因此,我們可以看到矩陣?M?的秩的大小等于非零奇異值的個數。

實例二

我們來看一個奇異值分解在數據表達上的應用。假設我們有如下的一張 15 x 25 的圖像數據。

如圖所示,該圖像主要由下面三部分構成。

我們將圖像表示成 15 x 25 的矩陣,矩陣的元素對應著圖像的不同像素,如果像素是白色的話,就取 1,黑色的就取 0. 我們得到了一個具有375個元素的矩陣,如下圖所示

如果我們對矩陣M進行奇異值分解以后,得到奇異值分別是

σ1= 14.72

σ2= 5.22

σ3= 3.31

矩陣M就可以表示成

M=u1σ1v1T+u2σ2v2T+u3σ3v3T

vi具有15個元素,ui具有25個元素,σi對應不同的奇異值。如上圖所示,我們就可以用123個元素來表示具有375個元素的圖像數據了。

實例三

減噪(noise reduction)

前面的例子的奇異值都不為零,或者都還算比較大,下面我們來探索一下擁有零或者非常小的奇異值的情況。通常來講,大的奇異值對應的部分會包含更多的信息。比如,我們有一張掃描的,帶有噪聲的圖像,如下圖所示

我們采用跟實例二相同的處理方式處理該掃描圖像。得到圖像矩陣的奇異值:

σ1= 14.15

σ2= 4.67

σ3= 3.00

σ4= 0.21

σ5= 0.19

...

σ15= 0.05

很明顯,前面三個奇異值遠遠比后面的奇異值要大,這樣矩陣?M?的分解方式就可以如下:

Mu1σ1v1T+u2σ2v2T+u3σ3v3T

經過奇異值分解后,我們得到了一張降噪后的圖像。

實例四

數據分析(data analysis)

我們搜集的數據中總是存在噪聲:無論采用的設備多精密,方法有多好,總是會存在一些誤差的。如果你們還記得上文提到的,大的奇異值對應了矩陣中的主要信息的話,運用SVD進行數據分析,提取其中的主要部分的話,還是相當合理的。

作為例子,假如我們搜集的數據如下所示:

我們將數據用矩陣的形式表示:

經過奇異值分解后,得到

σ1= 6.04

σ2= 0.22

由于第一個奇異值遠比第二個要大,數據中有包含一些噪聲,第二個奇異值在原始矩陣分解相對應的部分可以忽略。經過SVD分解后,保留了主要樣本點如圖所示

就保留主要樣本數據來看,該過程跟PCA( principal component analysis)技術有一些聯系,PCA也使用了SVD去檢測數據間依賴和冗余信息.

總結(Summary)

這篇文章非常的清晰的講解了SVD的幾何意義,不僅從數學的角度,還聯系了幾個應用實例形象的論述了SVD是如何發現數據中主要信息的。在netflix prize中許多團隊都運用了矩陣分解的技術,該技術就來源于SVD的分解思想,矩陣分解算是SVD的變形,但思想還是一致的。之前算是能夠運用矩陣分解技術于個性化推薦系統中,但理解起來不夠直觀,閱讀原文后醍醐灌頂,我想就從SVD能夠發現數據中的主要信息的思路,就幾個方面去思考下如何利用數據中所蘊含的潛在關系去探索個性化推薦系統。也希望路過的各位大俠不吝分享呀。

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市,隨后出現的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 229,732評論 6 539
  • 序言:濱河連續發生了三起死亡事件,死亡現場離奇詭異,居然都是意外死亡,警方通過查閱死者的電腦和手機,發現死者居然都...
    沈念sama閱讀 99,214評論 3 426
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人,你說我怎么就攤上這事。” “怎么了?”我有些...
    開封第一講書人閱讀 177,781評論 0 382
  • 文/不壞的土叔 我叫張陵,是天一觀的道長。 經常有香客問我,道長,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 63,588評論 1 316
  • 正文 為了忘掉前任,我火速辦了婚禮,結果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好,可當我...
    茶點故事閱讀 72,315評論 6 410
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發上,一...
    開封第一講書人閱讀 55,699評論 1 327
  • 那天,我揣著相機與錄音,去河邊找鬼。 笑死,一個胖子當著我的面吹牛,可吹牛的內容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 43,698評論 3 446
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 42,882評論 0 289
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后,有當地人在樹林里發現了一具尸體,經...
    沈念sama閱讀 49,441評論 1 335
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 41,189評論 3 356
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發現自己被綠了。 大學時的朋友給我發了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 43,388評論 1 372
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤,帶...
    沈念sama閱讀 38,933評論 5 363
  • 正文 年R本政府宣布,位于F島的核電站,受9級特大地震影響,放射性物質發生泄漏。R本人自食惡果不足惜,卻給世界環境...
    茶點故事閱讀 44,613評論 3 348
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 35,023評論 0 28
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至,卻和暖如春,著一層夾襖步出監牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 36,310評論 1 293
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個月前我還...
    沈念sama閱讀 52,112評論 3 398
  • 正文 我出身青樓,卻偏偏與公主長得像,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 48,334評論 2 377

推薦閱讀更多精彩內容