哈嘍,大家好,今天來讓我們了解下什么是卷及神經網絡,在這篇文章中,我會介紹什么是卷積神經網絡,以及卷積神經網絡的基本結構和某些具體的應用。話不多說,馬上進入正題。
卷積神經網絡是近些年來興起的一種人工網絡結構,因為利用卷積神經網絡在圖片和語言方面能夠給出更優秀的結果,因此呢,這種技術也被廣泛的傳播和應用。卷積神經網絡最常用的部分是計算機圖片識別。不過因為他的不斷創新和不斷地迭代也被廣泛的用于了視頻分析,自然語言處理,藥物發現等等。近期很火的阿爾法狗能讓計算機看懂圍棋,這也是利用了這門技術。
那現在讓我們概括下卷積神經網絡是如何運作的吧。舉一個圖片識別的例子。我們知道人體的神經網絡是由很多層神經層和神經結構組成,多層神經層里邊會有很多的神經元。這些神經元就是神經網絡識別事物的關鍵。每一種神經網絡都會有他的輸入和輸出值。當輸入值是圖片的時候,輸入的實際上并不是那些色彩繽紛的圖案,而是一堆堆的數字。當計算機的神經元要處理這么多信息的時候,這也就是卷積神經網絡可以發揮他的優勢的地方了。那么什么是卷積神經網絡呢?那我們現在先把卷積神經網絡這個詞分開。卷積和神經網絡。卷積呢,其實就是計算機不再對每個輸入的像素做單獨的處理,而是對圖片上每一小塊的圖片上像素區域進行處理,這種做法加強了圖片信息的連續性,使得神經網絡可以看到圖形而非一個點,這種做法實際上也加深了卷積神經網絡對于圖片的理解。具體來說,卷積神經網絡有一個批量過濾器,持續不斷的在圖片上滾動手機圖片上的信息,每一次手機上來的信息都只是這一塊上的一些像素區域,然后把手機上來的信息進行整理。這個時候整理的信息有了一個具體的實現。比如說這個時候的卷積神經網絡可以看到一些邊緣上的圖片信息。然后就用同樣的步驟,用批量過濾器去批量處理邊緣信息。神經網絡用這些邊緣信息總結出更高層的神經結果,比如說總結的邊緣信息可以總結出眼睛鼻子等等,再經過一次過濾,臉部的特征信息也會被過濾總結出來。最后我們再把這些收集的信息放入到普通的全連接神經網絡中進行分類,這樣就能夠得到輸入的圖片信息能夠達到哪一種結果了。
那么我們現在來看看圖片是如何被卷積的吧。
現在給你一種圖片,圖片有長寬高三個參數。對,你沒有看錯,圖片是有高度的。這里的高是屬于計算機產生顏色的信息。如果是黑白照片的化。圖片的高度只有1.如果是彩色照片的話,圖片就會有紅綠藍三種顏色的三種信息。這時圖片的高度為3.我們以彩色圖片為例子,過濾器實際上就是在圖片上不斷移動的掃描儀。它不斷不斷的在圖像上收集小批量的像素塊。當收集完畢后,我們可以得到一個高度更高,更寬,更小的圖片。這個圖片里包含了一些邊緣信息,然后以同樣的步驟來進行多次卷積處理,對圖片進行長寬高的壓縮,使得圖像上的更多的邊緣信息可以展現,將普通的壓縮分類放入到神經系統中。這樣就可以對圖片有了更深的理解,這樣也就完成了對圖片分類的要求。
不過研究發現,在卷積神經網絡壓縮文件中,神經網絡可能會無意識的丟掉一些信息。這個時候遲化(Pooling)算法就可以很好地解決這個問題,就是在卷積的時候不壓縮長寬,盡量保證更多的信息,壓縮的工作就交給遲化算法。這樣的一項復雜工作就可以很有效的提高系統的識別準確性,有了這些技術,我們就可以很好地搭建起一個屬于我們的卷積神經網絡了。比較流行的一種搭建卷積神經網絡的方法就會我圖片中的一種方法,具體的就不詳細的概述了。
好了,這一次只是對卷積神經網絡對于圖片處理上的一個簡單的介紹,真正的卷積神經網絡遠比這個復雜的多。如果你想知道如何用Python如何搭建自己的卷積神經網絡,我會把視頻鏈接發送給你。也歡迎大家關注我的簡書頻道,獲得更多有趣有意思的機器學習的學習的知識