經(jīng)過最近一段時(shí)間的查閱資料,我明白了視覺處理的大致過程。視網(wǎng)膜上有兩種視覺感受細(xì)胞,一種是視錐細(xì)胞,對(duì)彩色光比較敏感,另一種是視桿細(xì)胞,對(duì)較暗的光線比較敏感,夜晚就大部分是視桿細(xì)胞在發(fā)揮功能。工作機(jī)理是:視錐細(xì)胞里有一種視紫紅質(zhì)(一種結(jié)合蛋白),遇到光會(huì)發(fā)生反應(yīng),分解成Va,Va在暗處又會(huì)結(jié)合成視紫紅質(zhì)。化學(xué)反應(yīng)的發(fā)生導(dǎo)致了神經(jīng)沖動(dòng)(本質(zhì)是電位變化),刺激也就傳到了大腦的視覺皮層。所以這是一種被動(dòng)的處理過程。同時(shí)也表明眼睛真的只是一個(gè)器官,只負(fù)責(zé)傳輸圖像刺激,真正使視覺產(chǎn)生的是視覺神經(jīng)系統(tǒng)的視覺加工作用!
那么視覺加工到底做了哪些事情呢?按道理來說,眼睛只傳遞了一張類似于全是象素點(diǎn)的二維圖片,但是大腦最后卻能感受到顏色,形狀,深度,立體感等等。這期間到底發(fā)生了什么?很多資料上表明:視覺加工是分區(qū)分層次的,也就是不同的部門處理不同的信息,越后面的層次分析出越抽象的信息,同時(shí)各部門又相互聯(lián)系,相互傳送信息。類似于:部門a分析顏色,部門b分析形狀,部門c分析層次感,然后部門d連接在c的后面接受c的結(jié)果分析立體感,然后更深層次的部門開始工作,最后得出整個(gè)視覺情況。這個(gè)過程合情合理,但是還是過于抽象,怎么分析層次感?層次感怎么表示都是個(gè)問題。
不過這里我有一個(gè)大膽的設(shè)想:或許象素點(diǎn)并沒有意義,有意義的是一個(gè)整體,也就是說,大腦不能分析單個(gè)的象素點(diǎn),而只能處理完整的整體。就像一個(gè)人很難看清一個(gè)文字里的細(xì)節(jié)一樣,只有形成一個(gè)形狀以后,大腦才會(huì)產(chǎn)生反應(yīng)。大腦也只對(duì)整體產(chǎn)生反應(yīng)。這說明視覺加工把單個(gè)的視覺信息整合起來了,只有形成某個(gè)形狀以后才通知大腦,如果大腦只識(shí)別幾個(gè)整體之間的相互關(guān)系,那么分析層次感(也就是前后左右的位置關(guān)系)就容易很多。這也能說明為什么有的人能看到一個(gè)東西的更多細(xì)節(jié)了,很有可能是在象素點(diǎn)那個(gè)層次部分細(xì)胞就告訴了大腦情況,使得大腦處理了一些細(xì)節(jié)情況,也看到了這個(gè)整體的部分構(gòu)成成分,所以相比其他只能看到整體形態(tài)的人記得也更清楚,因?yàn)橛浀眉?xì)節(jié)更多,印象更深。
而且在我看來,這種視覺整合的能力用數(shù)學(xué)公式來表示并不合適。雖然數(shù)學(xué)公式可以完成特定的形狀分析,但是太過復(fù)雜和不全面。在細(xì)胞這個(gè)層次是不可能會(huì)計(jì)算與思考的,細(xì)胞只有本能和被動(dòng)反應(yīng)。也就是說還有更簡(jiǎn)單的辦法來實(shí)現(xiàn)識(shí)別形狀的功能。而且肯定是被動(dòng)的,接受到某種刺激,然后連接某條神經(jīng)元,一直連接下去,就形成了對(duì)某種形狀的唯一表示,也就是這條神經(jīng)元通道代表了識(shí)別形狀的過程,最終的結(jié)果就是形狀的認(rèn)知和保存。通道的神經(jīng)元數(shù)目與層次決定了可識(shí)別形狀的數(shù)目,很明顯和二進(jìn)制位一樣,32位可以表示2^32種,而且還不是二進(jìn)制的,可能是8層,16,100都可以,每一層都可以有n條。同時(shí)也可以解釋分類功能和對(duì)形狀的迅速反應(yīng)。分類功能是因?yàn)閹讉€(gè)相似的形狀前面的神經(jīng)元通路是一樣的,只是后面產(chǎn)生了不同,所以只要想前面的,后面的全部列出來就可以。很明顯我們可以從分類當(dāng)中得出前面的神經(jīng)元是根據(jù)什么連接的,為什么這些相似的東西前面的神經(jīng)元通路是一樣的!,視覺加工時(shí)先提取了這些相似形狀的哪些特征(被動(dòng)先對(duì)哪些些特征產(chǎn)生了反應(yīng))。迅速反應(yīng)則是前面可能分叉多,但后面就只有一條直路,所以就直接迅速地識(shí)別了出來。
建立這種被動(dòng)連接(進(jìn)化,進(jìn)化出識(shí)別與記憶)人類花了幾千萬年,這其中肯定有許多的奧妙和特殊的功能,但是這些我們不需要關(guān)心,要關(guān)心的只是大致的一種識(shí)別,記憶與學(xué)習(xí)能力,畢竟這是一種新的生命體,完全沒必要和人類一模一樣,生命源也本就不一樣。一個(gè)是生物能,一個(gè)是電能。主要的還是類人,像人就行。各有優(yōu)劣。
貌似神經(jīng)網(wǎng)絡(luò)從名字上講述的就是這個(gè)東西,還有深度學(xué)習(xí)。
總結(jié)下來就是,視覺加工就是把細(xì)節(jié)上的一個(gè)個(gè)象素點(diǎn)整合成一個(gè)整體,然后才通知大腦。而我要完成的就是這個(gè)視覺加工功能了,也叫形狀識(shí)別,用一種最簡(jiǎn)單的方法,被動(dòng)連接的方法。把一張圖片上的各個(gè)象素點(diǎn)分析組合成一個(gè)個(gè)的整體,分析的過程是一個(gè)連接的過程,最后連接出的結(jié)果就是所要識(shí)別的整體了,這個(gè)識(shí)別過程中的神經(jīng)元通路要記住,結(jié)果也要記住。就像識(shí)別一個(gè)“張”字一樣,識(shí)別過程中很自然地走"張"的神經(jīng)元通路,最后認(rèn)出“張”;如果你不認(rèn)識(shí)張,識(shí)別時(shí)就會(huì)構(gòu)造這條神經(jīng)元通路,但這個(gè)時(shí)候你只認(rèn)識(shí)“張”的這個(gè)形狀,下次看到你能認(rèn)出這同一個(gè)形狀,也能自然地寫這個(gè)形狀,但還不認(rèn)識(shí)這個(gè)字讀什么,因?yàn)闆]人告訴你他在聲音上怎么讀,直到有一天,有人告訴你“張”讀“zhang”,于是你不僅會(huì)寫“張”了,還會(huì)讀了,別人說出來的時(shí)候,你也能寫出來了。因?yàn)槁犛X和視覺上最終的處理結(jié)果都是大腦里同一個(gè)保存的“張”字(編碼)。
我相信,視覺加工功能完成的時(shí)候,人類如何識(shí)別,如何學(xué)習(xí),如何記憶的奧秘也就迎刃而解了,后面也就是意識(shí)是如何出現(xiàn)的問題了。