AI 領(lǐng)域最最稀缺的人才——人工智能架構(gòu)師

這里,就不賣關(guān)子了。AI領(lǐng)域最最最最最稀缺的人才應(yīng)該為人工智能架構(gòu)師。有過4次技術(shù)創(chuàng)業(yè)經(jīng)歷,如今做AI投資的星瀚資本創(chuàng)始合伙人楊歌如是說。

在楊歌的身上,傳奇的經(jīng)歷多得是。

清華學(xué)霸,技術(shù)男,四次技術(shù)創(chuàng)業(yè)經(jīng)歷,創(chuàng)建青年精英商業(yè)聯(lián)合會,投身PE,創(chuàng)辦星瀚資本,圈內(nèi)最懂AI技術(shù)的投資人之一……

然而,最打動我的,并非這些光鮮的字眼,而是他身上強大的勢能,他眼里的平靜和堅定,以及他完全不Care年輕時賺錢這件事。當(dāng)年,他甘愿拿很少的工資,只為去四大會計師事務(wù)所惡補財務(wù)知識。他賺的第一桶金,想都不想,直接扔到公司。他壓根就不理尋常的那一套活法。

他喜歡用數(shù)學(xué)模型和物理模型來比喻和解釋身邊的一切現(xiàn)象,喜歡用元認知來節(jié)省大腦內(nèi)存,喜歡用一二三來條分縷析。他的語速很快,很少停頓,且無廢話,幾乎可以直接成稿。

采訪中,他對于三個問題的論述,讓我尤其印象深刻。

第一,對目前AI芯片的立體式解析(終于知道AI芯片到底為什么會火了);

第二,對于AI市場稀缺人才AI架構(gòu)師的三個層次解析(技術(shù)追求者必讀哲學(xué));

第三,對于AI類或一般程序員選擇創(chuàng)業(yè)的建議,針對三大特征需要補足的短板,并對此提出的四大方法(工程師創(chuàng)業(yè),請詳讀)。

楊歌很喜歡用簡單的語言,把復(fù)雜的道理講清楚。每一個問題,他都能細到不能再細,深到不能再深,再結(jié)合各類比喻,確保你真正聽懂了他的意思。

本文較長,總共分三個部分,價值含量相當(dāng)高。文中盡可能地保留楊歌的口語,以原汁原味地呈現(xiàn)他的智慧。希望對你有所啟發(fā)。

就在AI專用芯片在市場上的呼聲不斷被推向新高的當(dāng)下,作為投資人的楊歌也出手了,一舉投資鯤云科技。在看AI技術(shù)有關(guān)的創(chuàng)業(yè)中,楊歌在圈內(nèi)頗有名聲,且語言表達能力極強。正好借采訪之際,讓他用最直白的語言給抖明白,專用芯片到底一個怎樣的存在,到底應(yīng)該怎么理解現(xiàn)在市場的芯片,以及AI芯片的創(chuàng)業(yè)者們,到底需要比拼些啥?

以下采用第一人稱口述的形式,呈現(xiàn)三個部分內(nèi)容:

1、AI芯片為何突然火了??

2、AI領(lǐng)域真正最最最缺的人才到底是什么??

3、AI工程師如果選擇創(chuàng)業(yè),必須補足哪些功課?

AI芯片為何突然火了?

細數(shù)芯片的歷史,就是一個從專用芯片轉(zhuǎn)向通用芯片,又轉(zhuǎn)為專用芯片的過程。

最早追溯到上世紀60年代,Intel從專用芯片轉(zhuǎn)向通用型芯片中央處理器(CPU),英偉達轉(zhuǎn)成GPU,這兩年又產(chǎn)生了TPU。

這個整套體系都是一個把芯片越做越普世化的過程,但這兩年由于終端要降低成本,所以又要返回到專用芯片,因為通用芯片相對來說,效率比較低,制作成本比較高。

所以,這兩年專用芯片開始火起來。

從通用型的、服務(wù)器型的、集成型的芯片,轉(zhuǎn)成專用型的,部分設(shè)備使用的,有一定功能的芯片,再加上這兩年正好趕上AI大爆發(fā),大家就很自然地把AI的需求燒制到這些芯片里,也就是我們看到的AI芯片異軍突起。

為何終端場景會催生專用芯片?

終端的場景為什么一定要用終端芯片,而不能通過一個捕捉器做網(wǎng)絡(luò)傳輸送到云端、送到服務(wù)器端,用服務(wù)器的CPU、或GPU、或TPU去處理,然后再返回數(shù)據(jù)呢?

是因為你的網(wǎng)絡(luò)無論多快,中間都有幾百毫秒的時間差,而終端芯片未來都需要做到當(dāng)機立斷、直接分析。

比如一個機器人,它看到你之后,需要迅速分析出你有什么特點,并跟你對話。這個過程中,如果機器人只有接收器,需要傳送到云端再回來,無論網(wǎng)絡(luò)多快,都會有時間差。

所以,為了提高響應(yīng)速度,終端開始催生自帶處理器的需求,比如能做圖像識別、語義識別、語音識別,運動機能的一些處理等,那么這個時候,終端就需要具備一定的人工智能能力(AI能力)。

專用芯片起勢后,玩家們到底比拼什么?

當(dāng)專用芯片這個需求起來之后,玩家們就要開始比拼了,具體來說,比的是:

第一,你的硬件結(jié)構(gòu)是不是最優(yōu)。

硬件行業(yè)的特點是:沒有最優(yōu)、只有更優(yōu)。

硬件永遠都在迭代,背后的原因,主要是摩爾定律在起作用。此外,當(dāng)摩爾定律晶體管變成量子化的東西后,它會繼續(xù)進化,從分子層面進到原子內(nèi)部層面,再繼續(xù)找其它的計算位。

第二,算法是不是最優(yōu)。

前兩年大家非常癡狂的去搞神經(jīng)網(wǎng)絡(luò)算法的時候,變體非常多,從最開始簡算的RNN變到LSTM,變到更為復(fù)雜的結(jié)構(gòu),從最開始設(shè)計CNN,到CNN的復(fù)雜結(jié)構(gòu),再到用CNN做對抗網(wǎng)絡(luò)…

在大家瘋狂競爭算法的時候,2017年又出來一個理論說:神經(jīng)元的基礎(chǔ)單元不應(yīng)該是神經(jīng),而應(yīng)該是一個膠囊;這樣一來,算法底層又改了,Hinton先生把自己30年前的學(xué)術(shù)成果給推翻了。在Capsule Network中,in&out在單個處理單元上變得更復(fù)雜,雖然網(wǎng)絡(luò)連接過程還是原來的樣子。

所以,很多人又只能整個推翻,重來。

第三,工程細節(jié)是不是最優(yōu)。

人們也發(fā)明了很多種方法,比如原來是全連接的,后來又有CNN部分模塊連接,然后又出現(xiàn)了很多類似Dropout的模式,連接著同時遺忘著,發(fā)現(xiàn)比正常的還更好。

第四,工程上的創(chuàng)新每天都在發(fā)生。

每個工程師都有工程上的創(chuàng)新。100個工程師里如果有一個工程師有了意義深遠的創(chuàng)新,那么對于整個行業(yè)來說,又是一場大變革。

無論是怎樣的創(chuàng)新,都在不斷突破,不斷提升效率。比如,在算法上,AlphaGoMaster和AlphaGo Zero,后者的效率相對前者就有突飛猛進的增長。

所以,一旦底層被改變,一切又變得不一樣了,又得迭代。比如,原來可能是20秒解決,你能19.8秒解決;但現(xiàn)在,突然底層一變,你變成10秒解決了,就又是一層迭代了。

沒辦法,這個行業(yè)就是這樣。

從硬件、軟硬結(jié)合,軟件、算法幾個方面來看,每天都在迭代,所以它很難:由于它沒有定型,無定型態(tài)的結(jié)果導(dǎo)致對專用芯片的固定性要求是非常苛刻的。

因為專用芯片很大的問題是一旦定板、開模,這個東西就不能改,這是一個很大的問題。所以,如何做一個適用性最強的專用芯片,這是非常重要的。一般的專用芯片做完之后,比如只服務(wù)于某一種語音識別機的芯片,一旦算法更新,底層對模塊的要求就又不一樣了,那么這個專用芯片就不能用了。于是,只能再做一個新的專用芯片。

這個事情的迭代速度太快了。

芯片的三種類型

前面大致羅列了專用芯片崛起的背景,接下來我們具體聊一下芯片到底有哪三種類型:

1、集成型的芯片(CPU、GPU、TPU),屬于它的模塊陣列非常統(tǒng)一的,它能處理幾乎所有的事情,又叫通用型芯片?

2、FPGA可編程門陣列?

3、專用芯片

其中,F(xiàn)PGA相當(dāng)于編寫硬件,通過改變硬件可以隨時調(diào)整功能邏輯,但FPGA有以下幾個大問題:

1、成本比較高,真正好的FPGA要8000元-1萬元。?

2、編寫復(fù)雜,門檻高,修改難度大。?

3、編程過程中的效率比高級算法低,這樣就導(dǎo)致開發(fā)難度也比較大。

所以,F(xiàn)PGA是個過渡過程,它能夠銜接通用型芯片和底層專用芯片。

說完FPGA,再說說專用芯片。

專用芯片的特點是價格極其便宜,只要你開模、打板之后,基本上一片50-100元就搞定了,但開模費500萬,而且一旦開模就改不了。(營長注:這里500萬為概數(shù),楊歌想表達是開模費很高,對公司來說,是一筆不小的負擔(dān)。據(jù)營長所知,開模費的量級一般在數(shù)百萬-數(shù)千萬之間。)

如果用數(shù)學(xué)的方式來理解這三類芯片,那就是:

1、專用芯片又叫階躍函數(shù),意思就是,這個東西開了模之后,下一次你要再改,你就得整個上一等;?

2、FPGA是線性函數(shù),慢慢漲、慢慢漲;?

3、CPU、GPU等集成型芯片是指數(shù)函數(shù),成本高,但它是一個好的模式。

專用芯片的成敗關(guān)鍵

目前,大家傾向于回歸專用芯片,這也是因為專用芯片在2017年有兩大推動力:比特幣的挖礦機和人工智能。

基于這兩股力量,編寫專用芯片需求來了,因為FPGA和CPU成本太高了。

但專用芯片的問題也來了,那就是,無論哪個時代,不管你是20世紀70、80年代,還是現(xiàn)在,專用芯片都會有過時的一天,因為技術(shù)一直在迭代。這時候,就是考驗?zāi)銓S眯酒芽亓Φ臅r候了,一句話,你設(shè)計的專用芯片到底能支撐業(yè)務(wù)走多久。

如果你編出來的專用芯片,能持續(xù)三年使用,那么同期你就可以去研發(fā)另外更新的專用芯片。三年后,當(dāng)原來的專用芯片產(chǎn)能要下降的時候,你可以拿新的專用芯片頂上。你要能頂上,那這個能力就厲害了。

但如果你的專用芯片半年就過時了,那你的成本就太高了,因為你每個專用芯片的打板就需要500萬以上,對初創(chuàng)公司來講是完全承受不起的。(營長注:此為概數(shù),只是為強調(diào)打板花費較大。)如果你還不停地在打板,那你的公司就危險了,你還不如用FPGA和CPU來做,現(xiàn)在多核CPU也能完成。

現(xiàn)在專用芯片的一個競爭在于,你編寫出來專用芯片是否魯棒性、適應(yīng)性和存續(xù)性足夠強,是否能夠適應(yīng)更多的人工智能算法模塊,是否能扛住算法變體…

比如當(dāng)CNN一變體,卷積核一變體,這個芯片能不能扛住?當(dāng)LSTM的循環(huán)網(wǎng)絡(luò)內(nèi)部結(jié)構(gòu)中,忘記門和記憶門這兩個發(fā)生變化,你能否扛住?

當(dāng)然,Capsule Network一出來,不僅你扛不住了,大家都扛不住了。

總的來說,你要讓你的專用芯片在容錯性和魯棒性、適應(yīng)性上做到最強,這樣,你的成本才能算得過賬來。但大部分技術(shù)人員的賬,可能算不了三到五年的時間。

還有些人把目光放在非常細的地方,一定要編到極致,保證局部的魯棒性、容錯性提到最高,但長期的、中長期,比如三年期,這樣不一定行。

比如,在交通圖像監(jiān)察識別上,你怎么用都不出錯,正確率99.9%,但突然過兩年算法一升級,你怎么辦?

因此,我不建議把目光放到單個場景的適應(yīng)性上,我認為應(yīng)該放在一個長期的、場景變革的使用性上,這點非常重要。

這些問題其實是現(xiàn)在AI芯片競爭最重要的底層邏輯。在AI芯片領(lǐng)域,我們投了鯤云科技,他們的聯(lián)合創(chuàng)始人為斯坦福的客座教授、帝國理工的教授、英國皇家工程院院士,發(fā)表300多篇的論文。

他們的特點能把芯片的適用性做得很好,芯片的場景適應(yīng)性、網(wǎng)絡(luò)適應(yīng)性、算法適應(yīng)性非常強。

同樣做的很好的公司還有地平線、寒武紀、深鑒等,不過也有一些公司,場景化的正確率只有95%,甚至85%,那么這些芯片可能就沒法用,或者只能調(diào)動一定的模塊函數(shù),不能調(diào)動大部分模塊函數(shù)。

目前來說,深度學(xué)習(xí)訓(xùn)練過程是不需要用AI專用芯片的,因為AI專用芯片主要還是在某一個終端應(yīng)用場景用。一般來說,終端人工智能芯片并不執(zhí)行訓(xùn)練過程,它只執(zhí)行使用過程。這是大家容易產(chǎn)生理解誤區(qū)的一個點。

AI芯片市場距離飽和還很遠

說到終端市場,英偉達也在猛攻終端市場。英偉達去年出了一個TX2的新型芯片(也是終端芯片)。但英偉達的終端芯片是一個輕版的集成化芯片,是把它集成化的GPU鑲在了一個小的芯片上,形式了一個專用芯片。所以,現(xiàn)在的AI專用芯片還需要扛住英偉達的競爭。

目前,人工智能技術(shù)有三層:

1、基礎(chǔ)數(shù)學(xué)物理層?

2、技術(shù)模塊中間層?

3、應(yīng)用層

技術(shù)模塊中間層(簡稱模塊層)是指圖像識別、語言識別、語義識別、運動機能識別;底層,即基礎(chǔ)數(shù)學(xué)物理層,就是芯片,數(shù)據(jù)傳輸、數(shù)據(jù)存儲結(jié)構(gòu)、算法結(jié)構(gòu)、算法模塊。

而應(yīng)用層中,幾個比較大的場景有:

1、智能家具、智能房屋、智慧城市?

2、機器人?

3、個人語音助手

這幾個場景的入口模塊都需要完整的、完全標(biāo)準的模塊層,就是說語音識別、語義識別都則需要非常精準,無論是器械,還是一個機器人,都需要模塊層要很成熟,同時需要底層芯片層很成熟。目前,大家都在競爭這個市場。

二十年后,周圍的物體可能拍一拍都能動、都能說話,每一個東西都需要兩個基礎(chǔ)的模塊體系。

1、第一個模塊體系:硬件模塊體系,就是它的硬環(huán)境。?

2、第二個模塊體系:也就是軟環(huán)境。

軟環(huán)境就是科大訊飛、商湯、曠視等等在做的東西,硬環(huán)境就是英偉達、通訊云、鯤云、深鑒等公司在做的。

現(xiàn)在的AI專用芯片市場,如果說市場飽和度滿分是10分,現(xiàn)在也就1分不到。

雖然現(xiàn)在才1分不到,但今年的AI芯片公司突然火起來,就是因為大家預(yù)期了十年之后的應(yīng)用場景,十年之后這個市場是很大的,不過大到什么程度不好做預(yù)期。

現(xiàn)在市場上的幾家公司,顯然還是不足以形成大的競爭。

如果做個比喻,現(xiàn)在的市場,也就是剛剛進入體育場,裁判還沒有開始吹哨的時候。

對于AI專用芯片來說,應(yīng)用場景還沒有完全開發(fā)完,有人去做無人機監(jiān)測、有人去做道路攝像頭監(jiān)測、有人是做家居環(huán)境。總的來說,目前各家的應(yīng)用場景都還沒有鎖定,還處在一個惡補基礎(chǔ)知識的階段。

當(dāng)然,這個階段完成之后,可能有的轉(zhuǎn)向交通,有的轉(zhuǎn)向家庭環(huán)境了,各有各自的立足的垂直領(lǐng)域,并繼續(xù)迭代。那么等到那時候,可能就不競爭了。

AI市場上最稀缺的人才是?

首先,我覺得懂人工智能,我是說的是真正懂人工智能的人才,是非常稀缺的。

那么什么叫真正懂呢?

就是了解人工智能物理意義的人,而不僅僅是懂算法。

什么才是真正懂人工智能——庖丁解牛

舉個我自身的例子。我在清華大學(xué)念書時,就用過神經(jīng)網(wǎng)絡(luò),我會用,但我不懂,不懂它的底層意義到底是什么,不懂這個東西為什么能夠訓(xùn)練出來,不理解計算機到底是怎么思考的。

這是一個非常重要的思維門檻。

對于深度學(xué)習(xí)來說,由于這里面是一個黑箱,你可以不知道機器在某一點到底在思考什么,但機器思考的那套整體邏輯和大概每一層單元在干什么,你要很清楚。

目前,能理解到這個層次的人非常少。

打個比方,有個詞叫庖丁解牛。你首先得在眼睛里,大腦里有這頭牛的全貌,然后你還必須很會使用這個刀。而不是說你拿著這把刀,你就可以迅速地把這頭牛解剖了。

你只有既理解牛、又理解刀的使用方法,你才能達到庖丁解牛的境界。

同樣,人工智能也是這么一個工具。

給你一大堆圖片,讓你訓(xùn)練出一個模型,你用tensorflow跑出來了,但明天讓你訓(xùn)練語音,后天訓(xùn)練物流雜亂的數(shù)據(jù)化信息,你就蒙圈了。

再比如,有個模型是要用CNN加上全連接的,你的模型是用對抗網(wǎng)絡(luò)更好一點,那么你的模型就可以不使用神經(jīng)網(wǎng)絡(luò),而應(yīng)該使用Randomforest,有了模型你應(yīng)該使用這個,你為什么要使用這個,你是通過大量的算法、經(jīng)驗做出來的。

對我來說,最大的幫助是,一個編程的感性認識。我在大學(xué)研究生的時候,我做了大量的編程,天天在debug,debug特別鍛煉人對于機器底層運轉(zhuǎn)的思考,一套10萬行的程序出錯了,你怎么能夠迅速給他debug出來,這個你要去理解計算機到底容易在什么地方出錯。

人工智能更復(fù)雜,人工智能在調(diào)試的過程中,沒有debug的提示器,因為它全是數(shù)據(jù)和數(shù)據(jù)之間,它是一個數(shù)值計算,不能收斂的過程,就是你算著算著錯了,你也不知道什么地方出錯了,你只能看到這個數(shù)據(jù)發(fā)散了,這是一個特別要命的問題,因為你的程序一點都沒有寫錯,只是你的數(shù)據(jù)結(jié)構(gòu)、網(wǎng)絡(luò)結(jié)構(gòu)弄錯了,這個要求程序員對這個算法的物理模型、場景模型極其明確物理意義的過程,這是非常復(fù)雜的,很難描述這個事情。

最稀缺人才——人工智能架構(gòu)師

我有一個特點,我所有學(xué)到的東西,我都能從零開始推,就是老師講的所有東西我都可以從零開始推。這個東西叫元認知。

元認知越底層的人,他在理解一件事情的時候所占用腦子里的內(nèi)存越少。比如說讓我去描繪一個整個的商業(yè)案件,有人是背書,從頭到尾背下來,我看一遍以后,我可能一個單位我就記住了,然后就忘了,下次讓我描述這個事,我把這個單元提出來就可以描述。

人工智能也是,它是一套工具,一個真正好的工程師,他手里所有的人工智能都是算法,比如現(xiàn)已知的,人工智能大類的算法可能有七八類,像支持向量機,神經(jīng)網(wǎng)絡(luò)、randomforest,adaboost等一大堆,他在看到一個模型后,能迅速判斷哪個模型更適合。

比如說為什么語義識別是用循環(huán)網(wǎng)絡(luò)和LSTM來做識別?因為語義是一個線性的信息流,這個線性信息流里面要記住前面很遠的信息,同時要忘掉很大一部分信息,再記住當(dāng)前的信息,所以,用LSTM能非常完美的解決這個問題,但LSTM在圖像識別上就不Work了、在量化金融中的優(yōu)勢也不明顯。

這里,很多人會認為股票和語義都是一個時間序列函數(shù),或者是前后序列函數(shù)。為什么LSTM訓(xùn)練這個很好用,訓(xùn)練股票就不行了呢?

這個,就需要回到元認知。因為他們的數(shù)據(jù)結(jié)構(gòu)完全不一樣,你得理解什么模型處理什么實體結(jié)構(gòu)。

再比如,CNN適合處理大量數(shù)據(jù)、超大量的數(shù)據(jù),且數(shù)據(jù)和數(shù)據(jù)之間有明確相關(guān)條件,所以,CNN適合處理圖像,因為圖像的像素之間具有相關(guān)性。

而同樣的一個情況,語義又不適合了。比如“我寫程序”這四個字,每個字之間一對一的相關(guān)性并不是那么強,但他有一個整體相關(guān)性,他跟圖像識別是不一樣的。簡單理解的話,語義是一維函數(shù),圖像是二維函數(shù)。

所以,這些都是很細節(jié)的東西。你只有在使用了大量的程序之后,跑著跑著,才能感知到,哦,原來這個應(yīng)該用什么算法跑,那個不能用什么算法跑。因為人工智能屬于黑暗森林,你只能慢慢去摸索,摸索哪個是最適合的。你不可能第一天就調(diào)試出來,搞清楚哪種場景,到底該用什么程序,這個程序應(yīng)該有多少層的網(wǎng)絡(luò)、結(jié)構(gòu)、單元,每一層單元有什么樣的參數(shù),應(yīng)該跟什么程序進行配合,是否需要兩個程序進行嫁接,是否需要高級的比如對抗型的、或者輔助型、或者嫁接型等。你需要不斷地錘煉和思考,才能出來這樣的感覺,都是一點一點悟出來的。

所以,回到最開始的問題,我覺得如果用一個特定的職位來定義,這個最稀缺的人才是人工智能架構(gòu)師。

他能抽象出你最應(yīng)該使用什么樣的工具。在他之下,其他人就可以在一個更細的層面上,去琢磨這個工具具體應(yīng)該怎么來用。

不過,人工智能架構(gòu)師又分三個層次。

人工智能架構(gòu)師的三個層次

第一層:物理模型架構(gòu)。

有的時候大家在訓(xùn)練一件事情的相關(guān)性上,可能會把兩個事情分開放。其實應(yīng)該把兩個事件放在一起,把相關(guān)性作為訓(xùn)練對象來進行訓(xùn)練,這樣訓(xùn)練可能會更好。

或者把一個隱藏的物理意義作為訓(xùn)練對象,把相關(guān)性和兩個事情都放在一起,然后再進行訓(xùn)練。

但很多人就想不到這點,就拿兩個事情直接去訓(xùn)練相關(guān)性,這是錯誤的。?

物理模型架構(gòu),這是最里的一層,需要深刻理解物理意義,當(dāng)知道各種各樣的函數(shù)該怎么去用的時候,火候就差不多了。

第二層:當(dāng)我們確定怎么訓(xùn)練拓撲模型之后,拓撲模型框架出來的時候,基于拓撲框架我選用什么樣的網(wǎng)絡(luò)模塊,具體需要訓(xùn)練成什么效果,然后再具體去訓(xùn)練。

第三層:等這些模塊全選好了,每一層用多少個單元、多少個參數(shù),你有沒有這個能力。第一層的神經(jīng)元你可以選擇100個,第二層的你選10個,第三個選擇多少個,然后用卷積你又選擇多少個,核有多大,3×3的、5×5的、10×10的,你到處去試,試一年可能才試出結(jié)果來。

好的工程師第一刀就可以給你切到差不多的點上,你這個模型基本10層網(wǎng)絡(luò),每一層大概10個神經(jīng)元,卷積核的層數(shù)大概3層,全鏈接層7層就夠了,他會一上來就給你做這個東西。

目前,這三種架構(gòu)人才都很稀缺。

要培養(yǎng)一個這樣的人才,很難很難,必須跨界,尤其物理模型架構(gòu)層面,必須跨界。你必須要能理解這個東西在物理層面上的意義,你必須經(jīng)歷過不一樣思維模式的業(yè)務(wù),有開闊的眼界,比如從事過社會、社科、商業(yè)等多種類型的工作,然后再反過來去看這件事情,就容易了。

為什么說一定要跨界呢?因為跨界會對你補充另外一個部分的素養(yǎng),跨界就是補足你的數(shù)據(jù),這叫“一個向量空間的完備性”,你跨界是用來干這個的。

我見過的特別優(yōu)秀的能扛起人工智能架構(gòu)師這類角色的人很少。我很欣賞第四范式的戴文淵,他就可以把銀行所需要的算法場景變成一定的函數(shù)需求,他屬于在工程師里情商比較高,相對比較跨界的稀缺人才。

要成為一個這樣的人才,我覺得至少要十年時間。

這類人才,一定是有強感知能力的,他有感知整個社會存在的能力,而不是把眼睛全放在眼前的技術(shù)上。

AI工程師創(chuàng)業(yè),需補足哪些短板?

未來關(guān)于AI的機會太多了,各行各業(yè)都需要AI,所有有大量數(shù)據(jù)的地方都可以用AI進行處理,因此,可能很多AI工程師也會考慮創(chuàng)業(yè)。

如果要創(chuàng)業(yè),他們又還應(yīng)該得到哪些方面的成長呢?

要回答這個問題,我們先來看看程序員到底是一種怎樣的存在。

程序員是數(shù)據(jù)和人類之間的溝通者,這一點非常重要。什么意思呢,就是說,他能把數(shù)據(jù)翻譯成人話,把人想要執(zhí)行的東西轉(zhuǎn)化成數(shù)據(jù)、數(shù)字。

對這類人群來說,由于長期跟電腦,跟技術(shù)打交道,如果要創(chuàng)業(yè),他們必須要有實踐經(jīng)歷,要有生活化的感知體驗。

這句話怎么理解呢?

AI工程師必須掌握的三個特征

我舉個例子,這個例子可能有點抽象了。我把任何一件事分為主要特征、次要特征、長尾特征。

主要特征靠看書是可以學(xué)習(xí)到的,就是老師告訴你公理一、公理二,社會規(guī)律一、社會規(guī)律二,你就記住了,這是主要特征。

什么是次要特征呢?一個事件有很多復(fù)雜的次要特征,這個老師講不清楚,你只能通過實踐,比如你在干工作的時候,如果財務(wù)不留準備金率,那公司就非常危險了;此外,對于合規(guī)這件事,在實踐中你才能知道為什么要做合規(guī),是因為很多細節(jié),工商、稅務(wù)、法律等問題都會影響到你的效率。

長尾特征屬于感性化的層面了,比如你在人和人接觸的時候,你對這個人要稍微好一點,生意就變得更順暢一點,這個老師都不會教給你。

總的來說,主要特征靠看書解決,次要特征靠實踐解決,長尾特征靠情商培養(yǎng)。如果你只有主要特征,你就永遠解決不了一個完整的事情。

程序員今后不管是創(chuàng)業(yè),還是說要有更大的發(fā)展,需要加強次要特征和長尾特征兩個方面。

對于三種特征,如何真正學(xué)會和掌握呢?

四種學(xué)習(xí)方法,AI工程師應(yīng)補足后三種

為了很好地掌握這三種特征,我有一個很重要的學(xué)習(xí)方法可以跟大家分享:學(xué)習(xí)多樣性。

具體而言,有四個層面:

第一種:理解;?

第二種:理會;?

第三種:感受;?

第四種:感知。

“理解”:是看書和通過理論化的知識去學(xué)習(xí),學(xué)習(xí)完全結(jié)構(gòu)化的知識叫“理解”,程序員多數(shù)有一個很大的問題,程序員的知識結(jié)構(gòu)大都是理解來的。

“理會”:是與人交流,通過跟別人交流學(xué)到知識,這點是我從24歲之后大量去做的。因為人和人交流的時候,是別人已經(jīng)加工過的知識,通過一個相對柔和的、說人話的方式讓你聽懂了。

與一個智者聊天勝讀十年書,因為他把他十年的東西全總結(jié)給你了,而且都是精華。

多與智者交談,你會發(fā)現(xiàn),你的整個世界觀都對了。

“感受”:智者不能告訴你的細節(jié),你以實踐出真知,從實踐中去感受,能感受到細節(jié)。

“感知”:主要來自于看不同文化的影片、電影、電視劇和書籍文章等;還有出去旅行。

舉個例子,比如你去日本,語言、貨幣、文化什么都不通,你在那兒待20天,回來之后你發(fā)現(xiàn)你身上會有一些日本人的習(xí)慣,思維方法跟他們很相似,因為這是一套環(huán)境在影響你,這套環(huán)境在數(shù)學(xué)上叫高階小量。這些東西在不斷地影響你的一些行為習(xí)慣。久而久之,你的思考方式跟他們很類似,你就能處理一些原來你不能處理的事情,這非常有意思。

我去日本、英國最典型的感受就是這樣的。因為這兩個國家的文化氣息是非常濃烈且集中的,你去了英國之后,你整個人就變成那種狀態(tài)了,詼諧、思考、謹慎。然后你能想象出來一些東西,為什么這個國家和文化下的人會有這種狀態(tài)。

此外,電影熏陶也是我常常借助的方法。

當(dāng)我對一件事情很不理解的時候,我就開始放那一類電影,一直循環(huán)播放,熏到一定程度的時候,電影里面的每個言行舉止,我都能被強烈地代入進去,然后我就突然就理解了,原來這么干是有原因的,為什么是這樣不是那樣。

在這四種學(xué)習(xí)中,AI工程師最應(yīng)該補齊的是后面三種學(xué)習(xí)方法,尤其是中國的工程師,應(yīng)多學(xué)學(xué)硅谷工程師的跨界,一定要從自己的理解層面的學(xué)習(xí)方法、相對固化的學(xué)習(xí)方法中跳出來。

當(dāng)然,這是一個逐漸豐滿的過程,AI工程師,或者其他程序員有志于未來創(chuàng)業(yè),一定要多從這幾個方面去鍛造自己。

![關(guān)注我的技術(shù)公眾號《漫談人工智能》,每天推送優(yōu)質(zhì)文章](https://upload-images.jianshu.io/upload_images/10019820-3f339ee96f43e84f.jpg?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240)

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 228,786評論 6 534
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異,居然都是意外死亡,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 98,656評論 3 419
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人,你說我怎么就攤上這事。” “怎么了?”我有些...
    開封第一講書人閱讀 176,697評論 0 379
  • 文/不壞的土叔 我叫張陵,是天一觀的道長。 經(jīng)常有香客問我,道長,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 63,098評論 1 314
  • 正文 為了忘掉前任,我火速辦了婚禮,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好,可當(dāng)我...
    茶點故事閱讀 71,855評論 6 410
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 55,254評論 1 324
  • 那天,我揣著相機與錄音,去河邊找鬼。 笑死,一個胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 43,322評論 3 442
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 42,473評論 0 289
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 49,014評論 1 335
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 40,833評論 3 355
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 43,016評論 1 371
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤,帶...
    沈念sama閱讀 38,568評論 5 362
  • 正文 年R本政府宣布,位于F島的核電站,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 44,273評論 3 347
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 34,680評論 0 26
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 35,946評論 1 288
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個月前我還...
    沈念sama閱讀 51,730評論 3 393
  • 正文 我出身青樓,卻偏偏與公主長得像,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 48,006評論 2 374

推薦閱讀更多精彩內(nèi)容