現在有個概念蠻火,叫做“強化學習”,這個關鍵詞的大紅其實和現在的人工智能浪潮有很大的關系,所謂強化學習,就是帶著裁判教練的機器學習,這種學習概念,我覺得同樣可以用于人類自己的學習模式。
首先解釋下“機器學習”,在我的概念里,機器學習就是建立一套數學模型,以期望與現實研究對象相契合:例如 你研究的是宏觀經濟,那么你就需要建立一個能模擬宏觀經濟的數學模型,里面應該有多少變量,理論上應該由你這個研究者決定,但是建模的目的是去契合現實中的研究對象,所以你需要一遍遍的檢查這個模型,看看是否有遺漏或者錯誤的地方,使得這個模型無法重現宏觀經濟的真實走向。我只能從一個文科生的角度來理解“建模”這個概念。據我所知,幾十年前,大專院校的經濟學系,起碼在博士學位這個層級,已經在嘗試用建立數學模型來構造真實世界的經濟。至于有沒有成功,目前來看,應該沒有。因為社會經濟都是一個超級復雜的混沌系統,忽略一個重要變量,就會讓整個系統崩潰,這個可比研究圍棋難多了,而且如果真的成功了,中國的首富肯定不是馬云而是那個經濟學家了。
那么,什么又叫做“強化學習”呢?開頭說了是帶著裁判、教練的“機器學習”。也就是在學習的過程中,不斷的干預錯誤的學習方向,比如說特斯拉的無人駕駛汽車,在簡單路況下,可以開的很溜,但是到了復雜路況上,就不一定能玩的轉了,比如說到了鄉村道路上,并沒有明顯的路標,路邊還經常有行人或者牲畜通過,這個時候,就需要人為的干預反饋,使機器明白,有些障礙應該如何避開。這種模式其實也可以應用到人類學習的過程中,有個著名的籃球教練,曾經多次帶領球隊拿到總冠軍,但是記者發現,他的指令都非常的簡短,及時。也就是幾個單詞,但是都非常及時,在問題出來的一剎那,他的糾正指令就已經給出,所以球員也能馬上得到行為修正。
同理,強化學習在教育兒童的方面,也能得到極大的應用。