管理,先看看最近有沒有什么有趣的新聞發生。關注學界的應該都知道IJCAI近幾天在斯德哥爾摩舉行(機器學習三大頂會之一),卷積神經網絡之父Yann LeCun發表了題為《Learning World Models: the next step towards AI》的演講,各大公眾號也爭相轉載,感興趣的可以去機器之心看看。關于大神的演講,我最大的感觸就是AI的發展剛剛起步,還有許多需要研究的東西,監督學習也許是低垂的果實,但是想要摘取AI王冠上最大的寶石,還有很長的路要走。LeCun最后依然使用蛋糕做對比,只不過這次強化學習成了蛋糕上的櫻桃,監督學習成了奶油,自監督學習才是主體的蛋糕坯。LeCun還有一個觀點我認為值得我們深入思考,在諸多學科之間往往存在著一條隱藏的線將諸多珍珠串聯成美麗的珍珠項鏈,而目前AI領域大多在研究穿線手法,廣泛認可的基本指導思想依舊沒有產生,就像LeCun說的,什么才是AI的“熱力學”。
人工智能和自然智能的背后是否存在底層原則?
學習的背后是否存在簡單的尊則?
大腦是否是進化產生的大量“hack”的集合?
閑話扯完了,LeCun說的離現在還比較遠,路要一步一步走,飯要一口一口吃,還是接著讀論文吧。
今天的論文題目是“Minimizing Supervision for Free-space Segmentation”,論文的想法很直觀做法也很簡單,但有幾個地方還是值得學習的。
有題目可知,本片論文做的是開放空間檢測,或者叫可行域檢測也行,至于“Minimizing Supervision”的理解就是在實驗過程中需要少量的認為干預,離無監督還有一小步的距離。
整篇文章的基調基于兩個假設:
1.可行域一般出現在整張圖片的中間偏下的位置(車載前置攝像頭采集的圖片)。
2.可行域具有比較固定的紋理特征(水泥路面或者瀝青路面)。
在這兩個假設的基礎上,作者采用傳統的基于圖的前景提取的方法提取超像素,然后利用K-means方法對圖片里的像素進行聚類(可行區域會聚為一類),然后將產生的路面類作為訓練標簽訓練一個語義分割網絡。
想法很直觀,也把傳統的計算機視覺方法與機器學習結合得很好,整個架構需要少量人工參與,極大的節省了人力成本。
上圖中熱力圖使用的是高斯分布,也是需要人為設計的地方,由于先驗知識具有極強的領域獨有性,因此導致本方法無法遷移到其他領域。
本文還有一個比較好的想法就是批量聚類,由于K-means方法為聚類結果隨機分配標簽,就算在加入先驗知識后也會產生上圖中間最左邊圖的情況,因此作者提出了一種批量聚類的方法,是的聚類效果大大提升。
可以看到本文方法得到的結果還是具有很好的效果的,但是本文基于的兩條假設也成了本文最大的限制,因為過強的假設條件就會導致方法泛化性能降低。我認為本文有幾點需要改進:
1.可行域先驗假設可否在魯棒一些,是有類似啟發式或則注意力機制的方法作為先驗。
2,路面的紋理特征檢測體現的并不明顯。
本文總體還是很優秀的,針對開放區域檢測的效果也很不錯,從中學到了很多,感謝作者優秀的工作。
最后,祝好!愿與諸君一起進步。