機器學習基本任務、方法分類

????????機器學習主要解決兩類問題,一個是分類問題,另一個是回歸問題。分類問題有貓狗識別,手寫數字識別,判斷是否是垃圾郵件。回歸問題的結果是一個連續數字的值,而非一個類別。比如:預測房屋價格,市場分析。

? ? ? ? 機器學習分為監督學習,非監督學習,半監督學習,增強學習。或者分為批量學習,在線學習,參數學習,非參數學習。

? ? ? ? 監督學習:給機器訓練的數據擁有標簽或者答案。主要處理分類、回歸問題。非監督學習:給機器訓練的數據沒有標簽或答案。機器使用非監督學習對沒有標記的數據進行分類、聚類分析,一是進行異常檢測,二是對數據進行降維(特征提取,特征壓縮)方便可視化。半監督學習:一部分數據有標記或者答案,另一部分數據沒有。要處理這些數據,先使用無監督學習對數據作處理,然后使用監督學習做模型的訓練。增強學習是根據周圍情況,采取行動,然后根據行動的結果改進、學習行動的方式。比如:alphago,無人駕駛。

? ? ? ? 批量學習:選擇數據集中的一部分數據進行訓練。它的優點是簡單,它的問題是如何適應環境的變化,解決方案是定時重新批量學習。在環境變化特別快的條件下可能無法進行批量訓練。在線學習可以根據正確結果及時調整模型,但是需要對數據進行監控(異常檢測)以免數據帶來不好的變化。參數學習是給機器輸入大量的數據進行學習,一旦學到了參數,就不再需要原有的數據集。非參數模型不等于沒有參數,需要原來的數據集,不對模型進行過多假設。

? ? ? ? 如何選擇機器學習算法?奧卡姆剃刀原則,簡單就是好。脫離具體問題談哪個算法好是沒有意義的。在面對一個具體問題時,嘗試使用多種算法進行試驗對比是必要的。

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。

推薦閱讀更多精彩內容