為了有一個高性能的學習算法,我們希望它不要有高的偏差和方差。因此偏差問題將通過確保有一個具有很多參數(shù)的學習算法來解決,以便我們能夠得到一個較低偏差的算法。并且通過用非常大的訓練集來保證我們在此沒有方差問題。我們最終可以得到一個低誤差和低方差的學習算法。這使得我們能夠很好地測試測試數(shù)據(jù)集。
從根本上來說這是一個關鍵的假設:特征值有足夠的信息量,且我們有一類很好的函數(shù),這是為什么能保證低誤差的關鍵所在,它有大量的訓練數(shù)據(jù)集,這能保證得到更多的方差值。
如果你有大量的數(shù)據(jù),而且你訓練了一種帶有很多參數(shù)的學習算法,那么這將會是一個很好的方式來提供一個高性能的學習算法。
大數(shù)據(jù)的基本原理
例題
例題