概覽西瓜書南瓜書1-2章

1.數據集:關于某種事物記錄的集合
1.2屬性或特征:反應對象在某方面表現出來的性質;屬性的取值成為屬性值
1.3 特征向量:屬 性 張 成 的 空 間 稱 為 " 屬 性 空 間 "、 " 樣 本 空 間 " 或 " 輸 入 空 間 " 例 如 我 們 把 " 色 澤 " " 根 蒂 " " 敲 聲 " 作 為 三 個 坐 標 軸 , 則 它 們 張 成 一 個 用 于 描 述 西 瓜 的 三 維 空 間 , 每 個 西 瓜 都 可 在 這 個 空 間 中 找 到 自 己 的 坐 標 位 置 . 由 于 空 間 中 的 每 個 點 對 應 一 個 坐 標 向 量 , 因 此 我 們 也 把 一個 示 例 稱 為 一 個 " 特 征 向 量 "。
1.4 訓練集和驗證集
1.5回歸:對連續數據的預測,分類:對離散數據的預測
1.6NFL定理:在所有問題出現的機率相同或者所有問題都同等重要的情況下,算法的期望值與算法無關、
2.模型評估與選擇
我 們 把 分 類 錯 誤 的 樣 本 數 占 樣 本 總 數 的 比 例 稱 為 " 錯 誤 率 " (error
rate) , 即 如 果 在 m 個 樣 本 中 有 α 個 樣 本 分 類 錯 誤 , 則 錯 誤 率 E = α /m ; 相 應 的 ,
1 一 α / m 稱 為 " 精 度 "
2.1 我 們 把學 習 器 的 實 際 預 測 輸 出 與 樣 本 的 真 實 輸 出 之 間 的 差 異 稱 為 " 誤 差 " (error),
學 習 器 在 訓 練 集 上 的 誤 差 稱 為 " 訓 練 誤 差 " (training e r r o r ) 或 " 經 驗 誤差 " (empirical error) , 在 新 樣 本 上 的 誤 差 稱 為 " 泛 化 誤 差 " (generalization e r r o r ) .
2.2 過擬合與欠擬合
2.3 評估方法:留一法,交叉驗證法,自助法
2.4 性能度量
對 學 習 器 的 泛 化 性 能 進 行 評 估 , 不 僅 需 要 有 效 可 行 的 實 驗 估 計 方 法 , 還 需
要 有 衡 量 模 型 泛 化 能 力 的 評 價 標 準 , 這 就 是 性 能 度 量 。


image.png
1626188508(1).png

2.4.2 精度與錯誤率

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。

推薦閱讀更多精彩內容