特征選擇與特征提取

模式識別的大致流程如下：

模式識別基本框架圖

從圖中我們可以知道，特征提取與選擇是在分類器設計之前完成，它主要的工作是針對數據原始特征的缺陷，降低特征維數，提高分類器的設計與性能。

原始特征

模式識別中把每個對象都量化為一組特征來描述，構建特征空間是解決模式識別問題的第一步，其中通過直接測量得到的特征稱為原始特征。如：

原始特征的形成一般包含三大類：物理、結構和數學特征

原始特征是我們直接測量獲得的，但是往往不用于模式識別中，主要有以下幾個原因：

** 計算量大*，如對于一幅1024768的灰度圖像，灰度級為256級，直接表示需要786432 bytes，進行訓練識別所需的空間、時間和計算量都無法接受；
冗余，原始特征空間中，大量的特征都是相關性強的冗余特征；
樣本分布十分稀疏，對于有限訓練樣本而言，在高維的原始特征空間中分布十分稀疏。

針對原始特征以上的特性和不足，為了設計出更好的分類器，通常需要對原始特征的測量值集合進行分析，經過選擇和變換處理，組成有效的識別特征。
處理方式主要有以下思路：

特征選擇（feature selection） 是指從原始特征中挑選出一組最有代表性、分類性能好的特征。

特征選擇的方法大致分為兩類：
Filter 方法和Wrapper 方法。