Softmax
我們令 , 定義 softmax 函數為
這樣,
Softmax Regression 算法是 Logistic Regression 算法在多分類上的推廣,下面考慮 分類問題。假設我們有
個樣本
, 令
,
, 其中
。將
使用 one-hot 編碼形式,仍然記作
, (比如
便可將
改寫為一個
維列向量,該列向量中的除了位置
處的元素為
外,其余元素均為
). 這樣
,
存在仿射映射 , 滿足
. 其中
. 對于
中的
個樣本,我們可以定義其樣本估計所屬類別的條件概率為 (
)
其中,. 令
根據極大似然估計算法,可定義 Softmax Regression 的損失函數 (交叉熵) 為
其中 表示
的第
個元素,
表示長度為
的全一列向量。
指的是對
中的每個元素求
的操作。