查準率和查全率是衡量偏斜類問題的評估度量,它們往往是一對矛盾的值,如何權衡它們,具體情況具體分析。
對于癌癥問題,如果需要準確率,我們提升臨界閾值,查準率會上升,但同時查全率會下降。反之亦然。
假設我們有三個學習算法:
如何選擇?
取平均?不太好。。。
F值(F1 Score),挺好的,它的公式決定了PR都必須比較大才行。
查準率和查全率是衡量偏斜類問題的評估度量,它們往往是一對矛盾的值,如何權衡它們,具體情況具體分析。
對于癌癥問題,如果需要準確率,我們提升臨界閾值,查準率會上升,但同時查全率會下降。反之亦然。
假設我們有三個學習算法:
如何選擇?
取平均?不太好。。。
F值(F1 Score),挺好的,它的公式決定了PR都必須比較大才行。