ROC曲線
ROC曲線(Receiver Operating Characteristic curve)は、医療診断テストの分野で生まれ、後に機械学習やデータマイニングなどの分野でも広く使用されるようになった、分類モデルの性能を評価するためのグラフです。主に二項分類(Binary Classification)の問題に適用されます。
ROC曲線は、横軸に偽陽性率(False Positive Rate, FPR)を、縦軸に真陽性率(True Positive Rate, TPR)をプロットした曲線です。ここで、真陽性率は実際に陽性のサンプルを陽性として正しく分類した割合であり、偽陽性率は実際には陰性のサンプルを誤って陽性として分類した割合です。
ROC曲線の特徴は以下の通りです:
- 対角線
FPRとTPRが同じ値のとき、ROC曲線は対角線になります。この場合、モデルはランダムに予測していることになります。 - 左上への凸型
ROC曲線が左上への凸型を描くほど、分類モデルの性能が高いことを示します。すなわち、TPRが高く、FPRが低い場合、モデルが高い性能を持つことを意味します。 - AUC
ROC曲線の下の面積(Area Under the Curve)がAUCと呼ばれ、モデルの総合的な性能を表します。AUCが1に近いほど、モデルの性能が高いことを示します。
ROC曲線とAUCは、さまざまな分類モデルの比較や評価に広く使用されます。例えば、機械学習の分類問題において、モデルの予測性能を評価するために使用されます。また、医療診断の分野では、検査の精度や効果を評価するために使用されます。


コメント