F1 score(F1 分数)是一种用于评估分类模型表现的指标,等于精确率(precision)与召回率(recall)的调和平均数。它常用于类别不平衡(某类样本明显更少)时,比单看准确率(accuracy)更能反映模型对“正类”识别的综合效果。
(也常被称为 F1 measure / F-measure。)
/ˌɛf ˈwʌn skɔːr/
The model’s F1 score is 0.82.
这个模型的 F1 分数是 0.82。
Because the dataset is imbalanced, we report the F1 score rather than accuracy to better reflect performance.
由于数据集类别不平衡,我们报告 F1 分数而不是准确率,以更好地反映模型表现。
F1来自统计与信息检索领域的 F-measure(F 值)家族:字母 F通常被解释为“fidelity(忠实度)/ effectiveness(有效性)”一类的命名传统,用来表示对检索/分类效果的综合评分;下标 1表示精确率与召回率同等权重的版本(更一般的形式是 Fβ,β 用来调节召回率相对精确率的重要性)。