“Hard negative mining(困难负样本挖掘)”是机器学习/信息检索中的一种训练策略:在大量“负样本”(不匹配、不同类、错误候选)里,优先挑选那些最容易被模型误判为“正样本”的样本(即“难负样本”)来训练,从而更有效地提升模型的区分能力与鲁棒性。(也常见于度量学习、对比学习、目标检测与推荐系统。)
/hɑːrd ˈnɛɡətɪv ˈmaɪnɪŋ/
Hard negative mining helps the model learn faster.
困难负样本挖掘能帮助模型更快学习。
In our retrieval system, we use hard negative mining to select confusing non-matching items so the embedding space separates similar-looking products more reliably.
在我们的检索系统中,我们用困难负样本挖掘来挑选那些“看起来很像但其实不匹配”的条目,从而让嵌入空间更可靠地区分外观相近的商品。
该短语由三部分组成:hard(难的)、negative(负样本/负例)、mining(挖掘、筛选)。它并非传统语言学意义上的“古老词源”,而是源自机器学习实践中的术语化表达:把“从大量候选数据中挑选最有训练价值的负例”类比为“数据挖掘(mining)”。