noisy labels 指“带噪声的标签/不准确的标注”:在数据集中,样本的类别或目标值被错误标注、不一致标注,或因主观判断、采集流程、自动标注等原因导致标签不可靠。在机器学习中,这会降低模型训练效果并引入偏差。(也常写作 label noise)
/ˈnɔɪzi ˈleɪbəlz/
The dataset has noisy labels, so the model makes many mistakes.
这个数据集的标签有噪声,所以模型会犯很多错误。
Even with millions of images, noisy labels can cause a classifier to learn the wrong patterns unless we use robust training methods.
即使有数百万张图片,带噪声的标签也可能让分类器学到错误模式,除非我们使用更鲁棒的训练方法。
noisy 来自 noise(噪声),本义是“嘈杂的”,在统计与机器学习语境中常引申为“含有随机误差/干扰的”。label 源自法语 label/étiquette(标签、标记),表示给事物贴上的名称或类别。两者组合成 noisy labels,用于描述“标签层面的噪声/误标”,是数据标注与监督学习里常见的术语。