Hard example mining(困难样本挖掘):在机器学习/深度学习训练中,优先挑选“难学/易错”的训练样本(如被模型误分类、损失值更高的样本)来加强训练,从而提升模型在边界情况与复杂场景下的表现。常见于目标检测、度量学习(如三元组损失)、人脸识别等任务。
/ˌhɑːrd ɪɡˈzæmpəl ˈmaɪnɪŋ/
Hard example mining helps the model learn from its mistakes.
困难样本挖掘能帮助模型从错误中学习。
In large-scale training, online hard example mining selects high-loss samples each batch, improving detection accuracy but requiring careful tuning to avoid instability.
在大规模训练中,在线困难样本挖掘会在每个批次挑选高损失样本,从而提升检测精度,但需要谨慎调参以避免训练不稳定。
该短语由 hard(难的)+ example(样本)+ mining(挖掘)构成。这里的 mining 借用“采矿/挖掘”的比喻,表示从大量数据中“挖出”更有训练价值的样本;在深度学习文献中常与 hard negative mining(困难负样本挖掘)并用。