label bias(标签偏差):指在数据标注/分类标签的生成过程中,由于标注者主观判断、标注规则不一致、历史记录偏见或采样不均等原因,导致标签系统性偏向某些类别或群体,从而使模型学习到偏差并影响预测公平性与准确性。(在机器学习、数据科学与社会统计中常见)
/ˈleɪbəl ˈbaɪəs/
label 源自中古英语,进一步来自古法语 label/lambeau(“布条、标记”之意),后来引申为“标签、标注”。bias 源自法语 biais(“斜的、倾向”),再引申为“偏见/偏向”。合起来 label bias 即“由标签/标注带来的倾向性偏差”。
The model performed poorly because of label bias in the training data.
由于训练数据存在标签偏差,这个模型表现很差。
Even with a large dataset, label bias can cause the system to consistently misclassify certain groups, undermining fairness and reliability.
即使数据集很大,标签偏差也可能导致系统持续误判某些群体,从而削弱公平性与可靠性。