类别不平衡:在分类任务中,不同类别的样本数量差异很大(常见的是“少数类”远少于“多数类”),从而导致模型更容易偏向多数类,出现“整体准确率看起来很高,但少数类识别很差”等问题。(也常见于欺诈检测、罕见疾病筛查、故障预测等场景。)
/klæs ɪmˈbæləns/
Class imbalance can make a model ignore rare but important cases.
类别不平衡会让模型忽视罕见但重要的情况。
In medical diagnosis, class imbalance often requires resampling or cost-sensitive learning to improve recall for the minority class.
在医学诊断中,类别不平衡常常需要重采样或代价敏感学习,以提高对少数类的召回率。
class 源自拉丁语 classis(群体、等级),在机器学习语境中指“类别/标签”;imbalance 由 *im-*(否定前缀)+ balance(平衡)构成,表示“不平衡”。组合起来即“类别(分布)不平衡”,是统计学习与数据挖掘中常用术语。