V2EX  ›  英汉词典

Class Imbalance

定义 Definition

Class imbalance(类别不平衡/类不平衡)指在分类任务的数据集中,不同类别的样本数量差异很大(常见为“多数类”远多于“少数类”)。这会让模型更偏向预测多数类,导致对少数类(往往更关键,如欺诈、疾病)的识别效果变差。该术语也常见于机器学习与数据挖掘语境。

发音 Pronunciation

/klæs ɪmˈbæl.əns/

例句 Examples

The dataset suffers from class imbalance, so accuracy is misleading.
这个数据集存在类别不平衡,因此仅看准确率会产生误导。

To address class imbalance, we used stratified sampling and adjusted the decision threshold to improve recall on the minority class.
为了解决类别不平衡,我们采用了分层抽样并调整决策阈值,以提升少数类的召回率。

词源 Etymology

class(类别)来自拉丁语 classis,原指“等级/群体”;imbalance由前缀 *im-*(不、非)+ balance(平衡)构成,整体字面义为“(类别上的)不平衡”。在统计学习与机器学习发展中,该组合逐渐固化为描述“分类样本分布不均”的常用术语。

相关词 Related Words

文献与作品 Literary Works

  • Learning from Imbalanced Data(He & Garcia, 2009)——专门讨论类别不平衡学习问题的综述文章。
  • Imbalanced Learning: Foundations, Algorithms, and Applications(Haibo He & Yunqian Ma 编)——系统介绍不平衡学习方法与应用。
  • Data Mining: Practical Machine Learning Tools and Techniques(Witten, Frank, Hall)——在分类评估与数据问题讨论中涉及类别不平衡及其影响。
  • Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow(Aurélien Géron)——在实践建模与评估章节中常提到类别不平衡与应对思路。
关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   843 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 6ms · UTC 23:35 · PVG 07:35 · LAX 15:35 · JFK 18:35
♥ Do have faith in what you're doing.