V2EX  ›  英汉词典

Imbalanced Data

释义 Definition

不平衡数据/类别不平衡数据:在分类等机器学习任务中,不同类别的样本数量差异很大(例如“正类”很少、“负类”很多),可能导致模型偏向多数类、对少数类识别效果差。

发音 Pronunciation (IPA)

/ɪmˈbælənst ˈdeɪtə/ (也常见 /ɪmˈbælənst ˈdætə/)

例句 Examples

Imbalanced data can make a classifier ignore rare cases.
不平衡数据可能会让分类器忽视少见情况。

In medical screening, imbalanced data often causes high accuracy but poor detection of the minority class.
在医学筛查中,不平衡数据常常导致“准确率很高”但对少数类的检出效果很差。

词源 Etymology

imbalanced 来自 balance(平衡) 加否定前缀 im-,表示“不平衡的”;data 源自拉丁语 datum(给出的东西),在现代英语中常指“数据”。合起来即“分布不均衡的数据”。

相关词 Related Words

文学与著作 Literary Works

  • Pattern Recognition and Machine Learning(Christopher M. Bishop)——讨论分类与概率建模背景下的数据分布问题(常涉及类别比例不均的情形)。
  • The Elements of Statistical Learning(Hastie, Tibshirani, Friedman)——在分类评估与学习算法讨论中经常出现与类不平衡相关的分析。
  • “SMOTE: Synthetic Minority Over-sampling Technique”(Chawla et al., 2002)——经典论文,专门针对imbalanced data提出处理方法。
关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   843 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 6ms · UTC 23:33 · PVG 07:33 · LAX 15:33 · JFK 18:33
♥ Do have faith in what you're doing.