朴素贝叶斯:一种基于贝叶斯定理的概率分类方法,核心假设是:在给定类别条件下,各个特征之间相互独立(这一假设往往不完全成立,但在很多任务中依然效果很好)。常用于文本分类、垃圾邮件识别、情感分析等。
/naɪˈiːv beɪz/
Naive Bayes is a simple algorithm for text classification.
朴素贝叶斯是一种用于文本分类的简单算法。
Although its independence assumption is often unrealistic, Naive Bayes can perform surprisingly well on high-dimensional data like word counts.
尽管它的独立性假设常常不够现实,朴素贝叶斯在词频这类高维数据上仍可能表现得出人意料地好。
“Naive”在这里指“朴素的/天真的”,强调模型做了一个很强的简化假设——特征条件独立;“Bayes”来自英国数学家与牧师托马斯·贝叶斯(Thomas Bayes),其思想与“贝叶斯定理”相关。整体名称意为“采用朴素独立假设的贝叶斯方法”。