最大熵模型:一种统计/机器学习建模方法,在满足已知约束(如特征的期望值)条件下,选择熵最大的概率分布,从而尽量“不做额外假设”。常用于自然语言处理中的分类、序列标注等任务(如最大熵分类器)。
/ˌmæksɪməm ˈɛntrəpi ˈmɑːdəl/
A maximum entropy model can be used for text classification.
最大熵模型可以用于文本分类。
By combining linguistic features with a maximum entropy model, the system estimates the most likely label distribution while staying consistent with the observed constraints.
通过将语言学特征与最大熵模型结合,该系统在符合已观测约束的前提下估计最可能的标签分布。
“Maximum entropy(最大熵)”来自信息论与统计物理中的“熵(entropy)”概念;“最大熵原理”常与物理学家 E. T. Jaynes 的工作相关:在只知道部分信息时,选取熵最大的分布,被认为是最“中立”、最少偏见的选择。“model(模型)”表示将这一原则用于构建可用于预测或推断的概率模型。