Damerau–Levenshtein(达梅劳—列文施泰因)距离:一种衡量两个字符串相似度的“编辑距离”指标,计算把一个字符串变成另一个字符串所需的最少操作次数。常见允许的操作包括:插入、删除、替换,以及(相较于普通 Levenshtein 距离额外加入的)相邻字符对调(transposition)。常用于拼写纠错、模糊匹配与自然语言处理等场景。
/ˈdæmərɔː ˈlɛvənʃtaɪn/
The spell-checker uses Damerau-Levenshtein distance to fix typos.
拼写检查器使用 Damerau–Levenshtein 距离来修正错别字。
In search and NLP, Damerau-Levenshtein distance helps rank candidate corrections by allowing common mistakes like swapping adjacent letters (e.g., “teh” → “the”).
在搜索与自然语言处理中,Damerau–Levenshtein 距离通过允许“相邻字母交换”等常见错误(如“teh”→“the”)来帮助对候选纠正结果进行排序。
该术语来自两位学者的姓氏:Frederick J. Damerau 与 Vladimir I. Levenshtein。它是在 Levenshtein 编辑距离的基础上,强调并纳入了人类打字/拼写中非常常见的错误类型——相邻字符颠倒。