有 500 条中文字符串需要在 13 万条的备选数据里检索相似度最高的五条,请教大佬们有好的实现方法吗?目前的思路是用 bk tree 来做,不知道是否可行?
1
valkyrja OP 标题好像打错了😂是中文近似匹配
|
2
luxinxin May 12, 2017 via iPhone
得看近似是什么样的近似了,编辑距离是一种近似,同义词也是近似,两者实现的难度完全不一样
|