V2EX  ›  英汉词典

Jaccard Index

定义 Definition

Jaccard 指数 / Jaccard 相似系数:衡量两个集合相似度的指标,定义为交集大小并集大小之比。取值范围为 0 到 1;越接近 1 表示越相似。(也常用于比较二值向量、文本词集合、标签集合等。)

例句 Examples

The Jaccard index between the two tag sets is 0.6.
这两个标签集合的 Jaccard 指数是 0.6。

In document clustering, we used the Jaccard index to compare each article’s keyword set, which reduced the impact of document length differences.
在文档聚类中,我们用 Jaccard 指数比较每篇文章的关键词集合,从而减弱了文档长度差异带来的影响。

发音 Pronunciation (IPA)

/dʒaˈkɑːr/ /ˈɪn.deks/

词源 Etymology

“Jaccard”来自瑞士植物学家与生态学家 Paul Jaccard(保罗·雅卡尔) 的姓氏;他在 20 世纪初用该系数比较物种分布的相似性。“index”源自拉丁语 index,意为“指示者、目录、指标”。因此 Jaccard index 字面含义是“雅卡尔提出的相似性指标”。

相关词 Related Words

文学与经典著作中的用例 Literary & Notable Works

  • Paul Jaccard (1901), Étude comparative de la distribution florale dans une portion des Alpes et du Jura(提出并使用该相似系数的经典来源之一)
  • Christopher D. Manning, Prabhakar Raghavan, Hinrich Schütze, Introduction to Information Retrieval(信息检索中常以 Jaccard 相似度比较集合/词项)
  • David J. C. MacKay, Information Theory, Inference, and Learning Algorithms(机器学习与信息论语境下提及相似度度量,包括 Jaccard 一类方法)
关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   1936 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 6ms · UTC 07:15 · PVG 15:15 · LAX 23:15 · JFK 02:15
♥ Do have faith in what you're doing.