多示例学习:一种监督学习范式中,训练数据以“包(bag)”为单位标注,而不是给每个单独样本(instance)标注。通常一个包里包含多个实例:在经典设定下,正包表示其中至少有一个实例为正例,负包表示其中所有实例都为负例。(也存在其他变体设定。)
/ˌmʌlti ˈɪnstəns ˈlɝːnɪŋ/
In multi-instance learning, we label a bag of images instead of each image patch.
在多示例学习中,我们给一组图像(一个包)打标签,而不是给每个图像小块分别打标签。
Multi-instance learning is useful when instance-level labels are expensive, such as detecting tumors from whole-slide pathology images.
当获取单个实例的标签成本很高时(例如从整张病理切片图像中检测肿瘤),多示例学习就很有用。
该术语由 **multi-**(“多的”)+ instance(“实例/样本”)+ learning(“学习”)构成,强调学习时的基本标注单位不是单个样本,而是包含多个样本的“包”。作为机器学习研究术语,它在 1990 年代中后期被系统提出并普及,用于处理“只能拿到包级标签”的现实标注场景。