弱监督(学习):一种机器学习训练方式,使用不完全、含噪声或间接的标注信号来训练模型,而不是依赖大量高质量人工精标数据。(也常指 weakly supervised learning 的核心设定。)
/wiːk ˌsuːpərˈvɪʒən/
Weak supervision lets us train a model with noisy labels.
弱监督让我们可以用带噪声的标签来训练模型。
In many real-world NLP tasks, weak supervision combines heuristics, distant labels, and partial annotations to reduce the cost of manual labeling.
在许多真实的自然语言处理任务中,弱监督会结合启发式规则、远程标注与部分标注,以降低人工精标的成本。
weak 源自古英语 wāc(意为“软弱的、力量不足的”);supervision 来自拉丁语 super-(“在上”)+ videre(“看”),本义是“在上方看管、监督”。在机器学习语境中,weak supervision 引申为“监督信号不强/不干净/不完整”的训练设定。