“Document classification”指文档分类:把文章、邮件、报告等文本按照主题、用途或类别(如“体育/财经/科技”,“垃圾邮件/正常邮件”)进行自动或人工归类的过程与方法。常见于信息检索、自然语言处理与机器学习中。(也可泛指对纸质或电子文件进行归档分级。)
/ˈdɑːkjəmənt ˌklæsəfəˈkeɪʃən/
Document classification helps sort emails into spam and inbox folders.
文档分类可以帮助把邮件分到垃圾箱和收件箱。
In many companies, document classification is used to tag reports by department and sensitivity level so that access can be controlled securely.
在许多公司里,文档分类用于按部门和保密级别给报告打标签,从而安全地控制访问权限。
document来自拉丁语 documentum(“证据、教导材料”),与“教、示范”相关;classification来自拉丁语 classis(“等级、类别”)加上表示“使……成为、……的过程”的构词成分,整体含义就是“把文档按类别进行归类的过程”。