首页 | 本学科首页   官方微博 | 高级检索  
     检索      

开放公文主题分类自动标注方法(摘编)
引用本文:卢小宾鲁国轩杨冠灿祁天娇.开放公文主题分类自动标注方法(摘编)[J].中国档案,2023(3):71-71.
作者姓名:卢小宾鲁国轩杨冠灿祁天娇
作者单位:1.中国人民大学档案学院;
摘    要:文章针对大规模政府开放公文的主题分类标注问题,提出一种基于多分类模型的政府开放公文主题分类自动标注方法。第一,公文主题分类标注的需求。针对主题分类标注不一致问题。开放公文所涉领域广泛,可以采用预训练模型(如BE RT)对公文提取词向量,从而保证文本分类的一致性。针对主题分类标注深度问题。自动主题分类方法需要针对公文全文,但考虑不同公文的全文长度存在极大差异,需要能够在全文本中抓住中心句以及中心词,并经过提炼后对其进行归类。

关 键 词:文本分类  主题分类  词向量  多分类模型  不一致问题  公文  全文本  一致性
本文献已被 维普 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号