基于自主学习规则的中文物种描述文本的语义标注研究 |
| |
引用本文: | 段宇锋,黑珍珍,鞠菲,崔红.基于自主学习规则的中文物种描述文本的语义标注研究[J].现代图书情报技术,2012(5):41-47. |
| |
作者姓名: | 段宇锋 黑珍珍 鞠菲 崔红 |
| |
作者单位: | 华东师范大学商学院;美国亚利桑那大学图书馆学与信息资源学院 |
| |
基金项目: | 教育部人文社会科学青年项目“基于深度语义标注的网络中文学术信息抽取研究”(项目编号:10YJC870004)的研究成果之一 |
| |
摘 要: | 从《中国植物志》中随机采集1 000个文档作为数据集,采用自主学习规则与先导词相结合的算法实现中文物种描述文本的语义标注。实验数据表明,本研究设计的基于规则的算法整体标注效率(F值)达到0.930,大部分元素的F值在0.724-0.964之间,该算法优于朴素贝叶斯分类算法。同时证明,先导词对优化算法具有积极意义。
|
关 键 词: | 规则 先导词 物种描述文本 语义标注 |
本文献已被 CNKI 等数据库收录! |
|