非结构化参考文献提取与管理方案研究 |
| |
引用本文: | 司远,肖毅.非结构化参考文献提取与管理方案研究[J].教育技术导刊,2016,15(5):137-139. |
| |
作者姓名: | 司远 肖毅 |
| |
作者单位: | 北大方正电子有限公司 数字出版业务部,北京 100085;新闻出版总署信息中心 重大科技工程管理部,北京 100052 |
| |
摘 要: | 随着信息技术的发展,出版行业逐渐将采集、编辑等流程转移到计算机上进行,实现从传统出版到数字出版的转型。图书出版物中参考文献具有重要意义。现有参考文献管理工具在运行时,大多要求在图书编撰的起始阶段介入,并需要用户自行从外部获取结构化的参考文献信息。在数字出版系统中,图书内容由投约稿作者提供,具有大量非结构化文本,难以进行管理。针对这一问题,研究了GB/T 7714-2005文后参考文献著录规则,运用正则表达式匹配等技术手段,提供了一种非结构化文本中参考文献的提取和管理方案。
|
关 键 词: | 数字出版 非结构化 GB/T 7714-2005 正则表达式 参考文献 |
|
| 点击此处可从《教育技术导刊》浏览原始摘要信息 |
| 点击此处可从《教育技术导刊》下载免费的PDF全文 |
|