共查询到20条相似文献,搜索用时 250 毫秒
1.
以《中西医结合护理》排版所用的方正书版文件为例,介绍用于圈定元数据字段的“准标签对”的选择技巧,以及fbd文件与html文件之间的字符兼容性和格式对等性的处理方法.以此为基础,可以方便地实现高质量网刊元数据的高效率自动提取,以及PDF文件的精准自动分割与转页合并.实践证明,对于特定期刊而言,上述工作是很容易自主完成的. 相似文献
2.
针对现有的元数据提取方法提取精度不高且适应能力较差的问题,本文提出一种基于度量级融合的论文元数据提取方法.首先,提取论文首部的特征,利用已标注的数据集对HMM、SVM和CRF三种统计学习方法进行训练,生成相应的元数据提取模型;然后,根据贝叶斯判决理论推导出和规则,并利用和规则对三种提取模型产生的后验概率进行融合决策,实现论文元数据的提取;最后,通过设定时间段和文档数阈值,采用基于时间段统计的方法动态更新三种提取模型,以确保模型的有效性.在不同的数据集上对各种提取方法的性能进行了实验对比,结果表明,本文提出的方法不仅提高了元数据提取精度,而且具有较强的适应能力. 相似文献
3.
中文期刊刊次号编制探讨 总被引:1,自引:0,他引:1
本文论述了刊次号的作用及编制原则,提出刊次号的编制方法——刊名字母数字法,论述了该法在号码选择、取号方法以及刊次号的组成方面的特色——科学、简便、适应性强。并对统一刊次号编制方法进行了探讨。 相似文献
4.
关于中文期刊刊次号编制的探讨 总被引:1,自引:0,他引:1
本文论述了刊次号的作用及编制原则,提出刊次号的编制方法——刊名字母数字法,论述了该法在号码选择、取号方法以及刊次号的组成方面的特色——科学、简便、适应性强。并对统一刊次号编制方法进行了探讨。 相似文献
5.
介绍了一种自行设计的期刊上网的新模式以及网站运营管理的经验.该网站的杂志板块突破了纸质杂志的载文量,也提高了论文的阅读率;该网站还通过设置"新闻"、"百科"、"黄页"、"商情"、"书店"等板块以及添加"搜索"、"在线订阅"等功能,实现了刊网互补、互动发展的建网目标. 相似文献
6.
7.
随着互联网的发展与普及,我国科技期刊的纸质版产品逐渐丧失了主导地位,各种形态的数字化期刊包括科技期刊的网刊,因其即时与便捷的获取及检索特性获得飞速发展;然而,目前科技期刊网刊的出版并不十分规范,绝大部分期刊的网刊缺乏法律支撑,因此,文章就我国当前科技期刊网刊的合法性进行探讨,并对网刊的法律地位,违法网刊可能导致的后果以及如何获得网络出版服务许可证等问题进行分析,以期引起整个行业的重视,并为科技期刊网刊的规范化发展提供参考。 相似文献
8.
9.
学术类科技期刊网刊推送策略研究 总被引:1,自引:0,他引:1
《科技与出版》2014,(6)
从网刊推送的主客体的需求出发,结合网刊推送过程中存在的各种问题,提出了一种差别式管理推送主体和客体的推送策略。这种差别式管理推送主客体的方法,注重推送客体的个体需求,同时也顾及了推送主体的需求和现状,能有效解决目前影响推送效果过程中的问题。其主要思想是根据推送主体和客体的差别式需求和现状,整理和细分推送信息,并将整理出的信息发送到对应需求的推送客体,尽量做到按需发刊。 相似文献
10.
(接上期)9.3关于业务规则、方针和规定的元数据9.3.1文件捕获阶段关于业务规则、方针和规定的元数据在捕获阶段,元数据应该记录下文件的形成和管理遵循了业务规则和方针、规章要求和其他要求。这些元数据应该:a)明确机构的业务系统中所使用的特定的元数据方案; 相似文献
11.
简述PDF信息抽取过程中采用的转换工具及抽取语言,简析PDFTOHTML格式转换后的中间文档,分析PDF科技论文首页元数据存在的问题,给出对以上问题的解决方案。 相似文献
12.
元数据自动抽取研究新进展* 总被引:1,自引:0,他引:1
分析元数据自动抽取的现实需求,对元数据自动抽取的相关研究进行阐述,然后对DROID、 NLNZ Metadata Extractor、Metadata Miner Catalogue PRO 3种典型的元数据自动抽取器进行分析比较;在讨论目前元数据自动抽取技术局限性的基础上,对该技术进行总结和展望。 相似文献
13.
描述元数据结构及其扩展规则研究* 总被引:3,自引:0,他引:3
设计描述元数据的首要关键点是元数据的结构及其扩展规则,本文就此问题进行探讨,并以古文献元数据为例说明描述元数据规范的基本结构、元素组成和扩展规则,以此增强不同资源对象元数据之间的互操作性,进一步实现资源共享的目的。 相似文献
14.
高校科学数据元数据方案初探 总被引:1,自引:0,他引:1
基于元数据的共享方式是实现科学数据共享的重要手段。文章结合高校科学数据特点,提出了针对高校科学数据的元数据设计原则,在都伯林核心元数据的基础上,设计了一套高校科学数据元数据方案,包括:核心元素集、核心元素限制属性、著录规则,以期提高高校科学数据描述和著录的准确度。 相似文献
15.
元数据之题名著录的比较研究 总被引:2,自引:0,他引:2
本文阐述了描述性元数据MARC(包括MARC21和CNMARC)题名著录规则和应用DC元数据方案的题名著录规则,并对其进行了比较,且分析了它们之间在著录上存在的问题,提出要提高我国国内元数据方案的互操作性,最理想的状态是以一个国家标准的形式出现统一元数据结构,以保证数据交换和共享。 相似文献
16.
17.
18.
19.
20.
一种新的搜索引擎探讨 总被引:1,自引:0,他引:1
传统的搜索引擎都不具备理解文档内容的能力 ,导致查准率普遍不高。本文提出一种采用RDF和信息提取技术的新的搜索引擎。该引擎采用信息提取技术自动获取和生成网络资源的元数据 ,由RDF描述并携带在互联网上传输、交换 ,智能代理负责收集、处理该元数据信息并向用户提供检索服务。由于计算机可以理解RDF携带的元数据的含义 ,因此可以做到基于内容的概念检索。本文在分析各种技术背景的基础上 ,给出了这种搜索模型的结构图 ,阐述了该系统的原理、优点 ,并给出了部分模块的设计 相似文献