首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 488 毫秒
1.
郑凤萍 《现代情报》2007,27(3):143-144
文本提出了一种基于模糊向量空间模型和径向基函数网络的分类方法。该方法在特征提取时充分考虑了特征项在文档中的位置信息,构造出模糊特征向量,使自动分类更接近手工分类方法。以中国期刊网全文数据库部分文档数据为例验证了该方法的有效性。  相似文献   

2.
雷迪 《现代情报》2010,30(8):36-38
著作权问题是全文数据库建设中不可回避的问题,本文研究了学位论文全文数据库、特色馆藏文献全文数据库制作和服务中所涉及的著作权问题,以及在特色数据库建设中采用网络搜集全文信息所面临的著作权问题,并就此三类问题提出了一些避免侵权的建议,以达到既遵守著作权法规又使全文数据库顺利进行建设、服务。  相似文献   

3.
王宏宇 《情报科学》2006,24(7):1062-1065
本文简单介绍了一种基于Native-XML数据库的全文检索技术,它是以XML文档内容作为索引对象,定义文档和文档属性等,采用BACI倒排算法对信息构建索引,实现基于Web的混合检索。为全文数据库的底层实现提供了技术参考。  相似文献   

4.
国内外网络全文数据库比较研究   总被引:4,自引:1,他引:4  
金燕  赵蓉英 《情报科学》2004,22(2):228-231
本文选择了国内外几个典型的网络全文数据库,对其进行了详细的介绍、比较和分析,指出我国网络全文数据库建设中存在的不足,并对我国网络全文数据库的建设提出了一些建议.  相似文献   

5.
基于模糊向量空间的文本分类方法   总被引:1,自引:0,他引:1  
郑凤萍  刘春雨 《情报科学》2007,25(4):588-591
本文针对文本自动分类问题,提出了一种基于模糊向量空间模型和径向基函数网络的分类方法。网络由输入层、隐层和输出层组成。输入层完成分类样本的输入,隐层提取输入样本所隐含的模式特征,将分类结果在输出层表现出来。该方法在特征提取时充分考虑了特征项在文档中的位置信息,构造出模糊特征向量,使自动分类更接近手工分类方法。以中国期刊网全文数据库部分文档数据为例验证了该方法的有效性。  相似文献   

6.
数据库概况欧洲专利局(EPO)通过因特网向广大公众免费提供在线专利数据库的多种专利检索、全文下载、法律状态查询以及审查过程文档查询等信息服务;其专利检索系统主要包括专利文献检索系统数据库(esp@cenet)与专利审查过程文档数据库(epoline)。截至2006年11月底,专利文献检索系统数  相似文献   

7.
本文介绍了一种基于.NET技术的项目文档管理系统的设计、开发及实现过程。系统采用B/S模式,利用ASP.NET和SQL SERVER为主要技术的三层架构设计,构建了集项目文档管理、建设新闻发布于一体化的管理系统。实现了文件归档电子化、多层次分级浏览、建设新闻发布等功能,方便各级人员及时了解项目建设进度、获取项目技术资料。  相似文献   

8.
对生物和农林学科的10种中文核心期刊论文关键词进行了统计分析,探讨了我国期刊全文数据库论文关键词规范化存在的问题及根源,提出我国目前期刊全文数据库建设中论文关键词规范化应采取的重要措施。  相似文献   

9.
总结了《中文公安期刊全文数据库》建设的实践经验,指出数据库建设中存在的问题,并提出加强数据库建设的若干措施。  相似文献   

10.
期刊全文数据库的建设与利用   总被引:1,自引:0,他引:1  
黄永跃 《现代情报》2003,23(7):56-58
本文描述了期刊全文数据库特点,强调了在数字化时代下期刊全文数据库建设的重要性并对数据库的利用提出了一些设想。同时,简单地比较了在国内较有影响的两个期刊全文数据库。  相似文献   

11.
姚天泓 《现代情报》2013,33(12):56-61
全文检索系统为用户提供了一个便捷、高效地通向文献信息内容的接口。本文通过开源搜索引擎Xunsearch技术的应用,以张学良文献库为例,实现了特色文献库全文检索系统的构建。其中重点介绍系统构建思路、系统设计目标以及关键技术的实现过程,最后以检索示例阐述系统实现的功能和效果。  相似文献   

12.
向禹  吴世明 《现代情报》2014,34(6):75-78
通过建设双层PDF全文数据库、创建索引和全文检索等实现过程来阐述相关技术的研究和运用。以建设全文数据库为基础,研究结构化信息与非结构化数据的合并管理,对目录数据和全文数据的同步索引,基于Lucene技术,实现档案管理系统的一站式智能化档案全文检索,提升档案查全率。  相似文献   

13.
严贝妮  胡雪环 《现代情报》2013,33(10):166-171,176
本文搜集《中文科技期刊全文数据库》和《中国期刊全文数据库》两个数据库的期刊论文作为样本数据,对我国1978-2012年情报分析的研究论文进行计量统计,在此基础上探讨该领域的研究现状,归纳研究进展与不足,进而展望情报分析研究的未来发展方向及趋势。  相似文献   

14.
Text categorization pertains to the automatic learning of a text categorization model from a training set of preclassified documents on the basis of their contents and the subsequent assignment of unclassified documents to appropriate categories. Most existing text categorization techniques deal with monolingual documents (i.e., written in the same language) during the learning of the text categorization model and category assignment (or prediction) for unclassified documents. However, with the globalization of business environments and advances in Internet technology, an organization or individual may generate and organize into categories documents in one language and subsequently archive documents in different languages into existing categories, which necessitate cross-lingual text categorization (CLTC). Specifically, cross-lingual text categorization deals with learning a text categorization model from a set of training documents written in one language (e.g., L1) and then classifying new documents in a different language (e.g., L2). Motivated by the significance of this demand, this study aims to design a CLTC technique with two different category assignment methods, namely, individual- and cluster-based. Using monolingual text categorization as a performance reference, our empirical evaluation results demonstrate the cross-lingual capability of the proposed CLTC technique. Moreover, the classification accuracy achieved by the cluster-based category assignment method is statistically significantly higher than that attained by the individual-based method.  相似文献   

15.
文章就我国电子期刊全文数据库评价研究这一课题检索了近14年(1994—2007.4)来公开发表的文章(以《中国期刊网》收录的文章为检索范围),就其发文情况、评价方法和评价体系等内容进行了整理分析,对其中存在的问题与不足提出了自己的见解。  相似文献   

16.
邵运峰  袁芳  黎莉 《现代情报》2007,27(10):107-109
通过国内3种期刊全文数据库,对近五年中国医学类的桂心期刊论文的收录情况进行统计分析发现,期刊全文数据库对中医核心期刊的收录率.有比较大的差异。研究人员在进行文献检索时。应根据课题要采,择库而用。  相似文献   

17.
在介绍文本分类技术的基础上,结合学科导航特点,探讨了将文本分类技术应用于学科导航的必要条件,分析了应用文本分类技术后给学科导航带来的影响,通过实证显示了文本分类技术应用于学科导航分类所产生的优势.  相似文献   

18.
高晓琴 《科技通报》2012,28(4):70-71
主要研究了文本分类精度问题。介绍了文本分类的基本过程,提出了一种改进的支持向量机文本分类技术,设计并实现了一个开放的中文文档自动分类系统。实验结果表明,提出的方法不仅具有较高的训练效率,同时也能得到很高的分类准确率和查全率。  相似文献   

19.
The vector space model (VSM) is a textual representation method that is widely used in documents classification. However, it remains to be a space-challenging problem. One attempt to alleviate the space problem is by using dimensionality reduction techniques, however, such techniques have deficiencies such as losing some important information. In this paper, we propose a novel text classification method that neither uses VSM nor dimensionality reduction techniques. The proposed method is a space efficient method that utilizes the first order Markov model for hierarchical Arabic text classification. For each category and sub-category, a Markov chain model is prepared based on the neighboring characters sequences. The prepared models are then used for scoring documents for classification purposes. For evaluation, we used a hierarchical Arabic text data collection that contains 11,191 documents that belong to eight topics distributed into 3-levels. The experimental results show that the Markov chains based method significantly outperforms the baseline system that employs the latent semantic indexing (LSI) method. That is, the proposed method enhances the F1-measure by 3.47%. The novelty of this work lies on the idea of decomposing words into sequences of characters, which found to be a promising approach in terms of space and accuracy. Based on our best knowledge, this is the first attempt to conduct research for hierarchical Arabic text classification with such relatively large data collection.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号