首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 218 毫秒
1.
中文搜索引擎发展的危机与契机   总被引:1,自引:0,他引:1  
唐钊  武助宇 《现代情报》2003,23(1):42-43,35
论述了中文搜索引擎发展的危机,如汉字内码问题等和中文搜索引擎发展的契机,如中国互联网发展迅速等。  相似文献   

2.
元搜索引擎及其主要技术   总被引:32,自引:3,他引:32  
李广建  黄崑 《情报科学》2002,20(2):175-179
本文介绍了元搜索引擎的涵义,特征及其体系结构,实现原理,并基于检索机制的划分标准分述不同元搜索引擎的类型和特点,分析元搜索引擎实现的主要技术,最后对开发中文元搜索引擎提出建议。  相似文献   

3.
赵新民 《现代情报》2002,22(5):98-100
基于中文信息处理的特殊性和复杂性,本文就中文搜索引擎中的若干中文信息处理技术进行了深入地探讨,对诸如中文分词、中文码制转换和中文全半角处理等方面提出了一种较为完整的解决方案。  相似文献   

4.
垂直搜索引擎是针对某一个行业的专业搜索引擎,是搜索引擎的细分和延伸。通过垂直搜索引擎能够从互联网上自动搜集信息,并为用户提供信息服务。建设一个中文垂直搜索引擎大致需要以下技术:信息采集技术、网页信息抽取技术、中文分词技术、索引技术。  相似文献   

5.
自然语言检索中的中文分词技术研究进展及应用   总被引:1,自引:0,他引:1  
何莘  王琬芜 《情报科学》2008,26(5):787-791
中文分词技术是实现自然语言检索的重要基础,是信息检索领域研究的关键课题,无论是专业信息检索系统还是搜索引擎都依赖于分词技术的研究成果。本文通过在国内外著名数据库中进行相关检索,分析了研究中文分词技术及其在著名搜索引擎中的应用。  相似文献   

6.
山寨搜索引擎的使用方法和Google、百度一样,都是通过输入关键词来搜索要查询的内容。不同的是山寨搜索引擎利用独立搜索引擎的结果,然后把所得的搜索结果显示出来。山寨搜索引擎采用了成员搜索引擎选择技术、搜索请求转换技术、搜索结果输出技术和有效信息提取技术。山寨搜索引擎具有搭建环境简易、方便搜索、搜索结果丰富和个性化的搜索特点。同时,山寨版搜索引擎也存在着搜索时间长、返回结果不满意、只支持简单高级搜索的缺点。鉴于此,本文就山寨搜索引擎的发展现状、技术特点等进行了初步探讨,在此基础上,进一步对基于山寨搜索引擎的发展趋向进行了展望。  相似文献   

7.
超然范码     
1994年6月,中国发明专利公报向世界公告了一项发明:超然韵调组合汉字编码法及其键盘.韵调组合汉字编码方法及其键盘是根据汉字的声韵调形频义等多种属性组合特点,利用英文字母、数字和符号对汉语字词进行混合编码,达到三码输入单字,四码输入词汇,字词均无重码的效果.字词包容量极大,平均码长最短,规则简明易记,各类人员皆宜,各种技术指标突破目前流行的五笔字形、中文声数、拼音、双拼等编码方法.《国家级新产品新技术快讯》予以公布后,数十家专利推广单位来电来函愿意代办推广.发明人范宗喜的名字被列入《国家级科技成果研制功臣名录》、《当代发明家成果辞典》.这项被专家们誉为我国电脑汉字输入最新突破的高新技术成果,吸引了众多的外商  相似文献   

8.
分析了基于80C31单片机系统的汉字字库及输入实现原理,参考几种常用单片机汉字显示方案,提出一种基于预处理的汉字编码和字库的显示方法,较好地解决了存储空间与显示速度的矛盾,并具有平台化的优点。对系统的软硬件设计进行了阐述,介绍了汉字字库在EEPROM中的存储形式及其寻址方式,并给出了相应的C程序。  相似文献   

9.
中文电子期刊的元搜索引擎   总被引:3,自引:0,他引:3  
楼松斋  张惠惠 《情报科学》2003,21(11):1195-1197
本文首先介绍了元搜索引擎的特点和实现原理,并结合中文电子期刊的发展和应用现状,提出了应用中文期刊元搜索引擎的发展需要;最后建立了一个中文期刊元搜索引擎的设计模块,并对其系统结构和相关技术进行了论述。  相似文献   

10.
本文首先简要介绍了 lucene 桌面搜索引擎技术现状,根据桌面搜索的的不足,提出了一种基于 Lucene 的中文搜索引擎设计方案.使用了中文的分词技术的正向最大般配算法解决 lucene 对中文分词存在不足  相似文献   

11.
陈慧 《现代情报》2010,30(4):62-65
本文论述了搜索引擎的概念、基本原理、主要功能及作用,并针对国内比较著名的搜索引擎站点进行了详尽的分析,在此基础上,对中文网络搜索引擎发展的现状进行了分析,在看到中文搜索引擎发展的同时,也要看到中文搜索引擎在发展中存在的问题。  相似文献   

12.
吉向东 《现代情报》2010,30(6):125-127
本文构建了一个基于搜索引擎技术的中文歧义词收集系统。该系统从Internet上抓取网页内容,清除掉HTML标记及其他脚本后,得到网页内容的纯文本形式,然后采用双向扫描法找出歧义词位置并保存,接着做进一步的分析处理,得到包含歧义词的句子及歧义词在句中的相对位置。该结果可以供分词消岐算法研究人员使用,能够有效解决分词消歧研究中测试语料难以获取和不同消歧算法的结果难以对比的问题。  相似文献   

13.
中文搜索引擎发展趋势   总被引:2,自引:0,他引:2  
武助宇  刘文青 《情报科学》2002,20(9):990-992
通过分析中文搜索引擎发展现状与特点,探讨了中文搜索引擎的发展趋势。  相似文献   

14.
论提高中文搜索引擎质量的途径   总被引:11,自引:0,他引:11  
焦微玲 《情报科学》2002,20(1):100-102
随着网络信息数量的迅猛增长,搜索引擎的网络导航作用日益增强,然而搜索引擎自身也存在“信息过载”、“信息超量”的现象,如何克服上述现象,向用户提供数量适宜、质量优良的信息是目前迫切需要解决的问题。本文立足于本文搜索引擎,在分析了我国搜索引擎的发展状况和存在的问题之后,简单论述了可以提高中文搜索引擎质量的几条途径。  相似文献   

15.
中国学术期刊综合评价系统与其他评价系统之比较   总被引:2,自引:0,他引:2  
陶路 《情报科学》2005,23(1):71-74
从中国科学技术评价工作现状出发,通过实例将中国学术期刊综合评价系统SCI(科学引文索引)、EI(工程索引)及国内其他评价系统,在评价方式、评价范围、评价项目、评价结果等方面进行了比较。结果表明,由于该系统以6500多规范化学术期刊为统计基础,采用计算机网络化先进手段,和大样本、多学科、跨专业的期刊综合统计方法,可在长达几十年的时间范围内进行评价,不仅可动态给出期刊引文颇次、影响因子、即年指标等数据,还能给出论文的点击率、下载率等网上利用指数,为更加客观、公正、全面地评价一本期刊,一篇论文,一个学校,乃至一位学者,提供科学依据。  相似文献   

16.
中文图书采购招标评价指标体系的构建   总被引:2,自引:0,他引:2  
王金娜 《现代情报》2010,30(2):129-132
本文提出采用德尔菲法构建图书馆中文图书采购招标评价指标体系,利用层次分析法进行招标体系权重的设置。该指标体系的构建可以为中文图书采购招标的评价工作提供借鉴作用。  相似文献   

17.
程光 《现代情报》2009,29(6):216-218
海外华文文学近1个世纪的发展历史和国内外近30年以来对海外华文文学研究的繁荣,使海外华文文学作为一个独立的学科已然成型。相较于海外华文文学研究的发展和繁荣,国内海外华文文学资料的搜集工作略显滞后,至今尚未形成大规模的海外华文文学资料收藏单位。文章从历史和现状分析海外华文文学的发展,并据此提出搜集海外华文文学资料的5个渠道。  相似文献   

18.
The widespread availability of the Internet and the variety of Internet-based applications have resulted in a significant increase in the amount of web pages. Determining the behaviors of search engine users has become a critical step in enhancing search engine performance. Search engine user behaviors can be determined by content-based or content-ignorant algorithms. Although many content-ignorant studies have been performed to automatically identify new topics, previous results have demonstrated that spelling errors can cause significant errors in topic shift estimates. In this study, we focused on minimizing the number of wrong estimates that were based on spelling errors. We developed a new hybrid algorithm combining character n-gram and neural network methodologies, and compared the experimental results with results from previous studies. For the FAST and Excite datasets, the proposed algorithm improved topic shift estimates by 6.987% and 2.639%, respectively. Moreover, we analyzed the performance of the character n-gram method in different aspects including the comparison with Levenshtein edit-distance method. The experimental results demonstrated that the character n-gram method outperformed to the Levensthein edit distance method in terms of topic identification.  相似文献   

19.
王华栋  饶培伦 《情报科学》2007,25(1):108-112
中文分词的结果是影响搜索引擎中文检索结果质量的重要因素,能否准确有效的分词对提高搜索结果的相关性和用户满意度都至关重要。本文回顾和整理了中文分词评估所依靠的理论依据,同时建立了一套完整的基于搜索引擎中文分词评估方法。这套评估方法涵盖了评估样本的提取、评估人员选取、评估标准的制定、以及评估流程的设置等各个方面。实例分析的结果表明此方法是行之有效的。在此基础上,作者进一步对实验评估的结果进行了深入讨论,并提出了提高评估效果的几条建议,包括如何考虑评估人员背景、取舍评估项目等。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号