首页 | 本学科首页   官方微博 | 高级检索  
文章检索
  按 检索   检索词:      
出版年份:   被引次数:   他引次数: 提示:输入*表示无穷大
  收费全文   164篇
  免费   0篇
  国内免费   7篇
教育   84篇
科学研究   54篇
体育   1篇
综合类   1篇
信息传播   31篇
  2024年   2篇
  2023年   5篇
  2021年   7篇
  2020年   15篇
  2019年   13篇
  2018年   7篇
  2017年   9篇
  2016年   6篇
  2015年   10篇
  2014年   18篇
  2013年   17篇
  2012年   6篇
  2011年   10篇
  2010年   20篇
  2009年   11篇
  2008年   8篇
  2007年   4篇
  2006年   1篇
  2005年   1篇
  2002年   1篇
排序方式: 共有171条查询结果,搜索用时 15 毫秒
21.
搜索引擎研究新技术   总被引:2,自引:0,他引:2  
介绍了近期两类国内搜索引擎技术的研究状况:爬虫系统性能优化技术研究及高级文件搜索引擎核心技术研究。爬虫系统性能优化侧重于:对爬行方式的优化实现海量信息源的高效索引;对URL数据库存取算法的优化提高用户检索的响应速度。高级文件搜索引擎研究是通过对字符串匹配的扩展、属性过滤的扩展、查询结果优化排序、输出结果的优化选择等7种核心技术的有效结合,丰富了文件搜引擎的功能。  相似文献   
22.
以开源网络爬虫Heritrix为基础,阐述其工作原理和架构。根据渔业信息词库建立索引,提出一种基于Heritrix的定题爬虫算法,根据链接和内容对网页进行过滤,并构建了渔业信息网络爬虫FishInfoCrawler,经实验表明,本算法能完成渔业信息领域相关网页的抓取。  相似文献   
23.
六脚爬虫     
对那些仅仅是样子好看的“花瓶”概念车感到审美疲劳了?来看看这个有真才实干的家伙。  相似文献   
24.
基于主题爬虫的本体非分类关系学习框架   总被引:1,自引:0,他引:1  
乔建忠 《图书情报工作》2010,54(18):120-129
提出一种借助主题爬虫自动从返回的相关网页进行本体非分类关系学习的框架与方法。针对利用互联网进行本体学习的特点,所用到的主要方法是词频、共现统计和分割聚类算法KMeans,并没有采用复杂的语法结构分析和半指导聚类算法如EM、BIRCH和SOM,因此自动化程度和效率较高。学习结果将用于指导主题爬虫进行网页相关性的判断。这种非分类关系的学习质量将由主题爬虫在实际应用中的表现来客观评价。  相似文献   
25.
在大数据和移动互联网的时代背景下,舆情信息的迅猛增长为其采集与分析带来挑战。运用分布式计算技术,有利于对领域海量主题舆情的快速采集与分析。研究主题舆情采集与分析关键技术,包括主题舆情采集技术、领域词典和中文分词,探讨分布式计算环境下的主题舆情采集与舆情数据分析,并利用面向对象的分析与设计方法,基于开源爬虫设计并实现了一个分布式主题舆情采集与分析系统。利用4个爬虫节点进行分布式采集,相比传统采集模式,该系统的平均采集速度提升了2.74倍。  相似文献   
26.
概述了语义网和网络爬虫的基本概念和工作原理,分析了语义网爬虫的现状,提出和总结了语义网专题搜索算法的实现。  相似文献   
27.
爬虫系统,被广泛应用于计算机各个领域,对于爬虫系统的研究和改进从来没有停止过。目前对于爬虫系统研究最关注的自然是爬虫系统的效率问题,如何才能够提升爬虫系统的效率,是我们目前为止研究的一个大方向。我们的研究从解剖爬虫系统开始。爬虫系统包括运行机理,构架以及算法组成,要想提升爬虫系统的效率,我们就必须优化它的构架,改进相关算法,针对爬虫系统进行一个全面的优化,从而达到提升爬虫系统效率的目的。在Linux网络环境之下,我们为了提高爬虫系统对页面的抓取效率和爬虫程序的完整性能,我们进行了反复的实验,结果表明,我们的解决方案的确有可行之处。  相似文献   
28.
程序设计类课程是计算机专业基础课程,也是非计算机本科的基础选修课程。通过分析语言教学现状,针对传统程序设计课程中学生参与度不高的问题,提出基于项目驱动的团队协作教学模式。课堂教学以网络爬虫系统设计为模拟项目,通过改变语言教学体系,不仅激发了学生学习兴趣,而且提高了学习效果,有效培养了学生的计算思维与综合协作能力,使学生课堂参与度接近90%。  相似文献   
29.
通过对开源网络爬虫Heritrix的系统构架进行改进,设计基于关键词过滤的主题网络爬虫,并提供一种配置手段利用HTMLParser技术对抽取内容进行结构化分解。实验结果表明,这种对Heritrix改进从而实现的网络爬虫,能够有效地按关键词过滤信息内容,并对信息主体进行了结构化存储。  相似文献   
30.
搜索引擎技术随着互联网的日益壮大而飞速发展。作为搜索引擎不可或缺的组成部分,网络爬虫的作用显得尤为重要,它的性能直接决定了在庞大的互联网上进行网页信息采集的质量。设计并实现了通用爬虫和限定爬虫。  相似文献   
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号