首页 | 本学科首页   官方微博 | 高级检索  
文章检索
  按 检索   检索词:      
出版年份:   被引次数:   他引次数: 提示:输入*表示无穷大
  收费全文   160篇
  免费   0篇
  国内免费   7篇
教育   81篇
科学研究   54篇
体育   1篇
综合类   1篇
信息传播   30篇
  2024年   1篇
  2023年   4篇
  2021年   5篇
  2020年   15篇
  2019年   13篇
  2018年   7篇
  2017年   9篇
  2016年   6篇
  2015年   10篇
  2014年   18篇
  2013年   17篇
  2012年   6篇
  2011年   10篇
  2010年   20篇
  2009年   11篇
  2008年   8篇
  2007年   4篇
  2006年   1篇
  2005年   1篇
  2002年   1篇
排序方式: 共有167条查询结果,搜索用时 15 毫秒
1.
2.
六脚爬虫     
对那些仅仅是样子好看的“花瓶”概念车感到审美疲劳了?来看看这个有真才实干的家伙。  相似文献   
3.
以开源网络爬虫Heritrix为基础,阐述其工作原理和架构。根据渔业信息词库建立索引,提出一种基于Heritrix的定题爬虫算法,根据链接和内容对网页进行过滤,并构建了渔业信息网络爬虫FishInfoCrawler,经实验表明,本算法能完成渔业信息领域相关网页的抓取。  相似文献   
4.
《宜宾学院学报》2019,(6):42-46
爬虫获取数据时,由于获取速度过快易被网页反爬虫机制拦截,需要一种规避网页反爬虫的机制.结合目前反爬虫常用的手段,提出了一种反反爬虫机制.首先找到需要进行网页数据爬取的url,在不使用任何反反爬虫机制的情况下观察爬虫程序被拦截的次数,然后针对目标网页反爬虫机制,设计出一种反反爬虫机制.实验结果表明,通过设置随机抽取useragent和随机IP,跟踪目标网页referer,禁用cookies的反反爬机制,可以规避反爬虫的阻挠,使爬虫爬取到目标网页数量增加,成功率和效率都有所提高.  相似文献   
5.
介绍了网络爬虫技术的运行原理,分析了作为搜索引擎核心技术的通用网络爬虫的搜索策略,进而实现了采用两种搜索策略的网络爬虫,并在互联网中进行了信息爬取,最后比较总结了两种搜索策略的技术特点及优化研究方向。  相似文献   
6.
基于本体的网络爬虫技术研究   总被引:1,自引:0,他引:1  
杨学明  刘柏嵩 《情报学报》2007,26(5):723-727
互联网已经成为最大的非结构化数据库,极大方便了信息访问.然而,网络上的信息大多都是无组织的,由于网络的分布式特性,很难对它进行信息和知识管理.因此,如何建立一个智能的信息发现机制很有必要.本文在分析了爬虫工作原理和传统算法后,提出了一种基于本体的网络爬虫的信息发现框架.该框架包含了预处理模块和本体管理模块,定义了网页相关度计算策略,最后通过实验对该框架进行了评估.  相似文献   
7.
8.
针对如何有效获取和管理互联网资源,提出一种解决方案.首先,通过使用主题爬虫获取互联网相关学科主题资源,然后,用本体来表示和管理信息.该方案能够完成本体的构建、学习功能,可以较好地满足用户的信息检索需求.  相似文献   
9.
殷聪  黄炜 《现代情报》2012,32(7):173-177
随着我国互联网的飞速发展,特别是以SNS、微博为代表的Web2.0应用的兴起,已经形成了一个虚拟信息社会,并逐步演化为一个全新的开放信息传播空间。信息传播更为便捷,为网络舆情的产生提供了现实环境基础。同时,我国正处于机制转轨、社会转型的过程中,各类群体性事件的不断发生,且呈现出线上线下的联动的特点,对社会、经济的稳定与发展都产生了不良影响。本文在论述由网络群体性事件及其研究现状的基础上,对基于主题爬虫的网络群体性事件的源信息获取的框架进行了深入探讨,为舆情治理提供重要依据。  相似文献   
10.
针对网上招聘信息查找中存在的信息不全面和针对性不强的问题,设计一个招聘信息采集与搜索系统。该系统利用开源工具HttpClient从各公司招聘主页上爬取招聘信息,确保了招聘信息的全面性;基于启发式规则,筛选出各公司招聘信息的详情页面,保证信息的针对性。测试结果表明,系统能提升招聘信息搜索的全面性,并且可以很好地满足用户对搜索结果准确率的要求。  相似文献   
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号