期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

全文获取类型

收费全文	164篇
免费	0篇
国内免费	7篇

专业分类

教育	84篇
科学研究	54篇
体育	1篇
综合类	1篇
信息传播	31篇

出版年

2024年	2篇
2023年	5篇
2021年	7篇
2020年	15篇
2019年	13篇
2018年	7篇
2017年	9篇
2016年	6篇
2015年	10篇
2014年	18篇
2013年	17篇
2012年	6篇
2011年	10篇
2010年	20篇
2009年	11篇
2008年	8篇
2007年	4篇
2006年	1篇
2005年	1篇
2002年	1篇

排序方式： 共有171条查询结果，搜索用时 126 毫秒

[首页] « 上一页 [2] [3] [4] [5] [6] 7 [8] [9] [10] [11] [12] 下一页 » 末页»

61.

基于Python的网络新闻爬虫与检索

陈欢黄勃刘文竹高永彬姜晓燕《教育技术导刊》2019,18(5):168-171

网络上存在众多新闻门户网站,新闻信息繁多,造成严重的新闻信息过载。针对该类问题,设计一个基于Python的网络新闻信息搜集与检索系统。该系统通过使用Scrapy网络爬虫框架进行网络新闻信息搜集,同时对新闻链接、标题进行去重,最后使用Slor检索服务对爬虫获得的新闻数据进行全文检索。与传统方法相比,该系统设计的去重方法在保证链接不重复的情况下,对标题进行去重,并引入Solr检索服务,可以帮助读者更快速地找到想要阅读的新闻。相似文献

62.

基于Chrome扩展的爬虫系统设计与实现

魏少鹏夏小玲《教育技术导刊》2016,15(3):76-80

为了提高网页数据抓取效率,降低爬虫对系统资源的消耗,提出了一种基于Chrome扩展的爬虫系统。利用Chrome浏览器对网页进行解析,防止被爬取对象屏蔽和网页异步加载问题,并且实现数据结构化;通过选择普通用户版〖JP〗扩展和服务器版扩展,既可以实现无人值守主动抓取,也可以在用户浏览网页的同时抓取信息。整个系统前后端分离,并且采用面向接口编程,具有良好的扩展性。通过从搜达足球网站抓取英超赛程,验证了程序的高效可行性。相似文献

63.

基于Heritrix的增量式网络爬虫研究

张皓周学广《教育技术导刊》2013,12(11):135-137

通过分析开源网络爬虫Heritrix的工作原理及架构,针对Heritrix开源爬虫只能对全网站进行通爬的特点,对Heritrix进行改进,增加了基于Hash算法的增量式抓取模块。实验表明,改进的Heritrix能够有效实现对网页的增量式抓取。相似文献

64.

基于Lucene的农业类搜索引擎关键技术研究

石曼银《信息系统工程》2013,(9):39-41,46

随着互联网技术的飞速发展,农业类信息迅速充斥在互联网的各大网站,涉及到农林牧渔等各个领域的农业网站已近2万多个,然而对急需农业信息的部门、企业以及个人来说,农业信息的获取还是比较困难。信息的海量化与检索的困难化成为一对日益突出的矛盾,本文围绕这一对矛盾,对农业类搜索引擎包含的关键技术进行了研究。相似文献

65.

基于RoadRunner算法的RESTful Web服务信息收集研究

季红梅张轶昀《宜春学院学报》2013,35(3):37-41

在服务组合不断发展的大背景下,新生代RESTful Web服务逐渐展示出其优越的性能从而迅速占领大量服务组合份额。与此同时,由于其自身设计特点,RESTful Web服务没有类似UDDI的注册检索中心,也没有合适的描述语言。各大网站通常以开放平台的方式各自为营,使API信息难于机器检索,为更大范围的服务组合带来了困难。为了解决这个问题,这里探索了一种使用聚焦爬虫收集RESTful Web服务API信息以提供统一的集中检索服务的思路,使用RoadRunner算法设计并实现了一个聚焦爬虫,从概念上验证了这个思路的可行性。相似文献

66.

基于关键词过滤与结构化输出的网络爬虫系统设

金鲁峰邰剑秋张旭《中国传媒科技》2012,(7):54-56

通过对开源网络爬虫Heritrix的系统构架进行改进,设计基于关键词过滤的主题网络爬虫,并提供一种配置手段利用HTMLParser技术对抽取内容进行结构化分解。实验结果表明,这种对Heritrix改进从而实现的网络爬虫,能够有效地按关键词过滤信息内容,并对信息主体进行了结构化存储。相似文献

67.

基于微信小程序的云班课管理系统设计

吕焰尧《教育技术导刊》2009,8(11):141-145

为了让教育不再受到时间和空间限制,同时让教学模式更加多样化,互联网与教育开始进行跨界融合,通过信息技术改变教育行业的教学方式及管理模式。设计一个基于微信小程序的云班课管理系统,前端使用JavaScript进行开发,后台使用node.js编写云函数,从而保证信息的安全性。利用Python的Scrapy框架编写爬虫代码,并将其架设在阿里云服务器上实现网络爬虫技术,采用环信的WebSocket实现即时通讯的聊天室功能。利用该小程序进行单元测试,100道测试题只需3s即能显示分数及错题详情。利用微信小程序搭建的学习平台为高校师生创建了一个线上与线下相结合的学习和教学环境,从而让师生不再受到时间与空间限制,因此有着广阔的发展前景。相似文献

68.

一种网络爬虫的带缓存非阻塞异步域名解析器模型及其性能分析

陈言颜晨阳《教育技术导刊》2009,8(11):143-146

网络爬虫是搜索引擎的一个基本组件,网络爬虫抓取页面的效率直接影响搜索引擎提供的服务质量。除了可以通过改进网络爬虫的爬行策略来提高网络爬虫效率之外,也可以通过优化网络爬虫程序某方面的设计来消除特定的效率瓶颈。通过对网络爬虫结构和实际运行数据的分析,针对爬虫的DNS解析瓶颈,设计了一种带缓存异步域名解析器模型,并通过实验和一般DNS解析器模型进行了比较,实验结果证明这种模型对于减少程序等待解析域名的这一操作时间十分有效,显然也能够提高爬虫的整体效率。相似文献

69.

一种网络爬虫的带缓存非阻塞异步域名解析器模型及其性能分析

陈言颜晨阳《人天科学研究》2009,(11)

70.

基于遗传算法的主题信息搜索系统研究 总被引：1，自引：0，他引：1

罗长寿康丽刘国靖《现代情报》2009,29(3):176-178

针对网络信息资源“迷向”与“过载”的现象,本文通过对遗传算法的分析应用,构建了由基于遗传算法的主题爬虫、信息处理和查询服务三部分组成的主题信息搜索系统。实验结果表明,应用该系统可以获取与主题相关度高的网页信息。相似文献

[首页] « 上一页 [2] [3] [4] [5] [6] 7 [8] [9] [10] [11] [12] 下一页 » 末页»