排序方式: 共有171条查询结果,搜索用时 15 毫秒
21.
22.
24.
基于主题爬虫的本体非分类关系学习框架 总被引:1,自引:0,他引:1
25.
在大数据和移动互联网的时代背景下,舆情信息的迅猛增长为其采集与分析带来挑战。运用分布式计算技术,有利于对领域海量主题舆情的快速采集与分析。研究主题舆情采集与分析关键技术,包括主题舆情采集技术、领域词典和中文分词,探讨分布式计算环境下的主题舆情采集与舆情数据分析,并利用面向对象的分析与设计方法,基于开源爬虫设计并实现了一个分布式主题舆情采集与分析系统。利用4个爬虫节点进行分布式采集,相比传统采集模式,该系统的平均采集速度提升了2.74倍。 相似文献
26.
概述了语义网和网络爬虫的基本概念和工作原理,分析了语义网爬虫的现状,提出和总结了语义网专题搜索算法的实现。 相似文献
27.
爬虫系统,被广泛应用于计算机各个领域,对于爬虫系统的研究和改进从来没有停止过。目前对于爬虫系统研究最关注的自然是爬虫系统的效率问题,如何才能够提升爬虫系统的效率,是我们目前为止研究的一个大方向。我们的研究从解剖爬虫系统开始。爬虫系统包括运行机理,构架以及算法组成,要想提升爬虫系统的效率,我们就必须优化它的构架,改进相关算法,针对爬虫系统进行一个全面的优化,从而达到提升爬虫系统效率的目的。在Linux网络环境之下,我们为了提高爬虫系统对页面的抓取效率和爬虫程序的完整性能,我们进行了反复的实验,结果表明,我们的解决方案的确有可行之处。 相似文献
28.
程序设计类课程是计算机专业基础课程,也是非计算机本科的基础选修课程。通过分析语言教学现状,针对传统程序设计课程中学生参与度不高的问题,提出基于项目驱动的团队协作教学模式。课堂教学以网络爬虫系统设计为模拟项目,通过改变语言教学体系,不仅激发了学生学习兴趣,而且提高了学习效果,有效培养了学生的计算思维与综合协作能力,使学生课堂参与度接近90%。 相似文献
29.
30.
搜索引擎技术随着互联网的日益壮大而飞速发展。作为搜索引擎不可或缺的组成部分,网络爬虫的作用显得尤为重要,它的性能直接决定了在庞大的互联网上进行网页信息采集的质量。设计并实现了通用爬虫和限定爬虫。 相似文献