排序方式: 共有167条查询结果,搜索用时 15 毫秒
3.
4.
5.
齐虎春 《内蒙古科技与经济》2020,(13)
介绍了网络爬虫技术的运行原理,分析了作为搜索引擎核心技术的通用网络爬虫的搜索策略,进而实现了采用两种搜索策略的网络爬虫,并在互联网中进行了信息爬取,最后比较总结了两种搜索策略的技术特点及优化研究方向。 相似文献
6.
基于本体的网络爬虫技术研究 总被引:1,自引:0,他引:1
互联网已经成为最大的非结构化数据库,极大方便了信息访问.然而,网络上的信息大多都是无组织的,由于网络的分布式特性,很难对它进行信息和知识管理.因此,如何建立一个智能的信息发现机制很有必要.本文在分析了爬虫工作原理和传统算法后,提出了一种基于本体的网络爬虫的信息发现框架.该框架包含了预处理模块和本体管理模块,定义了网页相关度计算策略,最后通过实验对该框架进行了评估. 相似文献
7.
8.
秦学勇 《廊坊师范学院学报(自然科学版)》2011,11(2)
针对如何有效获取和管理互联网资源,提出一种解决方案.首先,通过使用主题爬虫获取互联网相关学科主题资源,然后,用本体来表示和管理信息.该方案能够完成本体的构建、学习功能,可以较好地满足用户的信息检索需求. 相似文献
9.
随着我国互联网的飞速发展,特别是以SNS、微博为代表的Web2.0应用的兴起,已经形成了一个虚拟信息社会,并逐步演化为一个全新的开放信息传播空间。信息传播更为便捷,为网络舆情的产生提供了现实环境基础。同时,我国正处于机制转轨、社会转型的过程中,各类群体性事件的不断发生,且呈现出线上线下的联动的特点,对社会、经济的稳定与发展都产生了不良影响。本文在论述由网络群体性事件及其研究现状的基础上,对基于主题爬虫的网络群体性事件的源信息获取的框架进行了深入探讨,为舆情治理提供重要依据。 相似文献
10.