首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 250 毫秒
1.
随着互联网应用的广泛普及,互联网承载的网络数据信息呈爆炸式增长,为了实现对海量的、繁杂的、无序的网络信息数据资源进行智能分析、存储和管理,针对网络海量数据信息高度异构的特点,分析了海量网络数据存储系统体系结构,提出一种基于云计算的网络数据的存储管理系统。运行表明,系统能够高效完成海量数据的管理和分析任务,效率高,系统安全可靠、易维护、具有良好的可扩展性。  相似文献   

2.
在互联网普及的今天,人们获得信息的途径以及数量是前所未有的.面对如此庞大的信息,如何选择变得至关重要.故此,网络话题发现技术应运而生.通过该技术,将海量的网络信息按照具体的话题进行归类,既方便了人们获取信息,又大大提高了准确性.  相似文献   

3.
随着计算机网络技术的飞速发展,尤其是互联网的应用变得越来越广泛,在带来了前所未有的海量信息的同时,网络的开放性和自由性也产生了私有信息和数据被破坏或侵犯的可能性,网络信息的安全性变得日益重要起来,已被信息社会的各个领域所重视.  相似文献   

4.
随着信息技术的不断发展,互联网上的数据类型越来越多,信息量以几何级增长,庞大的数据给人们的生活带来便利的同时也给信息的查找带来了巨大的挑战。搜索引擎的通用网络爬虫越来越难以胜任越来越大规模的数据抓取任务。本文设计了一个分布式架构的主题网络爬虫,能快速、准确、稳定的抓取特定领域的信息。  相似文献   

5.
随着互联网的不断发展,网络信息量迅猛增加,面对海量杂乱无章的信息,用户很难从中快速搜寻到所关注的有用信息。将海量信息进行数据采集、预处理、清洗、分析,最后将分析结果以图表展示,使用户可以获得直观的信息分布十分必要。基于以上需求,本文以新闻数据为研究对象,通过采集器采集数据,数据预处理,并行框架的数据清洗,对数据结果进行分析,并将处理分析的结果以可视化形式来展示新闻信息热点分布状况,使用户高效快捷地了解社会信息焦点状况。  相似文献   

6.
基于主题偏好的个性化检索模型研究   总被引:1,自引:0,他引:1  
随着互联网信息资源日益增多,个性化检索成为了信息检索领域的研究热点.传统的个性化检索利用网页内容形成的向量空间模型来描述用户兴趣,使得用户的查询响应较慢,修正用户兴趣计算量大.由此提出基于主题偏好的个性化检索模型,用户兴趣由用户的主题偏好来表示,结合主题敏感的PageRank算法对检索结果排序.旨在更好地体现用户兴趣,并简化计算,减少查询响应时间.  相似文献   

7.
针对加强计算机网络安全隐患防范措施之探析   总被引:1,自引:0,他引:1  
随着计算机网络技术的飞速发展,尤其是互联网的应用变得越来越广泛,在带来了前所未有的海量信息的同时,网络的开放性和自由性业产生了私有信息和数据被破坏或侵犯的可能性,网络信息的安全性变得日益重要起来,已被信息社会的各个领域所重视.对目前计算机网络存在的安全隐患进行了分析,井探讨了针对计算机安全隐患的防范策略.  相似文献   

8.
网络爬虫软件的研究与开发   总被引:1,自引:0,他引:1  
作为一种快捷、高效访问网络海量数据的工具,通用搜索引擎自诞生以来备受人们喜爱。然而在设计上它却存在着很多不足,并且随着万维网的快速发展而日益不能满足人们的需求。基于这种背景,用于对网页进行定向抓取的主题爬虫应运而生。主题爬虫的设计理念是利用最少的资源,尽可能快而准确地抓取网络中用户关心的网页,目前已经有着非常广泛的应用。首先,了解主题爬虫提出的历史背景及当前国内外的发展状况,分析与主题爬虫设计相关的技术知识,如HTTP协议、HTML解析、中文分词等。其次,提出使用向量空间模型进行主题相关度计算。为了能够充分利用网页中丰富的启发式信息,综合运用了网页内容分析和网页链接分析技术。最后,基于对主题爬虫设计与实现方法的研究,使用Java开发一个多线程主题爬虫。  相似文献   

9.
杨志 《现代情报》2007,27(9):134-137
随着网络信息量的急剧增长,人们习惯运用各种搜索引擎在海量互联网信息资源中来查找所需的信息,但查寻的结果往往不尽人意。本文通过利用不同主题范围的检索词在中英文搜索引擎检索的结果,对元数据标签Keywords在网页中的应用情况进行了调查和分析。并就提高搜索引擎的检索效率提出自己的一些建议。  相似文献   

10.
现代计算机技术和互联网的飞速发展,信息资源已成为网络化.如何从海量的网络信息中检索到所需的有用信息是信息时代科技人员必须掌握的技能.本文介绍了一些常用的网络科技信息的检索方法和网络数据库.  相似文献   

11.
从明确主题涵义、重视信息筛选、加强信息理解、学会信息归纳几方面来阐述,就如何在网络主题研究教学中培养学生网络信息分析和处理能力进行探究。  相似文献   

12.
在互联网信息资源大爆炸时代,作为信息资源整合的重要集散地,高职院校中包含着复杂纷繁的海量数据。因此,为了充分利用高职院校中的信息资源并实现资源共享,利用大数据技术挖掘高质量的数据信息,结合泛在网络通信技术搭建高职院校信息资源平台,是信息时代亟需解决的问题。  相似文献   

13.
网络的发展加速了数据交流,信息爆炸迎来大数据存储时代的到来,互联网已成为当下人们生活的重要组成部分。互联网的大环境下,需要处理海量信息,给信息处理技术提出了更高的要求。本文从"大数据"时代的相关知识描述入手,详细叙述了"大数据"时代背景下的计算机处理技术,为促进"大数据"时代的信息处理效率提供理论参考。  相似文献   

14.
论网络信息资源组织方法   总被引:1,自引:0,他引:1  
全万 《情报探索》2004,(4):80-81
传统的图书馆对知识的研究和组织已无法解决人们面对海量信息资源检索和获取信息的需求。文章对图书馆在网络环境下的信息资源的采集方式、整合加工过程及分类法、主题法、分类主题一体化进行了论述。  相似文献   

15.
随着科技的迅猛发展,各个领域(如天文、金融、医疗、互联网等)都产生了海量的数据,大数据释放出的巨大价值,几乎给每个行业都带来了颠覆。其价值除了共享庞大的数据流信息外,还能从海量数据中提取所需数据并进行专业化分析,挖掘隐藏在数据下的潜在价值,给政府、企业、高校等各行各业在决策拟定时提供参考。通过介绍大数据的基本定义、现状并结合一些应用案例,试图增进对大数据的理解,分析大数据在各个领域发挥的关键作用,并展望大数据的发展趋势。  相似文献   

16.
张佳 《科技通报》2019,35(2):76-79,84
针对当前只关注对数字图书馆网络功能的提高,忽略了对信息扩散的问题。为此,通过关联规则方法对海量图书信息数据扩散进行研究,给出关联规则的基本概念,并介绍了数字图书馆网络的特征,将API与编写抓取程序、开放数据等技术结合在一起;利用Apriori算法通过层次顺序搜索的循环方法对图书信息数据频繁项集进行挖掘,采集数字图书馆网络中某用户粉丝、关注者、转发以及评论信息扩散数据;将关联规则作为研究海量图书信息数据扩散方法,通过关联规则衡量节点度和出入度;在此基础上通过关联规则对海量图书信息数据扩散情况进行研究,发现海量图书信息扩散有高低谷期;转发量和评论量呈一定的正相关性;数字图书馆网络中海量图书信息数据扩散的广度和用户影响力相关。  相似文献   

17.
国外主题网关服务的发展及启示   总被引:2,自引:0,他引:2  
王兰敬 《现代情报》2006,26(10):60-64
因特网中蕴藏着大量的学术信息资源.主题网关作为一种新型的网络学术信息资源发现工具,顺应了当今学术信息需求越来越趋向数字化、网络化、集成化和知识化的发展趋势,是网络信息资源组织和开发利用的有效手段.本文论述了主题网关的涵义,深刻分析了国外主题网关的发展状况和我国主题网关的现状,并在此基础上进一步阐述了国外主题网关的建设对我国主题网关服务的启示.  相似文献   

18.
[目的]从海量微博舆情信息中准确、高效地发现和挖掘当下的热点主题,以期为政府和企业监控和管理舆情动态提供有价值的参考。[方法]研究首先从维度、特征和度量三方面综合考虑构建"帖子-主题"二模网络模型,其次选择词频、主题权重和词频增长率3个特征来抽取模型所需的有效关键词,然后选取社会网络分析法中的社区发现方法进行基于关键词的主题社区发现,最后综合考虑用户影响力和传播影响力两个属性,通过热度分析确立主题热度,识别热点主题。[结果]实验表明,该方法能有效挖掘网络舆情中的热点主题,检测出的主题结果均正确,验证了本文方法的可行性和有效性。在此基础上,研究还选取实例进一步对主题的热度迁移和情感倾向进行了分析,具备一定的预警作用。  相似文献   

19.
针对目前的互联网媒体深度信息分析方法忽略了用户之间的相关关系和相互影响,导致分析结果不够精确的问题,针对互联网媒体的海量数据,提出了一种兴趣偏移校正的互联网媒体深度信息分析模型。首先分析社交网络环境下用户兴趣多元化的特点,结合用户受其它成员的影响而发生的兴趣偏移的情况来建立用户兴趣模型,然后再结合用户社区兴趣最终得到完整的用户兴趣模型。实例仿真实验结果表明,结合评价指标发现,该方法在深度信息分析结果中具有很好的性能。  相似文献   

20.
现如今随着计算机网络技术的飞速发展,尤其是互联网的应用变得越来越广泛。在带来了海量信息的同时,网络的开放性和自由性也产生了个人私有信息和数据被破坏或侵犯的可能性。网络信息的安全性变得越来越重要,这一问题已经被信息社会的各个领域所重视。该文对目前计算机网络存在的安全隐患进行了分析,并探讨了针对计算机安全隐患的防范策略。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号