期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

蒲筱哥《现代情报》2007,27(10):215-219

本文在讨论Web信息抽取技术的发展历程、概念及其功能，Web信息抽取技术方法的分类及技术特点分析。Web信息抽取系统的构建研究及其性能评价的基础上。分析了当前研究存在的问题以及未来的研究方向。相似文献

2.

詹沐清卢荣华《中国科技信息》2012,(24):80-81

Web抽取技术是众多对网络信息资源挖掘中重要的一项技术。近年来,Web抽取技术发展很快,已渗透至各个领域,应用到很多行业,但真正涉及陶瓷产品应用这一块的不多,本文在分析了Web抽取技术现阶段发展现状的基础上,针对陶瓷产品的特点提出了陶瓷产品信息Web抽取的技术路线,以便获得和整理陶瓷产品信息,规范陶瓷产品的信息资源。相似文献

3.

基于.NET的Web信息抽取系统关键技术研究

谭锋李天真崔亮亮《人天科学研究》2010,(12):120-122

随着Web信息抽取的研究和发展,抽取技术已经逐渐成熟,通过软件来实现从Web页中抽取所需要的信息已成为可能。对基于.NET技术实现的Web信息抽取系统进行了研究,分析并提出了HTML文档下载和清理、HTML到XML格式转换、数据定位及抽取、抽取数据的保存等需要研究解决的关键技术问题,并探讨了相应的解决方案。相似文献

4.

一种基于XML的Web信息抽取方法 总被引：4，自引：2，他引：4

李剑波李小华董树明杨科华《情报杂志》2006,25(8):49-51

目前Web资源含有大量的有用信息,但由于它们欠结构化,不能为传统的数据库型查询系统所利用。针对这一问题,出现了Web信息抽取技术。在论述了半结构化Web信息抽取技术总体解决方案的基础上,研究了Web信息抽取的实现技术,并从应用的角度提出一种新的半结构化信息获取方法。该方法包括网页分析过程、映射的自动生成和信息抽取过程。在Web信息抽取的实现部分,提出了抽取规则执行算法,为进一步满足Web信息检索提供了一种新的高效的检索方法。相似文献

5.

浅谈基于XML的web页面信息抽取方法的设计和实现

张小莉夏冉姚建民《科技风》2008,(1)

通过首先对当前信息抽取技术和现有的XML技术进行分析与研究,发现如何有效地确定抽取规则是当前Web信息抽取的主要难点。针对目前存在的问题,给出了一种基于XML的Web信息抽取的解决方案,并对其中相关的技术进行了深入的探讨和研究。相似文献

6.

Web时态信息抽取与检索研究

赵洁金培权《情报理论与实践》2009,32(2)

时态信息抽取和检索是Web领域中时态信息处理的两个关键问题.本文首先分析了时态信息对于Web应用的意义,然后对Web领域中时态信息抽取和检索的相关现状进行了深入讨论.在此基础上讨论了Web时态信息的本体表示问题.最后,预测了Web时态信息抽取与检索的若干未来发展方向. 相似文献

7.

基于模式匹配抽取技术的网上产品情报获取 总被引：1，自引：0，他引：1

马静倪辉峰《情报理论与实践》2007,30(2):228-231

产品生命周期的逐渐缩短迫使企业关注从因特网上大量、散乱的信息中及时获取新产品信息,跟踪竞争对手研发动向。本文引入基于模式匹配的自动Web信息抽取技术,叙述抽取产品的关键信息方法,并以家用冰箱性能参数信息的自动抽取为例,分析了冰箱领域知识,进行了样本页面的分析归纳,确认了冰箱产品的多种属性及产品信息抽取的模式特征,最终获得了清晰、结构化的产品数据,形成从Web页面上抽取同类产品关键信息的整个处理流程模型,成为网络环境下情报采集与分析的新情报研究模式的一个有力探索。相似文献

8.

信息抽取系统在高校数字图书馆的应用

王凯王辉渠芳《现代情报》2006,26(4):86-88

分析高校数字图书馆信息资源分布状况，提出异构资源整合的解决方法——信息抽取技术。本文介绍了一种借助于JTIDY转换和JDOM解析工具的Web信息抽取方法，讨论信息抽取技术的功能、组成、特点、实现和原则问题。相似文献

9.

文本挖掘在Web中的技术分析 总被引：1，自引：0，他引：1

倪现君《中国科技信息》2006,(3):23-24

根据调查,各领域的信息存储约有80%包含在文本文档中,文本挖掘因此也被认为比数据挖掘具有更高的商业潜力。作为从浩瀚的Web信息资源中发现潜在的、有价值知识的一种有效技术,Web领域的挖掘技术正悄然兴起,备受关注。本文重点阐述文本挖掘在Web中对信息抽取、挖掘过程及超文本挖掘技术的分析及应用。相似文献

10.

浅谈web信息抽取

李斌《大众科技》2010,(4):48-49

文章阐述了web信息抽取的定义、抽取过程、Web信息抽取方法的分类,并指明了web信息抽取的应用领域和发展方向。相似文献

11.

基于领域本体的Web信息抽取模型研究

岳国伟吕楠申玉三《情报探索》2012,(1):105-107

分析了信息抽取的研究现状,提出了一种基于领域本体的Web信息抽取模型,对模型中的各部分功能进行了简要说明,明确了信息抽取的系统流程,提高了信息抽取效率。相似文献

12.

基于HTML或MXL描述的Web页信息抽取技术研究 总被引：1，自引：0，他引：1

谢维成吕先竞宋玉忠《情报科学》2005,23(9):1398-1402

从同类企业挖掘有价值的信息是企业信息化的重要任务,目前Web企业信息描述大多数是用HTML表示的,但基于XML描述的企业信息Web页面逐渐增加,Web数据抽取是Web企业信息挖掘的关键,本文提出了一种面向HTML和XML描述的Web页面的Web数据抽取模型并阐述了实现过程。相似文献

13.

基于SVM的Web信息抽取研究

郭东峰《黑龙江科技信息》2013,(18):153-153

阐述了针对中小型企业供需信息自动化Web信息抽取技术的研究。自动化是指不需要人工标注网页抽取规则学习样本,系统能够从不同的求购信息网站的网页里自动获取相应的信息抽取规则,通过引入领域特征来净化抽取到文本字段而获得较高的查准率。相似文献

14.

Web页面列表信息的自主抽取

侯锟罗海龙《科技广场》2007,22(3):117-118

本文研究了对于Web页面列表信息的抽取方法。通过对超文本文档特征的分析获取抽取知识,并通过自学习适应页面的变化,实现了对于列表信息的抽取。相似文献

15.

一种基于视觉分块的Web信息抽取方法研究 总被引：1，自引：0，他引：1

耿焕同宋庆席何宏强《情报理论与实践》2009,32(3)

随着浏览器/服务器体系结构和动态网页技术的广泛应用,对网页进行快速、准确地信息抽取的技术研究已成为一个热点.结合动态网页的生成特点和针对已有抽取方法的不足,提出了一种基于视觉分块的Web信息抽取方法. 相似文献

16.

学术网络空间的主题发现与信息组织研究的力作 ——评《学术Web主题结构挖掘研究》

刘志辉《情报探索》2020,(6):132-134

[目的/意义]对社会科学视角下Web主题结构挖掘研究的最新著作进行述评。[方法/过程]从数据采集技术、主题信息抽取和专题Web信息资源组织等方面,介绍了《学术Web主题结构挖掘研究》一书的核心内容,并点评了其主要研究贡献。[结果/结论]该书为宏观Web主题结构分析研究提供了系统化的解决方案,是近年来这一研究方向为数不多的专著。相似文献

17.

基于Web挖掘的商业信息抽取研究

廖开际易聪《情报杂志》2010,29(5)

Web商业信息普遍存在互联网HTML文件中,使用传统手工方法来收集这些信息存在很大的局限性,针对Web上存在的大量商业信息,基于Web挖掘技术,提出了使用正则表达式来收集大规模Web商业信息.实现方式是首先获取网页源文件,接着使用设计好的正则表达式对源文件进行编译,从而抽取其中的Web商业信息.实验表明,这种方法抽取的准确率达到93%以上. 相似文献

18.

基于Web资源的信息抽取技术 总被引：7，自引：0，他引：7

郭志红《情报科学》2002,20(12):1282-1284

Web资源含有大量的有用信息，但由于它们欠结构化，不能为传统的数据库型查询系统所利用。如何将这些信息抽取出来，转化成结构化信息供其它信息集成系统所利用，成为该领域的研究热点。本文介绍了一个简单的Web信息抽取模型，对于基于该模型的wrapper归纳技术进行了探讨，并描述了一个wrapper自动生成系统的原型。相似文献

19.

基于XML的无监督数据抽取研究

郭东峰《黑龙江科技信息》2013,(17):140-140

本文阐述了利用XML将半结构化Web数据转化为结构化的XML数据,介绍了目前Web数据抽取的最新技术及特点,并对无监督学习网页重复模式发现网页内在模板抽取方法进行了深入的研究和探讨。相似文献

20.

基于Web2.0的数字图书馆信息服务研究

裴佩《内蒙古科技与经济》2011,(7):70-72

明确了Web2.0和数字图书馆的定义及内涵,分析了数字图书馆信息服务的模式结构及对数字图书馆信息服务的影响,探讨了Web2.0技术在数字图书馆信息服务中的应用及其对信息服务的深远意义。相似文献