共查询到20条相似文献,搜索用时 31 毫秒
1.
基于Web的信息抽取技术研究综述 总被引:1,自引:0,他引:1
本文在讨论Web信息抽取技术的发展历程、概念及其功能,Web信息抽取技术方法的分类及技术特点分析。Web信息抽取系统的构建研究及其性能评价的基础上。分析了当前研究存在的问题以及未来的研究方向。 相似文献
2.
Web抽取技术是众多对网络信息资源挖掘中重要的一项技术。近年来,Web抽取技术发展很快,已渗透至各个领域,应用到很多行业,但真正涉及陶瓷产品应用这一块的不多,本文在分析了Web抽取技术现阶段发展现状的基础上,针对陶瓷产品的特点提出了陶瓷产品信息Web抽取的技术路线,以便获得和整理陶瓷产品信息,规范陶瓷产品的信息资源。 相似文献
3.
4.
5.
6.
时态信息抽取和检索是Web领域中时态信息处理的两个关键问题.本文首先分析了时态信息对于Web应用的意义,然后对Web领域中时态信息抽取和检索的相关现状进行了深入讨论.在此基础上讨论了Web时态信息的本体表示问题.最后,预测了Web时态信息抽取与检索的若干未来发展方向. 相似文献
7.
基于模式匹配抽取技术的网上产品情报获取 总被引:1,自引:0,他引:1
产品生命周期的逐渐缩短迫使企业关注从因特网上大量、散乱的信息中及时获取新产品信息,跟踪竞争对手研发动向。本文引入基于模式匹配的自动Web信息抽取技术,叙述抽取产品的关键信息方法,并以家用冰箱性能参数信息的自动抽取为例,分析了冰箱领域知识,进行了样本页面的分析归纳,确认了冰箱产品的多种属性及产品信息抽取的模式特征,最终获得了清晰、结构化的产品数据,形成从Web页面上抽取同类产品关键信息的整个处理流程模型,成为网络环境下情报采集与分析的新情报研究模式的一个有力探索。 相似文献
8.
9.
文本挖掘在Web中的技术分析 总被引:1,自引:0,他引:1
根据调查,各领域的信息存储约有80%包含在文本文档中,文本挖掘因此也被认为比数据挖掘具有更高的商业潜力。作为从浩瀚的Web信息资源中发现潜在的、有价值知识的一种有效技术,Web领域的挖掘技术正悄然兴起,备受关注。本文重点阐述文本挖掘在Web中对信息抽取、挖掘过程及超文本挖掘技术的分析及应用。 相似文献
11.
12.
13.
阐述了针对中小型企业供需信息自动化Web信息抽取技术的研究。自动化是指不需要人工标注网页抽取规则学习样本,系统能够从不同的求购信息网站的网页里自动获取相应的信息抽取规则,通过引入领域特征来净化抽取到文本字段而获得较高的查准率。 相似文献
14.
本文研究了对于Web页面列表信息的抽取方法。通过对超文本文档特征的分析获取抽取知识,并通过自学习适应页面的变化,实现了对于列表信息的抽取。 相似文献
15.
16.
[目的/意义]对社会科学视角下Web主题结构挖掘研究的最新著作进行述评。[方法/过程]从数据采集技术、主题信息抽取和专题Web信息资源组织等方面,介绍了《学术Web主题结构挖掘研究》一书的核心内容,并点评了其主要研究贡献。[结果/结论]该书为宏观Web主题结构分析研究提供了系统化的解决方案,是近年来这一研究方向为数不多的专著。 相似文献
17.
Web商业信息普遍存在互联网HTML文件中,使用传统手工方法来收集这些信息存在很大的局限性,针对Web上存在的大量商业信息,基于Web挖掘技术,提出了使用正则表达式来收集大规模Web商业信息.实现方式是首先获取网页源文件,接着使用设计好的正则表达式对源文件进行编译,从而抽取其中的Web商业信息.实验表明,这种方法抽取的准确率达到93%以上. 相似文献
18.
基于Web资源的信息抽取技术 总被引:7,自引:0,他引:7
Web资源含有大量的有用信息,但由于它们欠结构化,不能为传统的数据库型查询系统所利用。如何将这些信息抽取出来,转化成结构化信息供其它信息集成系统所利用,成为该领域的研究热点。本文介绍了一个简单的Web信息抽取模型,对于基于该模型的wrapper归纳技术进行了探讨,并描述了一个wrapper自动生成系统的原型。 相似文献
19.
本文阐述了利用XML将半结构化Web数据转化为结构化的XML数据,介绍了目前Web数据抽取的最新技术及特点,并对无监督学习网页重复模式发现网页内在模板抽取方法进行了深入的研究和探讨。 相似文献
20.
裴佩 《内蒙古科技与经济》2011,(7):70-72
明确了Web2.0和数字图书馆的定义及内涵,分析了数字图书馆信息服务的模式结构及对数字图书馆信息服务的影响,探讨了Web2.0技术在数字图书馆信息服务中的应用及其对信息服务的深远意义。 相似文献