首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 15 毫秒
1.
邱金鹏 《科技通报》2019,35(10):133-136
传统Web页面语义标注方法需手工处理,或只可将Web页面中有属性的标签赋予数据,针对无属性标签数据不进行标注,不适于大规模Web页面信息标注,且标注结果不可靠。为此,提出一种新的基于集成学习的动态Web页面语义标注方法。给出动态Web页面语义标注流程。将Web页面转换成DOM树,识别待标注文本。选取抽取信息特征与训练Web页面特征,将含有语义信息的内容分配至概念抽象化的本体上,采用多分类器集成学习方法进行分类,区分待标注信息是属性标签还是数据元素,通过不同分类器预测结果的一致性对相应样本被准确标注的置信度进行衡量。通过训练页面中涵盖的属性标注规则集与抽取信息中的属性名称实现语义标注。实验结果表明,所提方法适于大规模动态Web页面语义标注,标注结果可靠。  相似文献   

2.
庞良健  李晗  王庆林  徐新胜 《科技通报》2021,37(10):59-65,70
针对现有的评价方面抽取方法无法充分利用评论文本中字词包含的复杂语义问题,提出了一种融合多层次语义的网络评价方面抽取模型.首先将卷积神经网络(CNN)训练的字符表示与Word2Vec预训练的词向量进行拼接,构建字词融合的特征表示,利用注意力机制对字词融合的特征表示进行重要程度标识,获得融合注意力的特征表示;构建由CNN和双向长短期记忆网络(BiLSTM)组成的混合神经网络,利用CNN的强学习能力提取字、词的局部语义特征信息,利用BiLSTM全局特征提取能力捕捉字、词之间长距离的上下文语义信息,实现多层次语义融合,最后利用条件随机场学习标签之间的约束条件,输出评论文本最优的序列标注结果,并以酒店评论文本为实验数据集,对所提模型与方法进行可行性和有效性验证.结果表明:本模型具有更好的评价方面抽取效果,可以为基于文本的评价研究与分析提供优质的数据源.  相似文献   

3.
利用<知网>的资源,包括对事件的定义和对事件语义角色框架的描述,对中文事件抽取过程进行研究,这种方法绕开了对语料进行深层语义分析的复杂性,实验结果显示利用此标注方法可以从非结构化文本中抽取出事件及相关信息.  相似文献   

4.
路青  崔新春  胡艳波 《情报杂志》2012,31(4):43-47,53
语义角色标注作为语义分析的关键技术已经得到越来越广泛的关注.首先对中国期刊网数据库中语义角色标注研究领域的文献进行了统计分析,描述了国内语义角色标注研究的发展状况.主要通过对文献的论文年载量分析、著者分析、文献来源分析和研究主题分析揭示国内语义角色标注的发展历程和研究内容.然后分析了语义角色标注研究热点及发展趋势.最后,在分析国内语义角色标注发展的基础上,提出了促进语义角色标注研究发展的积极建议.  相似文献   

5.
基于中文信息抽取的概念,提出一套基于语义模板的地震应急文本信息地图自动标绘的技术方案。针对地震应急文本信息和汉语的特点,对应急文本信息进行分词、词性标注和语义分析等处理,按照预定义语义模板提取震情、灾情信息并形成结构化信息、并与空间关联,标绘形成地震应急态势图。方案实现了传统手工标绘向自动标绘的转换,提高了地震应急态势图标绘效率。  相似文献   

6.
用户标注是web2.0主要的资源标引和组织方法,由于用户标签组织的平面结构导致标签之间缺乏语义关系,使之很难适应语义信息组织的要求.针对这一问题,探讨在用户标注优化基础上,用户标签的词语网络构建和语义关系处理与控制,简要讨论了用户标注的模型化或本体化.  相似文献   

7.
在基于Bootstrap的信息抽取技术中,为提高实体关系抽取模式的质量,需要对抽取模式的可信度进行评估.本文提出了根据模式的历史匹配记录来对其进行可信度评估的简单方法,并以此为基础对模式进行了优化合并.经过可信度评估的模式在对句子进行实体关系标注时,有效提高了标注的准确率.这说明该方法能够提高抽取模式的质量,对信息抽取系统的性能提高有一定价值.  相似文献   

8.
王云英 《情报杂志》2013,(1):141-144
高效的Web页面语义标注方法是提高Web信息资源利用效率和知识创新的关键。针对当前Web页面语义标注方法存在的问题和Web页面表现出的结构特征和文本特征及其主题分布规律,设计了基于PLSA主题模型的Web页面语义标注算法。该算法分别对Web页面的结构特征和文本特征构建独立的PLSA主题模型,采用自适应不对称学习算法对这些独立的PLSA主题模型进行集成和优化,最终形成新的综合性的PLSA主题模型进行未知Web页面的自动语义标注。实验结果表明,该算法能够显著提高Web页面语义标注的准确率和效率,可以有效地解决大规模Web页面语义标注问题。  相似文献   

9.
社会化标注体现了Web2.0时代的集体智慧,隐含了丰富的语义信息。本文分析了社会化标注的认知过程,探讨了社会化标注的浮出语义,提出了一种社会化标注的语义聚类算法。从语义的角度对社会化标注进行分析,有助于理解和挖掘社会化标注的隐含语义,指导平面化的自由分类法进行本体构建,丰富语义网资源。  相似文献   

10.
刘振 《情报科学》2018,36(9):115-117
【目的/意义】为了帮助科研人员从海量信息中发现热点和重大研究进展,抽取出有用的事件信息。【方法/ 过程】采用条件随机场方法和语义角色标注技术,构建了模型进行训练和学习。【结果/结论】提出了科技事件抽取 框架,实现了科技事件抽取系统,取得了一定的抽取效果,该系统的可扩展性和可移植性有待提高。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号