排序方式: 共有6条查询结果,搜索用时 156 毫秒
1
1.
[目的/意义]实现海量产品评论数据的快速分析,帮助产品设计人员高效地获取用户需求,在新产品设计的决策中提供参考。[方法/过程]在特征提取和情感分析的基础上,构造了包括"词+词性+词干+位置+依存关系"等节点特征的条件随机场模型,按照"产品特征、谁、在何种情境下、遇到了什么问题"4个要素,以描述手机屏幕和电池的负面评论为例,从产品评论中提取用例。[结果/结论]模型评估和实证研究表明,所构造的模型可以有效地从评论文本中识别产品特征、使用主体、使用情景和遇到的问题,从而快速构造用例,获取用户需求。 相似文献
2.
基于本体的汉语领域命名实体识别 总被引:1,自引:0,他引:1
命名实体识别是众多自然语言处理任务的核心内容之一,也是近年来的领域研究热点.本文将命名实体分为两大类:常规命名实体和领域命名实体.基于已经构建的领域本体MPO,本文提出一种基于本体知识规则与统计方法相结合的领域命名实体识别方法.该方法通过本体化实例,获取实体构成词性规则模板,结合CRFs机器学习模型,进行领域命名实体识别.实验结果表明:相比运用单一统计方法而言,该方法能使领域实体的识别性能显著提高,F值达到92.36%.同时表明本体化知识规则的有效运用,能够在领域实体边界和特殊形式领域实体识别的准确率上发挥积极作用. 相似文献
3.
[目的/意义] 构建面向典籍文本的语义本体,能够促进典籍文本的挖掘与分析。然而由于典籍文本与现代文本在语法上存在较大差异,给面向典籍的语义本体构建带来了困难。[方法/过程] 本文运用自然语言处理技术探讨针对先秦典籍的本体构建方法。以国际上文化遗产领域通用的CIDOC CRM为框架,设计先秦典籍本体模型。针对典籍文本内容的特点及句法特征,将规则抽取与条件随机场方法相结合,提出一套本体实例自动获取技术,并以《左传》为实验语料进行测试。[结果/结论] 实验表明,本文所提出的本体实例抽取技术能够较好地提高面向典籍文本的本体构建效率。基于规则的本体实例抽取实验F值在93%左右,基于条件随机场的本体实例抽取最佳特征模板的F值为82.51%。在本体实例获取中,词性信息和位置信息具有重要作用。 相似文献
4.
5.
HMM和CRFs在信息抽取应用中的比较研究 总被引:1,自引:0,他引:1
在比较HMM和CRFs数学理论的基础上,分别提出基于HMM词角色标注和基于CRFs字角色标注的人名实体抽取模型,并通过开放性测试和实践应用两次验证、比较两者的有效性,从而在实践中证明从理论比较中得出的结论:CRFs较之HMM更适合于解决序列标注或对象分类问题。 相似文献
6.
郑霞 《安阳师范学院学报》2013,(5):53-56
在利用条件随机场(CRFs)进行汉语词性标注时,特征模板的选取是非常重要的一个环节,本文设计了两组特征模板,选取Bakeofl2007的CTB、NCC、PKU三种语料,使用CRF+ +0.53工具包进行了对比实验,定量分析了影响词性标注的模板参数.通过实验得出以下结论:(1)词性标注的准确率与特征窗口大小不成正比,上文对当前词的词性的影响比下文要大,当前词的词性与其紧邻的前后两个词关系紧密;(2)产生的特征数多的模板训练较难进行;(3)词性转移特征对准确率有一定的影响. 相似文献
1