首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 296 毫秒
1.
以携程网上消费者对酒店的文本评论为研究对象,通过对文本评论中的词语进行聚类,得到其中隐含的消费者最关注的酒店评价维度。为保证词语聚类的效果,引入语料库作为对比文档,通过分词、特征项表示、特征词编码标注、词义相似度计算以及基于DBSCAN的文本聚类过程,得到最后的评价维度,并以实例详细说明每个过程中所采用的方法及步骤。  相似文献   

2.
以口碑网的顾客文本评论为研究对象,针对从网上收集的大量的顾客文本评论,采用文本聚类挖掘出顾客最关注的信誉维度,利用内容分析法对顾客评论进行编码,通过回归分析发现各个信誉维度对生活服务商信誉的影响及边际影响程度,并据此提出相关的经营对策。  相似文献   

3.
信誉管理系统在促进顾客对电子零售商的信任过程中起着越来越重要的作用,它是电子零售商取得成功的重要因素和保证。顾客的文本评论是信誉管理系统的一个重要组成部分,其中蕴含了大量的零售商的实际交易和信誉信息。本文从顾客文本评论的视角,采用文本挖掘技术对大量的顾客评论进行文本聚类,通过分类整理和知识提取,以期找出顾客最关注的电子零售商的信誉维度。本研究选取国内最大的IT专业网站——中关村在线作为研究对象,通过一个应用实例详细说明了通过文本聚类发现电子零售商信誉维度的方法和过程。本研究对电子零售商的信誉维度知识发现具有重要意义,也能为电子零售商提高服务质量提供参考。  相似文献   

4.
张丽  张蕾  张阳  戢妍 《信息系统工程》2011,(7):71-73,43
网上书店除了提供品类繁多的图书外,还为读者呈现出丰富的在线评论。如何从海量书评中提取对网上书店、出版社或消费者有用的信息成为一个亟待研究的问题。通过自然语言处理的工具之一中文分词技术对图书在线评论的文本内容进行处理,基于词频统计结果提取文本关键词,从而发现读者阅读特征、评论关键要素等有价值的信息。进而以当当网的14197条图书在线评论为例,运用该文本分析方法,以评论标题和评论正文内容、图书种类、所有评论和有用评论三个维度对文本进行了比较分析。  相似文献   

5.
[目的/意义]将体验型产品在线评论按照文本长度分为长文本在线评论和短文本在线评论,探究这两类评论的时间和内容特征,为电子商务平台掌握消费者在线评论行为规律和商品需求偏好提供情报依据。[方法/过程]利用Python爬虫语言获取电影评论网站中在线评论的相关信息,构造在线评论时间间隔序列,基于人类行为动力学相关构念,探究不同类型在线评论发布行为的时间特征规律;利用文本挖掘方法找出不同类型在线评论的文本内容特征并进行比较分析。[结果/结论]以电影评论网站在线评论为数据来源,从时间角度总结出不同类型在线评论行为的时间间隔序列符合幂率分布;从文本内容角度发现不同类型在线评论的文本内容特征既有一定的相似性,也表现出明显的差异。  相似文献   

6.
王军  丁丹丹 《图书情报工作》2015,59(12):106-112
[目的/意义] 研究商品在线评论动态变化的评价指标体系,为商家掌握消费者态度的变化过程,有针对性地改进产品或服务提供参考。[方法/过程] 结合ELM方法,建立商品在线评论的动态评价模型,并提出结构分布指标、跨类变动指标和内部变动指标等3类一级指标,以及评论结构比、平移率、跨越率、集中率、扩散率、商品价值关注度、服务敏感度等二级指标。[结果/结论] 以天猫网女装的在线评论为例进行实证研究,详细说明模型和指标体系的应用过程,并验证其适用性。网商可借助该指标体系评价商品在线评论的变动情况,了解消费者态度变化趋势。  相似文献   

7.
[目的/意义] 鉴于网络用户评价已成为人们选择产品或服务时的重要参考指标,旨在了解打分评价和评论评价之间的关系,同时为仅有评论评价的网站提供符合潜在分值的排序和推荐功能。[方法/过程] 通过抓取豆瓣电影的用户评价,使用ROST EA工具进行情感分析得到评论评价的综合情绪值,将其与打分评价进行相关分析,并考虑评论文本的情感强度赋权对结果造成的差异,在此基础上通过回归分析构建回归模型并对其进行检验。[结果/结论] 发现评论评价的综合情绪值与打分评价相关性较高,情感强度的赋权情况对结果影响不大,说明可以根据评论评价预测打分,据此给出相应的回归模型。  相似文献   

8.
文本聚类结果描述研究综述   总被引:1,自引:0,他引:1  
首先对文本聚类结果描述的研究背景和相关的研究情况进行说明,分析自动标引、自动文摘、概念聚类与文本聚类结果描述的关系,定位文本聚类结果描述的研究内容;然后根据文本聚类结果描述的具体要求,对该问题进行形式化;最后给出文本聚类结果描述的评价方法。  相似文献   

9.
针对在线商品评论总体质量不高、缺乏有效评论引导机制的问题,以亚马逊商品在线评论为研究对象,结合文本挖掘技术和实证研究,探究基于文本内容评论有用性的影响因素。通过以手机这一典型商品为例,发现消费者关注手机系统反应、音质、导航、打字体验,希望了解电池、充电器等配件细节,重视商家的配送、退换货、保修、发票等服务,评论文本包含这些信息会提高其有用性。  相似文献   

10.
[目的/意义]共享住宿与酒店预定平台可能同时存在替代性和互补性,但这种替代性和互补性分别体现在哪些产品和服务上当前文献还缺乏探讨,需要进一步开展跨平台的比较研究。[方法/过程]选取携程酒店预定平台和小猪短租平台为实验对象,采集北京市相关房源的86635条用户评论文本,结合LDA模型、主题社会网络和主题情感分析方法对用户文本评论进行跨平台比较分析。[结果/结论]研究发现两大平台用户在评论主题、主题社会网络和主题情感上的异同之处,从微观用户评论角度解释了两大平台在产品和服务上的替代性和互补性。本文结果为平台管理者进行住宿产品和服务的开发和改进提供重要的实践借鉴。  相似文献   

11.
【目的】通过开源工具,构建一种分布式环境下的文本聚类与分类应用平台。【方法】以海量文本的词收敛性为基础,通过词聚类指导文本聚类和分类。过程包括:使用开源分词器等工具进行训练集的文本预处理,结合Mahout数据挖掘平台对处理后的词集进行聚类分析,最后通过相似度算法计算测试文本与词类簇的相似度并分类。【结果】分布式环境下的基于词聚类的文本聚类分类计算方法,可有效解决海量文本的词聚类瓶颈问题。经测试,当训练文本集增加到100,迭代收敛阈值为0.01时,词聚类结果较理想。【局限】测试数据规模有限,仅限于新闻数据,基于其他领域的词聚类效果需要进一步测试、优化、调整。【结论】详细描述基于词聚类的文本聚类分类算法的开发环境构架和关键步骤,有助于研究者对相关开源工具使用及分布式并行环境部署的深入理解。  相似文献   

12.
文献推荐服务已经成为数字图书馆的重要知识服务内容之一.本文引入自然语言处理中的文本倾向性分析技术,通过对引证文本的语句语义分析,把语句的语义结构转化为倾向性分析的二元或三元模型,得到引证文本对参考文献的主观评价信息.结合参考文献本身的正文中对其他文献的评论指数,给出了文献推荐度的计算方法,从而实现对文献集中文献的自动分析和推荐服务.实验表明基于文本倾向性分析的文献推荐服务是可以实现的,并具有较高的准确率.在实际应用中还需要扩大词语知识库的规模,并提高语句的语义结构分析、词语语义关系分析等方面的性能.  相似文献   

13.
基于在线评论的消费者模糊情感计算与推理   总被引:1,自引:0,他引:1  
针对Web 2.0时代大量主观性文本的出现,消费者在线评论描述了消费者关于某一产品或服务的观点或经历。本文基于模糊理论讨论了在线评论中的情感挖掘问题。以消费者心理行为学理论为基础,根据在线评论的自然语言模糊本质属性,建立了消费者心理模糊库群,包括特征、感知、情绪、评价等4个模糊库;结合评论语句的句法分析,给出了消费者态度情感的模糊计算算法(FSCA-OR);并依据消费者的决策过程,进行了推理规则库的构建;最后通过实验验证了所提方法的有效性。  相似文献   

14.
[目的/意义] 为解决现有网页文本缺乏起源标注的问题,提出一种借助PROV本体发现相似网页文本起源关系的方法。[方法/过程] 通过聚类算法、自动语义标注和关联数据构建等技术的综合应用,结合PROV-POL溯源模型,检测网页文本实体的演变过程,实现文本级和属性级两级溯源方案。[结果/结论] 实验验证了借助语义网技术和数据溯源模型实现网页文本数据溯源的可行性,但实验过程中聚类算法的召回率有待提高。  相似文献   

15.
基于主题模型的科技报告文档聚类方法研究   总被引:1,自引:0,他引:1  
[目的/意义]探索实践以科技报告为文献载体形式的融合主题模型的文本聚类方法,拓展基于科技文献进行技术监测服务的新领域,提出基于科技报告进行语义分析的新方法。[方法/过程]以国家科技报告服务系统中的科技报告为数据源,首先基于LDA主题模型对经过文本预处理的科技报告进行主题挖掘,再基于Ward与K-means相结合的聚类算法对包含主题分布信息的文本向量进行聚类分析,尝试提出一种适合科技报告文档聚类的文本挖掘新方法。[结果/结论]实验结果表明,LDA主题模型能有效准确挖掘科技报告中的主题信息,所提出的Ward与K-means相结合的聚类算法对科技报告的聚类效果也优于其它传统聚类算法。  相似文献   

16.
[目的/意义]现有的关键词提取方法不适应社会化问答社区文本长度较短、内容表述口语化、数据集稀疏的特点,且很少考虑用户关注程度对词语重要性的影响,不能有效地提取此类文本的关键词,因此,提出针对社会化问答社区的多属性加权关键词提取方法。[方法/过程]多属性加权关键词提取方法通过引入调节函数和词性对传统TF-IDF进行改进,并通过线性加权融合用户回答数、关注数、浏览数以及评论数4个用户关注属性来综合度量词语权重。[结果/结论]实验表明,该方法能更有效地提取社会化问答社区文本的关键词。  相似文献   

17.
[目的/意义]本文提出了基于卷积神经网络的物流服务业顾客满意度评价方法,为人们科学客观地了解物流实际运行情况,改善物流服务有重要的参考价值。[方法/过程]文章运用网络爬虫技术、词频统计和特征提取得出五个物流服务特征,然后构建卷积神经网络文本分类模型,对物流评论信息进行分类,最后对物流服务满意度进行赋值评分。[结果/结论]实验结果表明,在网络生鲜产品物流服务特征中,便利性、可靠性、及时性、完整性和友好性是消费者关注的服务特征,而消费者最关注完整性,最不关注及时性,并最终得到了物流服务业顾客满意度分值。本文最终选择了生鲜物流作为案例进行顾客满意度评价,以期推广到更多物流服务业评价应用中。  相似文献   

18.
运用非结构化信息挖掘,对网络评论情感进行分析是一个非常重要的方法。本文基于Web客户评论情感文本,在情感文本预处理过程中使用四种不同的停用词表,采用两种不同的特征选择方法,选用著名的TF-IDF权重计算方法,使用基于RBF核函数的支持向量机方法的分类器实现了对携程网上采集的4000个酒店客户评论情感文本的分类研究。通过实验,分析了不同特征选择方和停用词表的使用对客户评论文本情感分类的影响,提出了基于情感文本分类的有效的停用词表。  相似文献   

19.
基于粒子群的模糊C均值文本聚类算法研究   总被引:1,自引:0,他引:1  
利用模糊C均值算法解决文本聚类问题时,随机选取的初始聚类中心和聚类数会导致不同的聚类结果,且容易陷入局部最优。提出利用粒子群优化算法确定模糊C均值的初始聚类中心,并通过向量空间模型和特征提取,再利用模糊C均值进行文档聚类。实验表明,这种基于粒子群的模糊C均值聚类算法迭代次数少,能解决经典模糊C均值算法对初始值敏感和易陷入局部极小的缺点,且聚类速度和效果得到明显提高。  相似文献   

20.
[目的/意义]基于评论效价,将从初始评论到追加评论的动态变化分为一致性在线评论和矛盾性在线评论,结合信息采纳模型,研究不同变化类型对消费者信息采纳的影响,构建理论模型并进行研究。[方法/过程]以淘宝网上运动鞋的初始评论和追加评论为例,采取实验研究的方法,通过4组调查问卷设计,利用SPSS 21.0软件对调查问卷的数据进行分析和处理。[结果/结论]结果表明,一致性和矛盾性在线评论相比,消费者对矛盾性在线评论的有用性感知更强,两种变化类型的评论都是通过感知有用性作用于消费者的信息采纳,自我效能会调节消费者对在线评论的有用性感知。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号