共查询到20条相似文献,搜索用时 156 毫秒
1.
2.
3.
4.
互联网的开放性使得当前互联网上的用户生成内容没有质量控制机制,产品评论中存在大量垃圾评论,如何识别这些垃圾评论信息成为重要问题。本文对产品评论信息中垃圾评论的识别方法进行了综述,先将产品垃圾评论和互联网上其他常见的垃圾信息进行了对比,然后从产品垃圾评论检测的数据集、识别方法两个角度对相关工作做了概述和分析,最后在上述工作的基础上提出了一些值得产品垃圾评论识别研究进一步关注的问题。 相似文献
5.
[研究目的]通过从评论文本和评论者两个维度对在线评论的特征进行挖掘,探究电商平台如何有效提高虚假评论识别的准确性,增加用户在线商品评论可信度,为消费决策提供参考。[研究方法]提出一种基于多维特征和SMOTE-RF模型的虚假评论识别方法。首先,通过识别商品虚假评论线索,构建多维特征向量,引入情感极性等特征并进行单调化处理;其次,在评分偏离度中添加了商品得分均值等统计指标来全面刻画虚假评论;最后,针对在线评论数据集中真实评论与虚假评论类不平衡问题,运用SMOTE算法优化随机森林分类模型,从而达到提高虚假评论识别准确性的目的。[研究结论]实验结果显示该方法在正负样本不平衡的虚假评论识别中具有更高的准确率、召回率及F1值。其中评分偏离度特征对虚假评论识别的影响最大,情感极性可作为识别的次要参考特征。因此,综合考虑在线评论多维特征和正负样本不平衡可帮助电商平台对虚假评论进行有效的过滤,为消费者提供更为可靠的评论数据。 相似文献
6.
《黑龙江科技信息》2020,(26)
为了解决居民垃圾分类知识储蓄不足,难以对垃圾进行分类的问题,开发一款Android平台的应用软件,以满足居民对日常生活垃圾分类的需要。在Android本地部署垃圾分类神经网络模型Res Ne Xt-101-32x16d-wsl实现实时智能垃圾分类,同时在Android本地使用SQLite存储垃圾物品信息,实现离线文字查询垃圾类别,同时借助"讯飞开放平台"的语音识别功能和本地SQLite数据库实现语音查询垃圾类别功能。Android开发采用Jetpack组件和MVVM模式,经测试,软件及其各模块功能均能正常运行,能够实现辅助居民对垃圾物品进行分类。 相似文献
7.
8.
[目的/意义] 提出一种基于在线产品评论的竞争情报挖掘框架,为企业改进产品设计和制定竞争策略提供参考。[方法/过程] 利用Word2vec技术构建产品特征词集合,识别用户评论主题特征。然后使用情感分析方法对评论文本进行分类,得到特征维度的评论情感。最后从产品主题特征和情感态度特征两方面进行数据分析,并以可视化结果呈现。[结果/结论] 以汽车行业的评论数据为例进行实验,结果表明该方法能够有效提取产品情报信息,帮助企业有效识别自身品牌及竞争对手的优势和劣势,为大数据环境下的竞争情报挖掘提供方法指导。 相似文献
9.
[目的/意义]目前各大电子商务网站产生了海量的评论信息,对于消费者而言,查阅和分析这些信息将面临巨大的挑战。因此,有必要对评论的有用性进行综合评价,为消费者过滤出真正有价值的内容。[方法/过程]为此,本文提出并研究了一种在线消费者评论的有用性评价模型,为消费者的网购决策提供支持。该模型主要基于分类算法,识别在线消费者评论的有用性,并按其概率值大小进行排序。根据在线消费者评论的特点,提取了一系列分类特征用于其有用性评价,然后利用支持向量机对评论进行分类并从中识别有用的记录。利用来自B2C电子商务网站的3个在线消费者评论数据集(手机、女鞋、糖果巧克力)对提出的模型进行实证分析。[结果/结论]研究结果显示,该模型能够量化地评价在线消费者评论的有用性并对其进行有效的分类排序。该模型主要依赖语义特征进行排序,而对非语义特征的依赖较少。通过选择合适的概率阈值,能够缩小验证空间,并显著提升分类精确度。 相似文献
10.
Web2.0时代,阅读在线产品评论已经成为人们购物前的一种习惯。然而,网络上的评论数量巨大且观点不一,消费者很难获取到真正对其有用的评论。本文从研究中文在线产品评论的有用性评估入手,结合中文在线评论的特点,构建了评论有用性评估特征体系。以二分类思想为中心,基于文本挖掘的基本流程,实现对中文产品评论的分类,并考察了评论内容各特征对分类效果的影响。结果表明,本文提出的评估方法能有效识别出有用评论,并且发现浅层句法特征在分类中的贡献度较高,语义特征与情感特征则会因语料类型的不同而有不同的分类贡献度。 相似文献
11.
《Information processing & management》2020,57(6):102317
The problem of social spam detection has been traditionally modeled as a supervised classification problem. Despite the initial success of this detection approach, later analysis of proposed systems and detection features has shown that, like email spam, the dynamic and adversarial nature of social spam makes the performance achieved by supervised systems hard to maintain. In this paper, we investigate the possibility of using the output of previously proposed supervised classification systems as a tool for spammers discovery. The hypothesis is that these systems are still highly capable of detecting spammers reliably even when their recall is far from perfect. We then propose to use the output of these classifiers as prior beliefs in a probabilistic graphical model framework. This framework allows beliefs to be propagated to similar social accounts. Basing similarity on a who-connects-to-whom network has been empirically critiqued in recent literature and we propose here an alternative definition based on a bipartite users-content interaction graph. For evaluation, we build a Markov Random Field on a graph of similar users and compute prior beliefs using a selection of state-of-the-art classifiers. We apply Loopy Belief Propagation to obtain posterior predictions on users. The proposed system is evaluated on a recent Twitter dataset that we collected and manually labeled. Classification results show a significant increase in recall and a maintained precision. This validates that formulating the detection problem with an undirected graphical model framework permits to restore the deteriorated performances of previously proposed statistical classifiers and to effectively mitigate the effect of spam evolution. 相似文献
12.
垃圾邮件的泛滥提出了极为迫切的技术诉求,文章介绍了基于文本分类技术的垃圾邮件过滤系统模型,首先介绍了整个系统工作流程,然后阐述了系统中文本分词,文本特征提取,Winnow线性分类器等关键环节。 相似文献
13.
针对传统的朴素贝叶斯算法对垃圾邮件的过滤率不高等问题,提出了一种基于最小风险贝叶斯网络垃圾邮件信息过滤技术,提出的最小风险贝叶斯能够减少正常邮件判为垃圾邮件的风险,最后实验表明,与传统的算法相比较,本文提出的方法过滤效果有较大的提高。 相似文献
14.
烟叶人工分级易受主观因素影响,分级结果存在主观差异性,需要建立与人眼视觉感受相吻合的客观分级方法。本文针对烟叶颜色属性进行分级判断,给出一种基于CIEDE2000的均匀色差颜色分级方法。该方法包含了亮度、色调和饱和度综合色差视觉感受的图像评价标准,将待测烟叶与标准烟叶库中所有标准烟叶分别做色差计算,根据距离准则,寻找与当前待测烟叶色差最小的标准烟叶,同时对这个最小距离进行阈值判定,来确定当前待测烟叶的等级。实验结果表明根据CIEDE2000色差公式的颜色分级方法优于RGB颜色分级方法,与人眼视觉感受更为吻合,为建立烟叶自动分级系统提供了新的依据。 相似文献
15.
电子邮件是人们交流的主要方式之一,但垃圾邮件的泛滥给使用者带来了很大的困扰。鉴于传统过滤技术的缺点,本文采用性能更优的Fuzzy-ID3方法对邮件进行分析,通过提取邮件的特征信息、数据预处理等步骤,得到一棵修剪后的模糊决策树,并转换为的邮件分类规则,使用这些规则可以提高邮件分类的准确性及效率。 相似文献
16.
Blogging has been an emerging media for people to express themselves. However, the presence of spam blogs (also known as splogs) may reduce the value of blogs and blog search engines. Hence, splog detection has recently attracted much attention from research. Most existing works on splog detection identify splogs using their content/link features and target on spam filters protecting blog search engines’ index from spam. In this paper, we propose a splog detection framework by monitoring the on-line search results. The novelty of our splog detection is that our detection capitalizes on the results returned by search engines. The proposed method therefore is particularly useful in detecting those splogs that have successfully slipped through the spam filters that are also actively generating spam-posts. More specifically, our method monitors the top-ranked results of a sequence of temporally-ordered queries and detects splogs based on blogs’ temporal behavior. The temporal behavior of a blog is maintained in a blog profile. Given blog profiles, splog detecting functions have been proposed and evaluated using real data collected from a popular blog search engine. Our experiments have demonstrated that splogs could be detected with high accuracy. The proposed method can be implemented on top of any existing blog search engine without intrusion to the latter. 相似文献
17.
图书馆智能化咨询问答机器人是图书馆智能化机器人中的一种重要类型,系统设计是研究的首要内容,语料技术则是其服务效能的核心要素。本文从图书馆智能化咨询问答机器人的系统设计方案、问题语料库和答案语料库的建设与来源、分类类型、语料问题的分类与扩展、个性化分析与处理等方面,对图书馆智能化咨询问答机器人系统设计与语料技术进行了研究。此项研究对于图书馆智能化咨询问答机器人的全面研究具有参考和借鉴意义。 相似文献
18.
19.
R.A. Spinello 《Ethics and Information Technology》1999,1(3):185-191
After reviewing some of the difficulties caused by spam and summarizing the arguments of its defenders, this paper will focus on its present legal status. It will then dwell on spam from a moral point of view and address some of the ethical implications associated with transmitting this unsolicited commercial e-mail. It will attempt to sort out the conflicting rights involved and develop a viable case that even if we prescind from its social costs, spam is ethically questionable under certain conditions. Moreover, given the current volume of spam and its negative impact on the Internet environment, the transmission of spam can also be characterized as an asocial act primarily because of the significant externalities which it generates. As a result, spam cannot be justified from the perspective of duty-based moral philosophies that emphasize the need to conform to the legitimate norms of the community. 相似文献
20.
介绍了垃圾邮件的现状,以及目前常见的反垃圾邮件的方法。针对贝叶斯算法的特点,介绍使用贝叶斯过滤的方法实现垃圾邮件的过滤技术。 相似文献