首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 156 毫秒
1.
为了解决TextRank算法的初始值赋权问题,提高关键词抽取准确率,引入Log-Likelihood算法。通过与参考语料库词频进行对比,为词条的初始权重赋值,将不需要外部语料的TextRank和需要外部语料的Log-Likelihood进行融合、计算。实验结果表明,融合后的TextRank-LL算法优于TextRank算法。  相似文献   

2.
TFID作为文本特征权重计算常用方法,其不足之处是忽略了特征词在文本中的分布情况和文本长度。修正特征词后的改进TFIDF算法召回率和准确率都优于改进前TFIDF。  相似文献   

3.
特征权值的选择是文本分类的基础环节,TFIDF是文档特征权值表示常用方法之一。但其过于简单的词频和反文档频率表迭式会忽略在一个类中频繁出现的特征,导致了特征预测能力相互削弱。文中提出了一种改进的特征选择算法(I—TFIDF),能更好的体现特征词条的权重,从而有效提高分类的正确率。实验结果表明I—TFIDF比传统的TFIDF算法具有更好的性能。  相似文献   

4.
大数据时代信息量急剧增长,伴随而来的是大量冗余信息的出现。为快速、准确、全面搜索到所需信息,提出一种LDA主题模型与TextRank算法相结合的算法。首先通过对预处理后的文档建立主题模型,得到句子的概率模型即文档中句子的重要性,然后考虑运算节点权重时的主题概率,得到新的迭代公式,通过对同一主题下的多篇新闻报道进行处理得到这些文档的文摘。实验结果表明,该方法生成的文摘较单一算法效果显著。  相似文献   

5.
基于统计的关键词抽取方法忽略了词语的深层语义信息,而词汇链的关键词抽取方法能弥补这一缺陷,但词汇链的构造需要计算语义相似度,而语义相似度的计算需要知识库的支持,提出了一种综合考虑词汇链和互信息模型的关键词抽取算法。首先对文本进行预处理。借助词汇链和互信息模型来表达词语间语义关系,以及对未包含词及相关联度高而相似度值不理想的关键词识别。实验结果表明:在准确率和召回率方面.较基于统计的和基于词汇链的关键词抽取算法均有所提高。  相似文献   

6.
分析了搜索引擎服务质量不高的原因,提出使用用户兴趣模型提高个性化信息检索质量的方案。设计了一个基于向量空间模型的用户兴趣模型算法,该算法根据页面的反馈度以及关键词在页面中出现的频度和位置计算该关键词的权重,使个性化信息检索效果得到了明显提高。  相似文献   

7.
针对当前文献推荐中个性化程度不高等问题,提出一种对用户行为重新分配权重的度量算法。运用用户行为数据按照时间顺序重新分配权重,突出近期用户兴趣构建用户兴趣模型。通过LDA主题分布、关键词分布等方法构建学术资源模型,实现两模型间匹配,完成推荐。通过实验验证,该算法准确性达到80%,比传统等权重算法提高近20%,召回率与F值分别提升了7%和5%。研究表明,基于时间因素的用户兴趣度量算法相较于传统等权重算法具有更高的准确性,未来可进一步优化用户兴趣度量以实现精准推荐服务。  相似文献   

8.
采用新的关键字的获得方法,并基于DHP算法提出一种新的高效的文本关联规则算法.根据 TF‘IDF 公式计算特征词的权重,特征词的平均权重作为阈值,权重大于阈值的特征词作为该文本的关键词,将关键词的权重用到本文的算法ARTREE中,抽取出文本的关联规则.本文算法和Apriori算法相比,具有运算效率高、规则的精度高的优点.实验验证本算法的有效性.  相似文献   

9.
产品特征抽取是产品评论挖掘中的关键一步,针对现有产品评论挖掘方法对产品特征抽取的不足,提出了一种Apriori算法和文本模式相结合的产品特征抽取方法,并运用特征修剪算法对候选产品特征进行过滤。实验结果表明,该方法具有较好的效果。  相似文献   

10.
针对垂直搜索引擎中精确抽取网页中特定字段的问题,对DIPRE算法进行了研究和改进。阐述了DIPRE算法在垂直搜索引擎中的重要作用,探讨了DIPRE算法在抽取复杂结构网页时的不足,并提出了改进,包括种子定位方式,将单模匹配扩展成多模匹配并引入定位索引,再根据已有技术对改进后的算法进行了实验验证。结果表明,改进后的算法在精度和效率上都符合预期。  相似文献   

11.
Reflective learning refers to a learner's purposeful and conscious manipulation of ideas toward meaningful learning. Blogs have been used to support reflective thinking, but the commonly seen blog software usually does not provide overt mechanisms for students' high-level reflections. A new tool was designed to support the reflective thinking process. Beyond writing blog posts, the tool allowed users to attach up to five keywords to each post and link the keywords on a concept map. This study aimed to seek evidence of reflective thinking in participants’ keyword-attaching activities. Data analysis included producing mental maps of the blog texts, calculating nodes of high centrality (most talked-about nodes and most connected nodes) with the help of software including AutoMap and Organizational Risk Analyzer, and comparing student-generated keywords against mental map nodes. Results of keyword analyses revealed that two-thirds of the student-attached keywords matched mental map nodes. Results also indicate that the map analysis method can produce reliable indexes of a given text, which in turn could serve as anchor points for further content analysis. Other findings also uncovered some differences between participant-selected keywords and mental map nodes, indicating different levels of reflective activities.  相似文献   

12.
随着XML在数据交换和发布等领域的广泛应用,XML数据的查询问题变得越来越重要,尤其是对于XML数据的关键词查询更是当今数据处理领域的一个难点.本文提出了一种基于栈的XML关键词查询算法SXKS,该算法依照关键词对XML文档进行搜索,返回的结果是叶子结点分别取值为各个关键词的带权值的最小关键树DMKT,DMKT中包含所有的关键词并且这些关键词与叶子结点是一一对应的.那么,每一个DMKT就对应一个符合搜索条件的查询记录.  相似文献   

13.
In this paper, an improved algorithm, web-based keyword weight algorithm (WKWA), is presented to weight keywords in web documents. WKWA takes into account representation features of web documents and advantages of the TF*IDF, TFC and ITC algorithms in order to make it more appropriate for web documents. Meanwhile, the presented algorithm is applied to improved vector space model (IVSM). A real system has been implemented for calculating semantic similarities of web documents. Four experiments have been carried out. They are keyword weight calculation, feature item selection, semantic similarity calculation, and WKWA time performance. The results demonstrate accuracy of keyword weight, and semantic similarity is improved.  相似文献   

14.
美团平台上店铺的评分是一个综合性评分,并不能从多个角度说明店铺情况,客户根据综合评分很难选择到符合自己需求的店铺。现有评价模型在商品属性选择和权重上依靠有经验的管理者给出,存在很大的主观性。针对这些问题,提出了基于模糊综合评价的情感分析模型。该模型首先采用关键词提取与模糊矩阵相结合方法,对评论的语料进行关键词提取,然后根据关键词权重设置模糊矩阵,最后将评论情感分析结果放在模糊矩阵中,构建出基于模糊矩阵的综合情感评价模型。在美团评论数据集上进行实验,结果是综合评价分与美团平台的综合性评分只相差 0.02%,说明该模型结果非常准确。模型给出了店铺除综合评分以外的其它关键词得分,全面分析了店铺的口味、环境、价格等因素评分,为顾客选择提供了多角度指导。所得出的评分也给商家提供了很好的指导意见,以帮助商家调整经营模式和策略。  相似文献   

15.
关键词提取是问答系统中问句分析的重要步骤,它有助于问答系统快速、准确地返回答案。针对现有文献中基于T FIDF等方法在关键词提取准确率及效率方面的不足,提出一种基于平均信息熵的中文问句关键词提取方法。通过加入专业领域词汇,并在停用词过滤的基础上计算问句中每个词的平均信息熵,以词的信息熵值直接体现该词在问句中的重要性;同时在关键词提取过程中,通过设定不同提取比例,并在不同提取比例下观察评价标准值,以最佳提取比例获取更为合适的关键词。实验结果表明,与传统的T FIDF等其他方法相比,该方法的查准率、查全率以及 F1测度值都得到显著提高。  相似文献   

16.
基于命名实体的网页推荐算法,从查询日志入手,分析用户的查询行为,给用户提供智能推荐,从而给出较好的推荐网页.提出了基于混合马尔科夫模型用于目录网页的导航链接和基于LDA特征选择的网页推荐算法用于主题网页推荐,实验结果显示,基于混合马尔科夫模型的推荐算法,达到了比较满意的效果;基于LDA特征提取的网页推荐算法优于传统的推荐算法,很好地满足了用户的需求.  相似文献   

17.
Fifth-grade students with either high or low levels of vocabulary knowledge were taught a list of new vocabulary words according to the mnemonic keyword method. The children were randomly assigned either to one of three keyword instructional conditions that varied in the degree of structure provided by the experimenter, or to a no-strategy control condition. All three variations of the keyword method facilitated students' vocabulary learning. Aptitude × treatment interactions involving vocabulary knowledge materialized, however, such that the degree of keyword method structure made far less of a difference for the high knowledge students than it did for the lows. In particular, when the children had to execute the dual components of the keyword method entirely on their own, low vocabulary knowledge students experienced considerably more difficulty than did highs.  相似文献   

18.
Children 3 to 6 years of age learned simple Spanish vocabulary items using an adaptation of the keyword method of foreign language vocabulary learning. Using this version of the keyword method, the learner remembered a picture of the translation referent of the vocabulary item interacting with the referent of a concrete English word which sounded like part of the foreign word (the keyword). Children who used the keyword method remembered more vocabulary translations than children who were not instructed in keyword method usage.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号