首页 | 本学科首页   官方微博 | 高级检索  
     检索      

学术论文复制检测的研究进展及新方法
引用本文:王秀红.学术论文复制检测的研究进展及新方法[J].图书情报工作,2009,53(5):111.
作者姓名:王秀红
作者单位:江苏大学
摘    要:综述国内外学术论文复制检测的研究现状,针对存在的问题提出以后研究的新思路: 构建某一学科领域学术论文语料库;以信息论为工具,针对某学科领域建立基于学术论文语料库的统计语言模型;结合学术论文抄袭剽窃的特点,通过赋予描述资源对象语义信息的不同元数据项以不同的权函数,设计相似度算法;使用Lemur工具箱,在标准的TREC文档集上对模型和算法进行检验;与Turnitin侦探剽窃系统进行实验对比,评价该模型和算法的有效率和效果。

关 键 词:学术论文  复制检测  抄袭剽窃检测  统计语言模型  文本相似度算法  
收稿时间:2008-05-20
修稿时间:2009-03-19

Review and New Ideas on Duplication Detection of Articles
Wang Xiuhong.Review and New Ideas on Duplication Detection of Articles[J].Library and Information Service,2009,53(5):111.
Authors:Wang Xiuhong
Abstract:After reviewing and analysising on the problems of retrieval models and text similarity algorithms of duplication detection, the author proposes some new ideas on plagiarism detection of articles to improve the recall and precision. The ideas include the followings: building article training corpus in one specialty; based on information theory, building statistical language model;computing articles similarity by different metadata with different authorized functions;using Lemur toolbox to test recall and precision of the model and similarity algorithm;comparing with turnitin plagiarism detection system to evaluate the effectiveness and efficiency of the detection computation.
Keywords:articles  duplication detection  plagiarism detection  statistical language model  text similarity algorithm
本文献已被 万方数据 等数据库收录!
点击此处可从《图书情报工作》浏览原始摘要信息
点击此处可从《图书情报工作》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号