首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于Lucene中英文语言分析器的设计与实现
引用本文:马凤娟,吴鹏飞.基于Lucene中英文语言分析器的设计与实现[J].图书情报工作,2009,53(15):118-121.
作者姓名:马凤娟  吴鹏飞
作者单位:1.石家庄经济学院人文与社科学院;2石家庄学院图书馆
基金项目:石家庄学院社会科学基金重点项目;校级
摘    要:分析Lucene的语言分析器结构,针对其只能进行中文单字、双字切分的不足,采用基于词典的正向最大匹配分词算法,设计并实现基于Lucene的中英文语言分析器ZH_CNAnalyzer,实验结果表明其能够对中英文文档进行高效索引,满足实际应用的需要。

关 键 词:搜索引擎  Lucene  中英文分词  正向最大匹配法  语言分析器  
收稿时间:2009-01-12
修稿时间:2009-04-06

Design and Implementation of Chinese and English Language Analyzer Based on Lucene
Ma Fengjuan,Wu Pengfei.Design and Implementation of Chinese and English Language Analyzer Based on Lucene[J].Library and Information Service,2009,53(15):118-121.
Authors:Ma Fengjuan  Wu Pengfei
Institution:Library of Shijiazhuang University,
Abstract:This paper introduces the structure of analysis in Lucene,designs and implements the chinese and english language ZH_CNAnalyzer which uses forwards maximum match algorithm for  the disadvantage of one-word and two-words segmentation. It can meet the needs of practical application that can index the documents consist of chinese and english words efficiently.
Keywords:Search engine  Lucene  Segmentation  MM  ZH_CNAnalyzer
本文献已被 万方数据 等数据库收录!
点击此处可从《图书情报工作》浏览原始摘要信息
点击此处可从《图书情报工作》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号