基于Lucene的校园中文问答采集平台检索技术研究与实现 |
| |
引用本文: | 吴志霞,叶根梅,甘丽.基于Lucene的校园中文问答采集平台检索技术研究与实现[J].通化师范学院学报,2023(10):88-92. |
| |
作者姓名: | 吴志霞 叶根梅 甘丽 |
| |
作者单位: | 1. 南京特殊教育师范学院数学与信息科学学院;2. 马鞍山师范高等专科学校软件工程系 |
| |
基金项目: | 安徽省自然科学重点研究项目(KJ2020A0884);;安徽省优秀青年人才支持计划项目(gxyq2021264); |
| |
摘 要: | 随着人工智能的快速发展,服务特殊领域的校园自动问答系统成为一个研究方向.自动问答系统涉及信息检索技术的应用,它是根据用户的提问,从问答库中快速匹配出相似问句反馈给用户的一种检索系统.该研究运用Lucene搜索架构,将中文问答采集平台采集到的问答数据库建立检索,对问题创建查询分析器,执行信息检索,从而快速获取候选问题集.论文详细阐明基于Lucene搜索架构对问答数据检索的实现方案及步骤.使用14万条数据测试了其搜索性能,查询平均耗时小于1 s,比MySQL数据库模糊检索效率高,匹配结果能按相关度排序并突出显示,能够提供高效灵活的海量问答检索服务.
|
关 键 词: | Lucene 问答系统 倒排索引 |
|