首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于句子相似度计算的信息抽取*
引用本文:廉站俊,吕学强,张玉杰,施水才.基于句子相似度计算的信息抽取*[J].现代图书情报技术,2007,2(6):38-41.
作者姓名:廉站俊  吕学强  张玉杰  施水才
作者单位:1. 北京信息科技大学中文信息处理研究中心,北京,100101
2. 大连工业大学信息学院,大连,116011
基金项目:国家高技术研究发展计划(863计划);北京市教委科技发展计划项目
摘    要:提出一种基于句子相似度的信息抽取方法。采用句子主题相似度计算, 对测试语料进行小句主题识别;同时结合句子主题在整个文章中的概率分布特点,提高识别的准确性。以网络上个人信息资源为语料,在该系统上进行测试, 取得较好效果。

关 键 词:概率分布  主题  句子相似度计算
收稿时间:2007-05-10
修稿时间:2007-05-10

Information Extraction Based on Calculation of Sentence Similarity
Lian Zhanjun,Lv Xueqiang,Zhang Yujie,Shi Shuicai.Information Extraction Based on Calculation of Sentence Similarity[J].New Technology of Library and Information Service,2007,2(6):38-41.
Authors:Lian Zhanjun  Lv Xueqiang  Zhang Yujie  Shi Shuicai
Institution:1. Chinese Information Processing Research Center, Beijing Information Science and Technology University,Beijing 100101, China; 2. College of Information Science and Engineering,Dalian Polytechnic University, Dalian 116011 ,China
Abstract:This paper gives a new method of information extraction based on calculation of sentence similarity.The topics of the sentences in testing words are labeled by adopting the method of calculation of sentence similarity.The veracity is increased by referencing the distributing of probability of the sentences in the documents.Using the resources of personal information on Internet,the paper achieves a statistic result.
Keywords:Information extraction Distributing of probability Topic Calculation of sentence similarity
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《现代图书情报技术》浏览原始摘要信息
点击此处可从《现代图书情报技术》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号