浅探河北省主要旅游景点旅游文本语料库建设中的人名标注问题 |
| |
作者单位: | ;1.张家口市第五中学北校区;2.河北大学外国语学院 |
| |
摘 要: | 本文以河北省主要旅游景点的旅游文本为主、初步建立起一个小型封闭的语料库,并针对该语料库自动分词过程中人名的识别与切分出现的问题进行分析探讨。所收集语料来源于河北省主要旅游景点旅游文本,共计73471字,通过对语料的分词处理发现人名标注出现问题的频率较高。笔者将人名在语料自动切分中出现的问题归为三类,分别探讨问题出现的原因,并根据现有研究成果和旅游文本语料的特点为解决此问题做出简单设想,分析想法的可行性。
|
关 键 词: | 旅游文本 语料库 人名 标注 |
A Preliminary Exploration on the Tagging of the Names in the Corpus Construction for Tourism Texts of the Main Scenic Sites in Hebei Province |
| |
Abstract: | |
| |
Keywords: | |
|
|