共查询到20条相似文献,搜索用时 78 毫秒
1.
《科技通报》2016,(4)
针对标准EM算法在汉语分词的应用中还存在收敛性能不好、分词准确性不高的问题,本文提出了一种基于极大似然估计规则优化EM算法的汉语分词认知模型,首先使用当前词的概率值计算每个可能切分的可能性,对切分可能性进行"归一化"处理,并对每种切分进行词计数,然后针对标准EM算法得到的估计值只能保证收敛到似然函数的一个稳定点,并不能使其保证收敛到全局最大值点或者局部最大值点的问题,采用极大似然估计规则对其进行优化,从而可以使用非线性最优化中的有效方法进行求解达到加速收敛的目的。仿真试验结果表明,本文提出的基于极大似然估计规则优化EM算法的汉语分词认知模型收敛性能更好,且在汉语分词的精确性较高。 相似文献
2.
3.
藏文自动分词是藏文信息处理中一项不可缺少的基础性工作,是藏文搜索引擎、语法信息词典建设、机器翻译、语音合成、文本自动分类、自动摘要、自动校对等等研究的基础工作。藏文自动分词中歧义消除也是关键技术,本文提出了藏文交集型歧义的切分方法即双向扫描识别和最大概率分词算法进行处理的方法。 相似文献
4.
5.
针对目前OCR技术在后处理阶段多采用基于词的匹配技术而无法识别单字词的问题,提出了一种基于NLP的后处理技术。该技术通过采用词法切分法和语法匹配法,能够有效地利用上下文的语法语义信息。其中词法切分法采用的是中科院计算所提供的汉语分词技术,语法切分法以北大的《现代汉语语法信息词典》为基础。实验结果表明,采用该技术能大大提高句子中的单字词识别率,从而提高全文的整体识别率。 相似文献
6.
7.
8.
9.
因特网经济学未登录词计算机辅助挖掘试验 总被引:2,自引:0,他引:2
近年来随着社会经济科技和因特网的迅速发展,文献中不断涌现出大量未登录词。未登录词的存在严重影响了汉语自动分词与自动标引的准确率和速率。本文对1000篇经济类网页的关键部位———题名、摘要、关键词、首段进行未登录词挖掘试验,侧重对未登录词挖掘步骤设计和处理方法的讨论。 相似文献
10.
一种基于词典的中文分词法的设计与实现 总被引:1,自引:0,他引:1
中文分词就是把没有明显分隔标志的中文字串切分为词串,它是其他中文信息处理的基础,广泛应用于搜索引擎、自动翻译、语音合成、自动分类、自动摘要、自动校对等领域。就中文分词的基本方法作了简单阐述,并介绍了一种基于词典采用最大匹配法实现中文分词的方法。 相似文献
11.
12.
中文自动分词技术是自然语言处理领域一项很重要的基础工作,随着信息的几何级增长,对目前的分词方法提出了更高要求.本文从中文分词的研究现状出发,首先列举了一些具有代表性的典型分词系统,比较了当今主流的三种分词方法:基于字符串匹配、基于理解和基于统计的分词方法,并对分词问题中的歧义和未登录词识别两大难点进行了重点讨论,最后总结归纳了中文分词技术的研究进展.并对其未来发展方向进行了展望. 相似文献
13.
《Journal of The Franklin Institute》2007,344(3-4):257-284
Segmentation of the tumor in computed tomographic (CT) images of neuroblastoma is a difficult problem due to its heterogeneity. In this paper, we present a survey of the nature, diagnosis, and management of the disease, and explore the potential application of image processing methods for the segmentation and analysis of the tumor. In particular, we study the use of opening-by-reconstruction and fuzzy connectivity to guide the segmentation process. We also investigate various strategies to improve the resulting tumor definition, including prior delineation of peripheral artifacts, peripheral fat, peripheral muscle, and the spinal canal, as well as postprocessing by morphological methods and deformable contours. Results of application of four procedures to 10 CT exams of four patients are analyzed. It is shown that opening-by-reconstruction is faster (by a factor of about 19) and provides a higher true-positive rate (83% versus 78%) than fuzzy connectivity. Leakage of the result of segmentation into neighboring structures remains to be a problem in cases where the tumor is significantly heterogeneous. Regardless, image processing methods could play an important role in improved management of neuroblastoma. 相似文献
14.
15.
一种基于活动围道的纹理图像分割方法 总被引:1,自引:0,他引:1
本文将Gabor滤波器和各向异性扩散方程相结合,提出了一种基于活动围道的无监督纹理图像分割算法。采用基于总变分流的扩散函数,各向异性扩散方程可以有效地在保留纹理图像大尺度边界信息的同时对图像纹理区域进行平滑,获得比原始图像更易分割的简化图像。但是平滑过程中纹理信息的丧失,限制了该方法的通用性和有效性。为了在利用各向异性扩散方法的同时有效地提取和利用纹理信息,我们利用Gabor滤波器提取一组表征纹理方向性和尺度性的特征图像,同时将原始图像作为表征纹理灰度信息的一个特征通道考虑。再利用矢量形式的各向异性扩散方程对特征图像进行边界保持的各向异性平滑。我们将基于区域灰度统计参数估计的活动围道分割方法扩展到矢量空间,来对平滑后的纹理特征量进行分割。实验证明利用该纹理分割算法可以获得较好的效果。 相似文献
16.
基于词链的自动分词方法 总被引:4,自引:1,他引:3
An algorithm for automatic segmentation of Chinese word,which is an improved version of the minimum matching algorithm,is put forward.The key idea of the algorithm is to optimize the word bank and the matching process to enhance the speed and accuracy of word segmentation.By integrating the case bank for processing ambiguous word chain with relevant segmentation rules,the correctness of word segmentation is enhanced,which partly makes up the deficiency in processing natural language. 相似文献
17.
灰度图像的分割通常都基于灰度的梯度变化。平均边沿梯度法常被使用以取得好的边沿效果,如,Sobel、Prewitt及Kirsch边沿算子。这些算子使用梯度和梯度的平均值来达到去噪和边沿检测,但忽略了增强图像边沿。通过把图像像素点看成受陷于能量为陷阱中的量子,我们得到相邻像素点对中心点的贡献与该点地灰度成线性关系。由此,本文提出了一个边沿分割方法。该方法不仅能够具有好的去噪效果,同时还具有锐化图像边沿的效果。 相似文献
18.
阅读历来都是语言教学中最重要的组成部分,培养大学生具有较强的阅读能力一直是大学英语教学的首要目标,但阅读同时也是许多英语学习者的“一道坎儿”。在大学英语阅读教学中加入阅读技巧的讲解和训练能让语言学习者达到事半功倍的效果。基于“顺句驱动”原则的断句技巧便于学习者清晰地了解句子的结构,迅速抓住语篇的具体信息,加强对语篇的理解,从而提高阅读速度和理解能力。 相似文献
19.
人类年龄分段自古有之,然而古今中外关于人年龄的分段受当时时代的限制和地域文化的不同而有很大的差别。我国成立以来,在中国人年龄的分段定义中,也有新的改动。本文利用文献资料法、调研法以及归纳总结的方法,纵向对比了中国历史和现代关于年龄分段的基本情况,也参考了国外和世界卫生组织对于人类年龄分段的定义,从体育学的角度,阐述了科学的符合时代的人类年龄分段对于体育学的积极意义,明确指出中国人由于经济的繁荣使我们的饮食水平有了很大的提高,从而使得国人的青春期有所提前这一现象。同时,指出了由于人们养生知识的普及和医疗卫生事业的进步,中国已经进入老龄社会这一实际情况,结合中国传统养生文化,建立了时代特色比较鲜明的人类年龄分段模式构想,以期能从生理锻炼和心理影响方面提高国人的身体素质,为我们终身体育的发展和延长人民寿命做出一份努力。 相似文献
20.
提出一种基于sOM神经网的方向纹理分割方法.该方法首先利用方向特征模板提取遥感影像四个方向的特征,构成特征向量;再利用SOM神经网进行影像分割.文中将提供使用K-均值进行分割的遥感影像与使用本文方法进行分割的遥感影像进行对比,结果表明使用本文方法的效果好于使用K-均值算法的效果. 相似文献