共查询到20条相似文献,搜索用时 879 毫秒
1.
本文依据文献计量学的原理与方法,对2004-2008年5年发表的有关中文分词研究领域的论文进行了分析研究。通过对中文分词研究作者分析和文献分布分析,对我国在中文分词领域的研究现状进行了探讨。 相似文献
2.
通过对已有的分词算法尤其是快速分词算法的分析,提出了一种新的分词词典结构,并据此提出了二次Hash^+二分最大匹配快速分词算法。该算法具有较快的分词速度。 相似文献
3.
中文自动分词技术是自然语言处理领域一项很重要的基础工作,随着信息的几何级增长,对目前的分词方法提出了更高要求.本文从中文分词的研究现状出发,首先列举了一些具有代表性的典型分词系统,比较了当今主流的三种分词方法:基于字符串匹配、基于理解和基于统计的分词方法,并对分词问题中的歧义和未登录词识别两大难点进行了重点讨论,最后总结归纳了中文分词技术的研究进展.并对其未来发展方向进行了展望. 相似文献
4.
汉语自动分词技术的最新发展及其在信息检索中的应用 总被引:2,自引:0,他引:2
分析了汉语自动分词与自然语言处理、自动分词与信息检索之间的关系,在此基础上,介绍了近年来自动分词系统实现的技术,分析了自动分词技术在信息检索中应用的有关问题。 相似文献
5.
一种快速中文分词词典机制 总被引:3,自引:0,他引:3
通过研究目前中文分词领域各类分词机制,注意到中文快速分词机制的关键在于对单双字词的识别,在这一思想下,提出了一种快速中文分词机制:双字词-长词哈希机制,通过提高单双字词的查询效率来实现对中文分词机制的改进.实验证明,该机制提高了中文文本分词的效率. 相似文献
6.
7.
藏文分词是藏文信息处理的基础,歧义问题是藏文分词的一个难点,而交集型歧义问题占藏文分词歧义问题的90%以上,因此,对交集型歧义问题的研究是藏文分词研究的一个重点。本文通过统计分析,按藏文文本中交集型歧义的规则特点,给出了一种改进的藏文分词交集型歧义消解方法,从而进一步提高了藏文自动分词的准确率。 相似文献
8.
针对在科技文献中,未登录词等相关专业术语其变化多端,在中文分词中难以识别,影响了专业领域文章的分词准确度,结合实际情况给出了一种基于专业术语提取的中文分词方法。通过大量特定领域的专业语料库,基于互信息和统计的方法,对文中的未登录词等专业术语进行提取,构造专业术语词典,并结合通用词词典,利用最大匹配方法进行中文分词。经实验证明,该分词方法可以较准确的抽取出相关专业术语,从而提高分词的精度,具有实际的应用价值。 相似文献
9.
一种基于多重哈希词典和K-最短路径算法的中文粗分词方案研究 总被引:1,自引:1,他引:0
本文在已有研究基础上,针对中文粗分词,设计了多重哈希词典结构,以提高分词的词典匹配效率,同时基于删除算法改进了中科院ICTCLAS分词系统的K-最短路径搜索思想.最后,论文对所研究技术方案进行了系统实现.系统实验结果表明,对于大规模文本,论文所提出的粗分词方案体现出了很好的性能. 相似文献
10.
基于相邻知识的汉语自动分词系统研究 总被引:2,自引:0,他引:2
本文通过对计算机汉语自动分词的分析和研究,提出了基于相邻知识的自动分词方法。介绍了汉语分词系统,该系统的自学习机制,提高系统运行效率的方法,指出了进一步发展的方向。 相似文献
11.
12.
对于人多地少的中国而言,抑制当前城市化发展中出现的城市用地无序扩张现象,是一个重要且急迫的问题,而政策调控的前提条件则是理清城市用地扩张的驱动机制。通过对中国不同规模、不同行政级别城市用地扩张驱动机制的差异性进行分析,本文尝试着构建了一个更为细化的城市用地扩张理论框架,并利用2001-2011年中国243个城市的面板数据进行了固定效应模型检验,证明了本文所提出的工作假说。研究结果表明:①人口对城市扩张的作用随城市规模升高而递减。小城市用地受到三产业发展推动,而中等城市、特大城市用地则受到二产业发展的推动,其中特大城市受到二产发展更强的影响。大、特大城市较之中小城市,用地扩张受到政府财政支出更强的推动。政府招商引资行为仅对大城市用地扩张有促进作用,对于小、特大城市反而有抑制作用。土地财政的增加也会显著推动城市用地扩张;②相比于地级市,高行政级别城市的政府财政支出对其用地扩张有着更强影响。由于高行政级别城市中政府干预能力较强,土地资源存在错配的问题,二产业仍然是高级别城市、特别是特大城市中用地扩张的强影响力因素,这则有悖于城市发展中产业结构变化的一般趋势。在证明了城市间存在异质性之后,本文建议,相应的城市用地调控政策应该意识到城市间的异质性,有针对性地给出治理政策。 相似文献
13.
14.
本文采用加权秩和比的评价方法,对1993年全国各省(市)高校的科研综合实力进行了评价和排序,为定量评价科研的综合实力和效益提供一种新的方法. 相似文献
15.
科学评判生态退耕区农业土地利用可持续性的变化特征,对相关政策的完善具有重要的意义。本文以甘肃正宁县为案例区,从土地投入水平合理度、土地产出效益、环境支持力、政策补贴4组准则出发,选取了影响农业土地利用可持续性的15个指标,构建了基于1995-2010年时间序列数据的测算体系,并通过相对接近度法(TOPSIS),来多层次衡量农业土地利用的可持续性时序变化特征。最后采用层次聚类法,基于全部指标对研究年份进行聚类,进而区分研究区农业土地利用可持续性变化的时间节点。结果表明:①构建的土地投入水平合理度指数C(I)、土地产出效益指数C(O)、环境支持力指数C(E)和农业土地利用可持续性指数C(T)时序曲线都表现出明显的波动上升的趋势,C(T)最大值为2002年的0.77,最小值为1995年的0.20;②通过层次聚类分析将正宁县退耕前后16年的农业土地利用可持续性特点划分为:1995-2002年的波动调整阶段、2003-2007年的稳定增长阶段和2008-2010年的巩固预警阶段。 相似文献
16.
17.
18.
供应链管理在高校数字化图书馆中的应用研究 总被引:2,自引:0,他引:2
本文针对当前高校新型数字化图书馆建设中存在的问题,提出了供应链管理系统的运用,探讨了实施的一系列措施及作用。对高校图书馆的建设具有参考作用。 相似文献
19.
20.
多媒体技术已成为一种现代化的辅助教学手段。本文详细论述了多媒体在高职物理教学中的定位及巧用,从而引导教师在教学中更好地调动学生学习的积极性,让学生更好地掌握物理规律;最后阐述了运用多媒体进行辅助教学应注意的问题。 相似文献