首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
传统句子相似度算法没有全面考虑句子结构与语义特征,影响相似度计算准确性,对此提出一种基于句法块向量的句子相似度计算方法。该方法综合考虑句子的语义信息与结构信息,首先构建两句子的语义依存关系树,然后进行一些被动转换等操作,最后根据词向量构建各个句法块向量并通过余弦值计算句子相似度。在常规句子对中进行测试实验,结果表明,综合句子结构与语义信息可提高相似度计算准确性。一般句子相似度计算正确率达到92%,比传统方法提高8%~10%。  相似文献   

2.
提出了基于大规模语料库的多引擎翻译系统模型的构建,该模型主要包括三大部分:基于层次化长句分解和支持向量机基本名词识别的句法分析器、基于实例匹配的翻译子引擎、基于语块的统计翻译子引擎.该语言翻译模型综合各个翻译模型的优点,最大程度地提高机器翻译的准确率和召回率.实验表明该系统的各项指标都比较理想,尤其是处理效率很高.  相似文献   

3.
介词短语是使用频率很高的一类短语。学们也对介词短语做了许多研究。本主要讨论三个问题:一是介词的辖域,对介词的辖域理解不同,会直接影响到句子分析的正确性;二是介词短语的句法功能,对目前语法学界的几种观点作了评述,提出了有限功能说;三是在人们研究的基础上,借鉴格语法理论,对介词短语的语义功能作了分类研究。  相似文献   

4.
英汉介词与介词短语有相似之处:介词在句法中都起定位、粘着作用;介词短语的主要句法功能都是用作状语。不同之处是:在句法结构方面,英语介词与介词短语的句法特征说明英语语法以形统意;汉语介词与介词短语的句法特征说明汉语语法以意治形。在句法功能方面,英语介词短语的语序不影响句子的语意;汉语介词短语的语序决定句子的语意。英汉表示时间与地点的介词短语的语序反映了两个民族认知方式的差异。  相似文献   

5.
为提高大数据集粗分类识别率,提出一种基于聚类分析的SVM-Kd-tree树型粗分类方法。首先根据数据集特征分布进行k-means两簇聚类,对聚类后的数据集进行类别分析,同时将属于两簇的同一类别样本划分出来;然后使用两簇中剩余样本训练SVM二分类器并作为树型结构根节点,将两簇数据分别合并,将划分出来的样本作为左右子孩子迭代构建子节点,直到满足终止条件后,叶子节点开始训练Kd-tree。实验结果表明,迭代构建树型粗分类方法使训练单一SVM平均时间减少了61.977 4%,比Kd-tree同近邻数量的准确率提高了0.03%。在进行大规模数据集粗分类时,使用聚类分析迭代构建组合分类器时间更短、准确率更高。  相似文献   

6.
唐友军 《海外英语》2012,(12):267-269
英语分词后置结构在传统语法中被普遍认为可以充当补语和定语,在结构上一致被认为是分词短语。该文基于系统功能语法分析,从概念功能的角度提出了充当补语和定语的区分标准;并以系统功能语法理论为指导,对该结构进行了句法分析,得出其是级转移小句而不是传统上所说的分词短语的结论。  相似文献   

7.
句子成分分析在语法教学中是重点,也是语法研究与语法分析的一大难点。本文讨论句子成分分析,提出了几个原则性问题:结合具体语句区分短语成分与句子成分、在句法分析中仔细辨析各种句子成分、联系前后语境分辨句子成分个数、划分出的各个句子成分必须都能成结构体、切分的各修限成分必须与基本中心语组合、划分句子成分以不改变句子原义为前提。  相似文献   

8.
语序是汉语功能很强的语法手段,它在语用中促成了动词形容词僭越句子主宾语和名词性短语中心语位置这一典型现象。语序与语义特征及个别句式历时材料的有机结合是诠释这一现象的一种尝试。  相似文献   

9.
针对实际电能质量扰动种类繁多、扰动信号差异不明显、存在多种混合扰动,导致识别电能质量非常困难的情况,提出一种基于极点对称经验模式分解方法(ESMD)和支持向量机(SVM)的电能质量混合扰动信号分类识别新方法。首先,对加入白噪声的混合扰动信号利用小波软阈值去噪处理|其次,利用ESMD将信号分解为不同信号分量,对每类扰动的不同信号分量分别提取样本熵和互样本熵特征值,所有分量特征值构成特征向量|最后利用SVM对扰动信号特征向量进行分类和混合扰动识别。研究表明,该方法对混合扰动识别正确率很高,是一个有效的方法。  相似文献   

10.
在局部二进制模型和多分辨率分析的基础上,提出一种基于局部频域分析的多尺度纹理特征提取方法。对纹理图像采用局部圆形邻域作为局部模板进行局部频率变换,对各频段图像实现多分辨率分析,提取多尺度下的特征向量,结合SVM算法进行分类实验。结果证明,该方法在继承了LBP对光照因素具有的稳定性的同时,具有旋转不变性特征;利用NSCT在多尺度下进行的纹理特征提取也满足尺度不变性的需要,与其他方法相比提高了分类准确率。  相似文献   

11.
汉语丰富的语气副词是句子、语篇和语境情态高度词汇化的表现,其篇章、预设和推理功能使表达更为简洁。而与汉语语气副词相应的英语表达并不局限于词汇形式,英语另有重音、语法隐喻、情态名物化、介词短语、动词短语、特殊句式、篇章逻辑等多种形式。由此可知,汉语表现情态义的词汇比英语更丰富,而英语表现情态义的非词汇形式更为多样。  相似文献   

12.
短语是汉语重要的造句材料,主谓短语包含的主谓关系是汉语最基本的五种句法关系之一。它在句中可以充当主谓句,可以担任多种句子成分。根据主谓短语中谓语的词性不同,其功能类别可以分属名词性短语、动词性短语和形容词性短语。  相似文献   

13.
为了在保证检测准确率的前提下提高检测效率,并优化SDN网络中基于流表特征的DDoS攻击检测算法,主要分析基于流表特征的DDoS攻击检测技术及其存在的不足,提出首先利用主成分分析优化流表特征,从中选出合适的特征子集,并采用支持向量机算法实现分类检测;然后搭建仿真网络环境,利用正常数据集与攻击数据集训练分类器进行测试实验;最后从检测准确率与检测时间两个维度对特征降维前后的检测方法进行对比。实验结果表明,经过特征降维的检测方法在不影响准确率的同时,有效提高了检测速率。  相似文献   

14.
在中文信息处理中,句子相似度计算是一项基础而核心的研究课题,长期以来一直是人们研究的一个热点和难点.句子相似度计算在实际中有着广泛的应用,它的研究状况直接决定着其他一些相关领域的研究进展,如信息检索的相似句子匹配、自动问答的问题匹配与答案抽取等,句子相似度计算都是非常重要的环节.本文提出了一种基于依存关系匹配的句子相似度计算方法,利用词语内在概念和词语相互依存关系计算句子之间的相似度.结果表明,该算法能显著提高返回结果的准确率.  相似文献   

15.
为了平衡和减少两类不平衡数据的错分率,针对两类不平衡数据的分离超平面的偏置提出一种调整方法。该方法以两类错分概率相等为准则,使用特征提取方法,把高维样本投影到标准支持向量机的法向量上得到一维数据,当一维投影数据服从正态分布时,可由它所提供的信息,对标准的支持向量机中分离超平面的偏置进行调整。随机模拟试验表明了所调整的超平面不仅平衡了错分率而且减少了错分率。与现有方法相比,该方法具有较高的精度。  相似文献   

16.
Intrusion detection using rough set classification   总被引:2,自引:0,他引:2  
Recently machine learning-based intrusion detection approaches have been subjected to extensive researches because they can detect both misuse and anomaly. In this paper, rough set classification (RSC), a modern learning algorithm, is used to rank the features extracted for detecting intrusions and generate intrusion detection models. Feature ranking is a very critical step when building the model. RSC performs feature ranking before generating rules, and converts the feature ranking to minimal hitting set problem addressed by using genetic algorithm (GA). This is done in classical approaches using Support Vector Machine (SVM) by executing many iterations, each of which removes one useless feature. Compared with those methods, our method can avoid many iterations. In addition, a hybrid genetic algorithm is proposed to increase the convergence speed and decrease the training time of RSC. The models generated by RSC take the form of "IF-THEN" rules, which have the advantage of explication. Tests and compa  相似文献   

17.
Recently machine learning-based intrusion detection approaches have been subjected to extensive researches because they can detect both misuse and anomaly. In this paper, rough set classification (RSC), a modem learning algorithm,is used to rank the features extracted for detecting intrusions and generate intrusion detection models. Feature ranking is a very critical step when building the model. RSC performs feature ranking before generating rules, and converts the feature ranking to minimal hitting set problem addressed by using genetic algorithm (GA). This is done in classical approaches using Support Vector Machine (SVM) by executing many iterations, each of which removes one useless feature. Compared with those methods, our method can avoid many iterations. In addition, a hybrid genetic algorithm is proposed to increase the convergence speed and decrease the training time of RSC. The models generated by RSC take the form of"IF-THEN" rules,which have the advantage of explication. Tests and comparison of RSC with SVM on DARPA benchmark data showed that for Probe and DoS attacks both RSC and SVM yielded highly accurate results (greater than 99% accuracy on testing set).  相似文献   

18.
英语写作是反映学生英语综合水平的一个首要问题。学生在英语写作中要写好句子和段落,按《大学英语四级教学大纲》的要求写好内容,才能逐步提高大学生的英语写作水平。  相似文献   

19.
等式句与对等句是两种从形式上看上去极为相似的句式。然而如果对其进行语义分析 ,它们是截然不同的。因此 ,文章试图从句子中名词词组的指称关系、句子的客观真值性 ,句中系动词的形式及其语义功能等方面对等式句与对等句加以分析比较  相似文献   

20.
基于条件随机场的语义角色标注   总被引:2,自引:0,他引:2  
由于语义角色标注对深层次的自然语言处理非常必要,提出了一种基于条件随机场的语义角色标注方法.该方法以浅层句法分析为基础,把短语或命名实体作为标注的基本单元,将条件随机场模型用于句子中谓词的语义角色标注.该方法的关键在于模型的参数估计和特征选择.具体应用中采用L-BFGS算法学习模型参数,并选择基于句法成分的、基于谓词的、句法成分-谓词关系三类特征作为模型特征集.在CoNLL-2005评测任务所提供的数据集上的实验结果表明:基于条件随机场的方法比基于最大熵模型的方法性能更好.该方法在语义角色标注任务上获得了80.43%的准确率和63.55%的召回率.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号