首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 734 毫秒
1.
地图空间数据是有关空间位置、专题特征以及时间信息的符号记录,而数据质量是空间数据在表达基本要素时所能达到的准确性、一致性、完整性以及它们三者之间统一性的程度。由于现实世界的复杂性、模糊性以及人类认识和表达能力的局限性,空间数据在表达上不可能完全达到真值,只能在一定程度上接近真值,用户根据需要对空间数据的处理(如删减、扩充等)也会导致出现一定的质量问题。所以空间数据的误差产生于各种数据源及空间数据的输入和处理过程中。文章将对空间数据的误差来源进行分析,并以地图数字化为例说明空间数据质量控制方法。  相似文献   

2.
小区间内分类数学模型是否具有模糊收敛性是处理数学问题分类的关键。对该类数学问题进行建模,验证了小区间内数学分类问题具有可行性和模糊收敛性。通过一种相位重组近邻点收敛的小区间分类算法,分析小区间特征数据点之紧邻点的收敛价值权重,过滤少数局部最佳特征数据的干扰,促进小区间分类数据近邻点的收敛性,提高数据分类收敛速度,采用马维尔条件对小区间数据分类解集进行约束,确保小区间分类模型的不动点存在且收敛,根据马维尔不动点定理得到,不动点产生的上下边界的解集中存在极限点,采用马维尔条件对小区间内分类数学模型的模糊收敛性进行验证。仿真实验对三类实际采集数据集进行模型验证,结果说明模型具有模糊收敛性。  相似文献   

3.
李勇男 《现代情报》2018,38(1):51-55
[目的/意义]聚类分析是数据挖掘的常用方法之一,使用聚类簇内数据相似性大、簇间数据相似性小的特点,可以实现对海量基础涉恐数据快速、准确、有效的分组。[方法/过程]本文研究如何利用基于雅卡尔系数的聚类方法对涉恐情报进行分析。在聚类之前要删减与涉恐相关性小的属性并将所有连续属性进行离散化处理。通过不断迭代计算样本数据集的雅卡尔系数并更新不同簇中的元素,直到达到设定的终止条件为止实现涉恐情报的聚类。[结果/结论]文中的方法可以实现对涉恐基础数据的初步分级分类,同时通过有经验的情报分析员定级以及与数据挖掘分类方法结合使用,可以有效提高情报分析的效率,为反恐预警提供量化的参考依据。  相似文献   

4.
通过挖掘生物信息大数据,从生物信息大数据库中提取感兴趣的数据特征,分析生物信息大数据集的细节结构,提高对生物信息的采集、处理、存储、传播,分析能力。传统的生物信息大数据挖掘模型采用基于小波多窗谱提取的生物信息挖掘算法,由于生物特征的属性权重需求各异,数据挖掘精度不高,提出一种基于梯度采样局部收敛的生物信息大数据挖掘模型。首先构建生物信息大数据库模型和生物信息特征挖掘实体模型,采用提取采样局部收敛方法实现对数据挖掘模型的改进,通过求解最优输入控制序列以及索引系统最优目标函数,实现系统的控制输入和预测,使用梯度采样局部收敛的方法进行生物信息大数据挖掘检测,得到生物信息大数据的梯度采样局部收敛属性集合。仿真结果表明,能实时准确地实现对生物信息的储存、检索和分析,提高数据挖掘能力,收敛精度较高。  相似文献   

5.
瞿娟  丁建丽  孙永猛 《资源科学》2013,35(2):422-429
积雪面积是融雪径流模型中变量数据输入之一,准确的获取雪盖范围是进行流域尺度融雪水文过程研究的关键,在水资源管理及洪水预报中具有重要意义.本文以天山山区中段为例,利用MODIS数据,提出了结合混合光谱分解的积雪分量及灰度共生矩阵提取的纹理特征的SVM分类方法,对研究区积雪面积信息提取进行了研究.结果表明:通过利用混合光谱分解的积雪分量作为SVM的特征输入,总体分类精度比传统SVM分类结果有了一些提高.同时考虑结合基于灰度共生矩阵提取的纹理特征用于分类中,总体精度比传统SVM方法提高了1.081%,制图精度达到了99.01%.本文提出的分类方法能够适应特征组合之间的非线性关系,从而能提供更多的区域地物空间分布信息,能够调整无样本地表类型地区的积雪面积反演,对今后的融雪水文过程研究有重要意义.  相似文献   

6.
在对数学分类模型进行分析的过程中,容易出现分类规则含义不明确,形式复杂等问题,导致传统的数学分类模型,由于采用学习算法对模型参数进行调整,无法有效实现数学分类,提出一种基于改进模糊粗糙集的数学分类模型,在模糊信息观下对模糊粗糙集进行分析。将互信息引入模糊粗糙集的分析中,对模糊决策表中模糊属性的相对重要性进行度量。通过bottom-up形式对相对约简进行计算。将空集作为初始点,依据属性重要性,逐次获取重要属性将其添加至集合中,直至达到终止条件。通过DTRS对数据集进行属性约简,将约简结果当成模型的输入变量。对数学分类模型的输入变量进行离散化处理。对决策表中的重复样本及通过冗余条件获取的决策表进行删除,获取决策规则。通过设定阈值对置信度较低的模糊规则进行过滤,删除因噪声样本形成的错误规则。仿真实验结果表明,所提方法具有很高的分类精度。  相似文献   

7.
基于Sentinel-2A影像特征优选的随机森林土地覆盖分类   总被引:10,自引:0,他引:10  
中南半岛地处热带、亚热带地区,由于水热条件适宜,植被生长旺盛,土地利用强度高,地表覆盖类型的光谱特征时空变异复杂,使用传统的基于光谱特征的遥感分类精度难以保证。Sentinel-2A卫星遥感数据具有较丰富的光谱波段和较高的空间分辨率,为土地覆盖遥感分类提供了多维特征空间。但多维特征参与分类容易造成信息冗余,从而导致分类速度和精度降低。因此,如何充分利用Sentinel-2A数据丰富的光谱和空间信息,并通过高维特征空间降维进行特征优选对于提高分类精度具有重要意义。本文以中南半岛典型地区土地覆盖分类为例,利用Sentinel-2A多波段光谱特征,归一化植被指数(NDVI)、比值植被指数(RVI)、差值植被指数(DVI)、归一化水体指数(NDWI)等指数特征以及对比度、相关性、能量、均值、熵等纹理特征,在随机森林模型框架下,采用平均不纯度减少方法对不同特征在土地覆盖分类中的重要程度进行识别;利用袋外(OOB)误差方法,对重要特征组合进行了优选;利用优选特征进行随机森林土地覆盖分类,并与原始随机森林分类结果进行对比。结果表明:Sentinel-2A影像的光谱特征和纹理特征在土地覆盖分类中具有较为重要的作用,光谱特征中短波红外、可见光、植被红边波段重要性较大,纹理特征中均值、能量法重要性较高。选择重要性列前9位的特征参与分类时,OOB精度达到最高;继续增加特征会使模型复杂度过高,容易发生过拟合而使得分类精度不增反降。通过特征优选高效利用了Sentinel-2A丰富的光谱和纹理信息,其总体分类精度达87.53%,Kappa系数达0.8461,优于原始随机森林方法,一定程度上提高了热带亚热带地区复杂土地覆盖分类精度。  相似文献   

8.
针对PSVM没有考虑不平衡数据的情况,提出一个基于改进PSVM的分类方法(PSVM-2).首先用PSVM对输入集数据进行初次训练,并得到分类超平面的法向量,做输入集在法向量上的投影,利用投影样本点提供的数据改进PSVM,并对输入集数据进行再次分类.实验证明本方法在处理不平衡数据时性能表现良好.  相似文献   

9.
针对传统的微博聚类分析中,只单独针对微博阅读数、评论数等数据(下称微博结构化数据)进行分类或者单独针对由微博内容进行文本分词得到的分词数据(下称微博分词)进行分类的问题,本文采用了Kohonen聚类,研究结合微博结构化数据和微博分词的融合数据聚类的效果是否比单独对微博结构化数据或对微博分词聚类有所提高。实证数据实验结果显示,微博结构化数据单独聚类会出现一个类的标准差特别大(本文称为离群类),而对融合数据聚类,微博结构化数据则不会出现离群类;融合数据聚类结果对微博分词的影响不显著。  相似文献   

10.
肖东岳  张丹 《内江科技》2010,31(5):78-78,161
本文根据目前的模拟测试与数罕测试的比较,提出了场地土特征分析仪的,总体方案和设计思路。将目标定位在以下方面:直接输入土层等效剪切波速和场地覆盖层厚度两组数据就能得到场地土的分类,所得数据能准确地反映出场地土的特征:电路设计采用80C32内核带可编程逻辑的大容量闪存单片机UPSD3234A、128*64图形液晶显示模块、开关电源、外部扩展闪存模块等设计硬件平台。  相似文献   

11.
提出了一种基于自适应遗传算法的特征基因选择方法,首先建立一个基于Bhattacharyya距离的基因差异度模型,根据支持向量机(SVM)分类器的分类准确率选择出一个候选特征基因子集,然后利用自适应遗传算法搜索出一组最优特征基因组合,有效避免了遗传算法早熟收敛的缺陷,提高了全局寻优能力.对结肠癌基因表达谱数据进行仿真实验...  相似文献   

12.
农作物遥感分类特征变量选择研究现状与展望   总被引:5,自引:0,他引:5  
贾坤  李强子 《资源科学》2013,35(12):2507-2516
农作物遥感分类是农作物种植面积估算的重要核心问题,是提高农作物种植面积估算精度的关键研究内容。特征变量的选择是农作物遥感分类的重要步骤,有效地使用多种特征变量是提高农作物遥感分类精度的关键。随着多源数据获取的更加容易,电磁波谱特征、空间特征、时间特征以及辅助数据特征在农作物遥感分类中发挥着重要的作用。本文简要回顾和综合分析了在农作物遥感分类中所使用的各种特征变量,包括多光谱特征、微波散射特征、多源数据特征、高光谱数据特征等电磁波谱特征,以及空间特征、时间特征和辅助数据特征等,并分析了农作物遥感分类特征变量选择方面存在的问题和发展趋势。指出目前农作物遥感分类特征变量选择存在的关键问题主要包括特征变量选择的理论研究不足和综合应用存在缺陷两个方面。未来农作物遥感分类特征选择研究的核心内容主要包括生化组分特征及冠层结构特征等农作物遥感分类新特征变量的挖掘、分类特征变量的综合应用、农作物遥感分类特征变量的敏感性和不确定性研究3个方面。  相似文献   

13.
范昊  何灏 《情报科学》2022,40(6):90-97
【目的/意义】随着社交媒体的发展,各类新闻数量激增,舆情监测处理越来越重要,高效精确的识别舆情新 闻可以帮助有关部门及时搜集跟踪突发事件信息并处理,减小舆论对社会的影响。本文提出一种融合 BERT、 TEXTCNN、BILSTM的新闻标题文本分类模型,充分考虑词嵌入信息、文本特征和上下文信息,以提高新闻标题类 别识别的准确率。【方法/过程】将使用BERT生成的新闻标题文本向量输入到TEXTCNN提取特征,将TEXTCNN 的结果输入到 BILSTM 捕获新闻标题上下文信息,利用 softmax判断分类结果。【结果/结论】研究表明,本文提出的 融合了基于语言模型的 BERT、基于词向量 TEXTCNN 和基于上下文机制 BILSTM 三种算法的分类模型在准确 率、精确率、召回率和F1值均达到了0.92以上,而且具有良好的泛化能力,优于传统的文本分类模型。【创新/局限】 本文使用BERT进行词嵌入,同时进行特征提取和捕获上下文语义,模型识别新闻类别表现良好,但模型参数较多 向量维度较大对训练设备要求较高,同时数据类别只有10类,未对类别更多或类别更细化的数据进行实验。  相似文献   

14.
Anomalous data are such data that deviate from a large number of normal data points, which often have negative impacts on various systems. Current anomaly detection technology suffers from low detection accuracy, high false alarm rate and lack of labeled data. Anomaly detection is of great practical importance as an effective means to detect anomalies in the data and provide important support for the normal operation of various systems. In this paper, we propose an anomaly detection classification model that incorporates federated learning and mixed Gaussian variational self-encoding networks, namely MGVN. The proposed MGVN network model first constructs a variational self-encoder using a mixed Gaussian prior to extracting features from the input data, and then constructs a deep support vector network with the mixed Gaussian variational self-encoder to compress the feature space. The MGVN finds the minimum hypersphere to separate the normal and abnormal data and measures the abnormal fraction by calculating the Euclidean distance between the data features and the hypersphere center. Federated learning is finally incorporated with MGVN (FL-MGVN) to effectively address the problems that multiple participants collaboratively train a global model without sharing private data. The experiments are conducted on the benchmark datasets such as NSL-KDD, MNIST and Fashion-MNIST, which demonstrate that the proposed FL-MGVN has higher recognition performance and classification accuracy than other methods. The average AUC on MNIST and Fashion-MNIST reached 0.954 and 0.937, respectively.  相似文献   

15.
高亚琪  王昊  刘渊晨 《情报科学》2021,39(10):107-117
【目的/意义】针对当前利用计算机管理图像资源存在图像语义特征表达不足等问题,探索和分析了特征及 特征融合对分类结果的影响,提出了一种提高图像语义分类准确率的方法。【方法/过程】本文定义了四种图像风 格,将图像描述特征划分为三个层次,探究特征融合的特点,寻求能有效表达图像语义的特征。分别采用SVM、 CNN、LSTM 及迁移学习方法实现图像风格分类,并将算法组合以提高分类效果。【结果/结论】基于迁移学习的 ResNet18模型提取的深层特征能够较好地表达图像的高级语义,将其与SVM结合能提高分类准确率。特征之间 并不总是互补,在特征选择时应避免特征冗余,造成分类效率下降。【创新/局限】本文定义的风格数目较少,且图像 展示出的风格并不绝对,往往可以被赋予多种标签,今后应进一步丰富图像数据集并尝试进行多标签分类。  相似文献   

16.
为去除网络入侵数据集中的冗余和噪声特征,降低数据处理难度和提高检测性能,提出一种基于特征选择和支持向量机的入侵检测方法。该方法采用提出的特征选择算法选取最优特征组合,并以支持向量机为分类器建立模型,应用于入侵检测系统。仿真结果表明,本文方法不仅可以减少特征维数,降低训练和测试时间,还能提高入侵检测的分类准确率。  相似文献   

17.
基于光谱特征的遥感图像信息提取方法存在分类精度和效率低的不足,在ENVI软件下采用基于灰度共生矩阵提取纹理特征的方法,将纹理特征参与到光谱特征中进行分类,并与基于光谱单源数据分类进行分析和比较。实验结果表明,纹理特征参与分类在一定程度上提高了遥感图像的分类精度。  相似文献   

18.
One of the important problems in text classification is the high dimensionality of the feature space. Feature selection methods are used to reduce the dimensionality of the feature space by selecting the most valuable features for classification. Apart from reducing the dimensionality, feature selection methods have potential to improve text classifiers’ performance both in terms of accuracy and time. Furthermore, it helps to build simpler and as a result more comprehensible models. In this study we propose new methods for feature selection from textual data, called Meaning Based Feature Selection (MBFS) which is based on the Helmholtz principle from the Gestalt theory of human perception which is used in image processing. The proposed approaches are extensively evaluated by their effect on the classification performance of two well-known classifiers on several datasets and compared with several feature selection algorithms commonly used in text mining. Our results demonstrate the value of the MBFS methods in terms of classification accuracy and execution time.  相似文献   

19.
Preprocessing is one of the key components in a typical text classification framework. This paper aims to extensively examine the impact of preprocessing on text classification in terms of various aspects such as classification accuracy, text domain, text language, and dimension reduction. For this purpose, all possible combinations of widely used preprocessing tasks are comparatively evaluated on two different domains, namely e-mail and news, and in two different languages, namely Turkish and English. In this way, contribution of the preprocessing tasks to classification success at various feature dimensions, possible interactions among these tasks, and also dependency of these tasks to the respective languages and domains are comprehensively assessed. Experimental analysis on benchmark datasets reveals that choosing appropriate combinations of preprocessing tasks, rather than enabling or disabling them all, may provide significant improvement on classification accuracy depending on the domain and language studied on.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号