首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 62 毫秒
1.
主要分析了时间戳协议设计中应考虑的各种因素以及设计时间戳协议的一般方法,并在此基础上,提出了一个十进制时间戳协议.在某些情况下,人们需要证明某个文档产生的时间不晚于或不早于某个时间点,这就需要给该类文档加上时间信息,即时间戳.  相似文献   

2.
陈志雄 《内江科技》2007,28(9):25-26
本文设计和实现了一个中文新闻主题追踪系统TDTsystem,采用构成新闻事件的四个要素“人物、地点、时间、关键词”作为文档/事件模型,并提出了一个基于信息增益的关联分类算法(ACBIG),结合信息增益与FoilGain来提高文字的分类有效性。实验分析结果表明,采用这种文档/事件模型和ACBIG分类算法的TDTsystem取得了超过90%的主题追踪准确率。  相似文献   

3.
李海林  林春培 《科研管理》2022,43(1):176-183
   鉴于传统方法对科研成果关键词研究存在较强主观影响和较少考虑时间因素等问题,提出基于时间序列聚类的科研成果关键词分析方法。该方法通过统计分析方法验证关键词出现顺序在一定程度上反映了关键词反映主题思想的重要性,将关键词的重要度转化为时间序列数据,分别从重要度的数值和趋势两个角度出发,使用动态时间弯曲方法度量关键词重要度时间序列数据之间的相似性,结合近邻传播方法对关键词时间序列数据之间的相似性矩阵进行聚类分析,实现科研成果的关键词分析研究。通过对某科研管理类重要期刊2008—2017年期间刊发的科研成果论文关键词研究发现:新方法不仅可以对科研成果中关键词的关注热度和趋势进行聚类划分,自适应地找到中心关键词作为相应类别的特征代表对象,还能为科研成果关键词的主题分析提供理论方法和决策支持。  相似文献   

4.
【目的/意义】目前在多文档自动摘要方面,研究者们主要关注于获取多文档集合中的重要主题内容,提出的很多自动摘要方法在提高摘要代表性的同时却忽略了文档中的潜在主题。【方法/过程】针对于多文档自动摘要中存在的冗余度较高且不能全面反映主题内容的问题,本文提出了一种基于句子主题发现的多文档自动摘要方法。该方法将多篇文档转换为句子集合,利用LDA主题模型对句子进行聚类分析与主题发现,并通过word2vec训练词向量计算句子的相似度;最终在主题之下通过TextRank算法来计算句子重要性,并结合句子的统计特征生成多文档集合的摘要。【结果/结论】通过人工测评的结果表明,本文提出的多文档自动摘要方法在主题覆盖性、简洁性、语法性等方面都取得了不错的效果。  相似文献   

5.
张杰  赵峰  孙曰瑶 《情报杂志》2012,(9):163-168
多变量数据流精确分类问题是当前数据挖掘与信息领域的热点和难点,引起国内外越来越多研究群体的关注,但以往的研究大多依赖于从单个流中提取特征并进行分类,没有考虑数据流内以及数据流间特征的相互依赖关系.基于此,借鉴生物信息学中基序查找的方法,提出了长期频率和逆文档频率的分类方法,该方法主要是将每个输入流都转化为符号序列来描述信号变化特征,并将符号分为长度不同的块,以便更有效地提取基序;通过计算基序的频率、长期频率与逆文档频率的权重,用以衡量不同输入多变量数据流的基序之间的时序关系,并利用了基序与时序关系实现了对多变量数据流的分类,从而确保了多变量数据流分类的准确性,仿真实验的结果也证明该方法的有效性.  相似文献   

6.
鉴于在目前的技术机会识别中存在研判的创新路径往往较为抽象和模糊,并在很多情况下需领域专家参与解读的问题,以冷库技术为例,研究构建基于文本挖掘、机器学习算法及多维空间专利地图的技术创新路径识别模型。首先,构建技术创新路径识别框架对相关专利文献进行分词、清洗等预处理并建立知识图谱;其次,采用融合词频-逆文档频率(TF-IDF)文本挖掘方法对专利文档提取关键词,继而采用隐含狄利克雷分布(LDA)算法对主题聚类降维并萃取创新维度;再次,依据目标技术问题和目标优选创新法则耦合变换于多维空间专利地图并具象出具有现实意义、有价值前景的创新路径;最后,利用可拓学计算各创新路径综合关联度评级优选。以期减少创新成本、提高创新效率,为企业精准开展技术创新、不断提升核心竞争力提供决策参考。  相似文献   

7.
基于改进VSM的中文问答系统研究   总被引:1,自引:0,他引:1  
针对向量空间模型中的权重计算公式仅考虑词语项在文档中的相关频数,提出词语项本身的领域权重概念,改进了向量空间模型的权重计算.同时结合关键词距离和关键词顺序信息,实现了句子相似度计算,以特定课程的FAQ库检索作S@n测试对比,结果表明改进后的相似度模型提高了s@n值  相似文献   

8.
耿贞伟  马文  张雪坚 《科技通报》2019,35(7):165-168,173
针对当前现有的密文技术存在的不足进行改进,本文提出一种新的安全密文模糊检索算法,该算法的原理是依据关键词在文档的出现的频率进行关键词语义词库的构建。在进行检索的时候,云服务商可以对用户提交的检索关键词利用算法进行扩展,由扩展得到的关键词进行检索,然后对所检索文档进行相关度的排序,返回结果(用户可以指定结果的数量限制,若是设限,则只返回指定数量的方档)。仿真实验结果表明,本文提出的安全密文模糊检索算法具有良好的关键字检索的效率以及安全性能。  相似文献   

9.
众所周知microsoft office功能强大,从中我们可以近挖据出许多提高我们工作效率的方法。本文对招标文件编制中出现频率超高的关键词的编辑问题进行讨论,充分利用word软件的文档部件中的"文档属性"来提高文档编辑效率。  相似文献   

10.
刘玉文  刘月华  杨枢  张钰 《现代情报》2017,37(12):35-41
网络舆论主题情感在线分析对舆情研判与管理起着十分重要的作用,当前的主题情感模型存在着主题与情感建模关系不紧密,情感挖掘偏斜等问题,容易造成舆情误判。文本在OLDA(On-Line Latent Dirichlet Allocation,OLDA)模型的基础上引入情感参数,并提出情感遗传思想,建立基于情感遗传的在线主题情感混合模型OTSCM(On-Line Topic and Sentiment Combining Model)。该模型把t-1时间片内的主题情感分布作为t时间片内主题情感分布的先验,通过构造主题情感演化矩阵,生成t时间片内文档—主题、主题—特征词以及主题—情感词3个分布,最后使用交叉熵方法计算t时间片内主题分布与t-1之前主题分布的相似度,得出t时间片内主题情感演化结果。本文在5个数据集上对OTSCM进行了验证,并与其它流行算法进行了对比,实验表明,文本方法在主题情感在线识别方面达到了良好的效果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号