首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
【目的】基于当前大数据技术支撑的主流传播数据挖掘逻辑机制,即作者关联度机制及文献碎片化自然语言处理机制,围绕传播对象的相关性、时效性等维度进行实验设计和数据统计。【方法】在CNKI数据库中按照学科分类随机选取100篇文献作为传播样本,在各机制应用平台挖掘共计10000个传播对象进行德尔菲式的判定及数据统计分析。分析维度涉及时效相关性、匹配相关性、发文频率等一系列图情指标。【结果】分析显示,作者关联度机制存在内生性问题,难以继续优化;文献碎片化自然语言处理机制虽存在学科分类表象与匹配聚类实质不易弥合的客观问题,但可以通过优化数据挖掘逻辑提升数据挖掘效果。【结论】基于分析结果,通过改进算法映射及摒弃“超龄”数据来提出优化路径,并通过实验验证其有效性。  相似文献   

2.
易明  秦涵  蒋武轩 《情报科学》2020,38(2):29-38
【目的/意义】基于标签系统所蕴含的语义信息与隐性社会网络,构建融合标签概念空间及用户网络的语义社 团发现模型,提高社团发现的质量。【方法/过程】通过构建标签的概念空间挖掘标签间的语义关系,并根据标签包 含的隐性社会网络发现用户网络,进而将两者结合融入到社团发现算法中,并以豆瓣网数据对模型进行实证。【结 果/结论】标签概念空间及用户网络能够提升语义社团发现算法效果。  相似文献   

3.
[目的/意义]中医医案作为重要的医疗资源含有大量的数据与信息,深度挖掘中医医案,围绕医案内容进行知识发现,有利于隐性知识的发掘,提高中医临床诊疗的效率与医疗服务的精准性。[方法/过程]以实地肺病医案为数据源,基于统计分析与关联规则的方法对中医医案内容进行挖掘,以咳嗽为主证为出发点,挖掘相关中医用药规律与临床症状以及症—药规律,探究关联规则分析在中医药知识发现方面的创新应用。[结果/结论]本地治疗咳嗽的高频药物包括炙甘草、杏仁、半夏、川贝母、茯苓、陈皮等,舌诊症状以苔薄白、苔薄黄、舌红、舌暗红、有齿印等为常见。基于Apriori算法的关联规则分析显示常见的药物配伍为丹参,桔梗—炙甘草、柴胡,桔梗—炙甘草、前胡,枳壳—桔梗等;舌诊症状以薄淡黄—舌暗红、有齿印—舌暗红、苔薄腻淡黄—有齿印等组合为强关联组合,苔薄淡黄—舌暗红症状组合的强关联药物有桔梗、炙甘草、丹参、白前等。咳嗽患者的类型有外感咳嗽与内伤咳嗽,涉及风热证、痰湿证、阴虚证、肺气虚证、痰热壅肺证等证型。  相似文献   

4.
郭勇  罗敏  幸芮 《情报科学》2023,41(2):95-100
【目的/意义】挖掘药物筛选工作中的隐性知识,借助机器学习的预测能力替代生物实验方法,减少制药流程的研发时间和经济成本。【方法/过程】提出一种面向知识发现的ADMET情报预测理论框架,以4种传统机器学习方法和2种集成学习方法,分别构建6种分类预测模型,提取药物的隐性知识,比较不同模型的优越性,评估最优模型的经济价值。【结果/结论】以药物分子描述符信息预测ADMET具有可行性,6种模型性能表现综合排序结果为随机森林、梯度提升决策树、Logistic回归、支持向量机、K近邻、高斯朴素贝叶斯。前沿信息技术能够有效应用于药物知识发现,信息经济学分析可预见创造可观收益,是未来制药工艺降本增效的重要手段。【创新/局限】未来应融合专家知识、追加试验验证、丰富参考指标。  相似文献   

5.
谭学清  罗琳  周洞汝 《情报科学》2007,25(1):129-133,160
数据挖掘作为一项从海量数据中提取知识的信息技术引起了国内外学术界和产业界的广泛关注,基于数据仓库的联机分析挖掘系统的应用已成为数据挖掘技术的发展趋势,本文结合联机分析挖掘的思想和基于目标属性关联规则挖掘算法,提出并构建了数据立方体上的基于约束的关联规则挖掘算法。最后的算例证明了该算法的有效性。  相似文献   

6.
韩丽华  魏明珠 《情报科学》2019,37(8):158-162
【目的/意义】根据大数据环境下信息资源管理的特征,对信息资源管理模式进行创新探索,进一步挖掘信 息资源深层次价值,实现更健康有效的信息资源载体的支持。【方法/过程】以大数据背景的信息资源特征为基本研 究出发点,挖掘数据科学与信息资源管理的关联,利用数据挖掘和数据分析以及新兴的智慧服务,构建较为系统的 信息资源管理模式。【结果/结论】通过本文的研究,构建了大数据背景下信息资源管理三种创新模式:①“物联网+ 大数据”创新模式;②“数据挖掘技术+信息资源”融合模式;③“技术框架+用户核心”的信息服务模式,为大数据 时代信息资源管理的可持续发展及研究提供知识参考依据。  相似文献   

7.
【目的/意义】从开放政府数据主题的多个政策文本的语义挖掘出发,发现多个政策文本内容间的语义关 系,探索能降低人工干预,实现多政策文本协同性自动化分析的方法。【方法/过程】利用数据挖掘的关联规则算法 对经过预处理的开放政府数据政策文本进行语义挖掘,按照得到的有效强关联分析多政策文本间的协同性。【结 果/结论】以开放政府数据主题的多个政策文本为研究对象,确定置信度为 0.7,提升度大于 3时得到的有效强关联 规则数量较稳定;经过不同层次的政策文本关联规则分析,可以得到与人工分析基本吻合的结论,验证了该方法可 以应用于多政策文本语义协同性的定量研究。【创新/局限】采用数据挖掘中的关联规则算法完成数据政策多文本 的协同性知识推理研究,有效的实现了语义自动化计算的问题。实验中政策词表的完整性、数据预处理过程、参数 设定等环节都会对实验结果准确性有影响,需进一步降低人工干预影响。  相似文献   

8.
韩娜  马海群  刘兴丽 《情报科学》2021,39(11):180-186
【目的/意义】从大数据驱动角度出发,探索采用人工智能方法实现对政策文本协同性定量分析的可能性。 【方法/过程】以政策全文本数据为研究对象,使用知识图谱技术实现不同主题的本体构建,并应用数据挖掘中关联 规则构建推理模型,对图谱表示的政策文本进行协同性语义挖掘和推理。【结果/结论】围绕“开放数据”和“数据安 全”主题构建知识图谱,实现对政策文本的本体表示,在此基础上使用关联规则完成单文本和多文本在两个主题间 的协同性分析。【创新/局限】本文将知识图谱应用于政策文本分析领域,并完成协同性分析,为政策的全样本分析 提供可能性,后续需扩大样本规模,提升推理效率。  相似文献   

9.
李勇男 《情报科学》2018,36(4):80-84
【目的/意义】利用数据挖掘技术分析涉恐人员的物流、资金流、信息流等数据进行反恐预警可以有效提高 反恐工作效率和优化资源配置。【方法/过程】本文将研究如何利用信息增益决策树对涉恐情报信息进行快速分 类。分类过程为从根节点的涉恐人员属性开始不断产生新的分支。产生每个分支都需要计算不同属性的信息增 益并选择分裂属性。【结果/结论】文中的方法可以对大量涉恐情报基础数据进行快速分类,在实际工作中可以与关 联分析、聚类分析、异常检测等其他数据挖掘方法组合使用。该方法既可以应用于公安情报学专业本科生的课堂 教学,也可以应用于情报分析人员的培训。  相似文献   

10.
王思丽  祝忠明 《情报科学》2020,38(2):94-101
【目的/意义】相关性检索机制作为知识搜索引擎最核心的部分之一,对提升机构知识库精准知识服务能力 和用户满意度具有重要意义。本研究旨在为机构知识库优化相关性检索机制提供技术路线支撑。【方法/过程】首 先,系统化梳理相关性检索研究的背景及进展,对关键的相关性计算模型及工具进行对比分析与述评。其次,以中 国科学院机构知识库CSpace 为试验环境,以开源引擎Apache Solr 为辅助工具及TF/IDF、BM25 算法等为模型基础, 对机构知识库相关性检索机制进行了研究设计与试验。【结果/结论】Solr 可以与BM25 等多种相似度计算模型有效 结合,为用户提供多维度的可配置化的相关性计算服务。文章未能对基于机器学习排序算法的相关性检索机制进 行深入研究。  相似文献   

11.
通过FP算法,从企业内部的海量信息中找出事物之间的联系,得到有用的信息类隐性知识.以FP算法为工具,建立了企业信息类隐性知识挖掘的FP-tree模型,并给出了挖掘的具体步骤,通过算例演示了企业信息类隐性知识挖掘的具体实施,并与经典的Apriori算法进行了比较,表明FP算法对企业信息类隐性知识挖掘具有一定优越性.  相似文献   

12.
王正成  袁竹星 《情报科学》2018,36(3):112-116
【目的/意义】在微博中,意见领袖对于消息的传播以及舆情走向起着关键的作用。然而,现有的意见领袖 研究大多忽略了意见领袖在特定话题下的意见代表性。【方法/过程】提出了面向主题的微博意见领袖研究的方法, 该方法旨在利用LDA主题模型挖掘出特定话题中的各个主题,根据主题划分结果对参与话题讨论的用户进行分 类,并结合用户自身属性,借鉴PageRank算法思想挖掘出该主题演化中的意见领袖。【结果/结论】实验证明,本文方 法更能体现特定话题的舆情走向,其针对主题挖掘的意见领袖也更具代表性。  相似文献   

13.
【目的/意义】旨在将社会化问答社区中碎片化的答案关联起来,并为用户提供不同主题的高质量答案和更 好的知识服务。【方法/过程】首先,本研究利用Doc2vec算法计算答案之间的语义相似度,并构建答案语义网络。其 次,利用Louvain算法对答案语义网络进行社区划分,并用TextRank算法抽取各个主题下文档的关键词,使用词云 对每个主题进行可视化展示。最后,利用PageRank算法对聚类后的答案语义网络进行排序,从而实现答案文档的 主题聚合和排序。【结果/结论】本研究使用“知乎”上的问答数据进行了实证研究。结果表明,所提出的答案聚合和 排序方法不仅能够向用户直观地展示答案之间的关联强度和各个主题答案的主要内容,还能够为用户提供分主题 的答案排序结果,自动为用户筛选高质量的答案。【创新/局限】创新性地提出了答案语义网络,并基于答案语义网 络,提出了一种集聚合、主题可视化和排序于一体的答案知识组织方法。  相似文献   

14.
李勇男  梅建明 《情报科学》2017,35(9):141-145
【目的/意义】利用数据挖掘技术在海量数据中快速、准确、有效的发现涉恐线索并及时处置是反恐工作的 重要手段之一。【方法/过程】本文研究如何利用频繁模式树对涉恐基础数据进行挖掘,提取涉恐特征的频繁项集。 首先通过对数据库中的涉恐人员信息进行涉恐特征计数排序并建立频繁模式树,然后在树结构中递归遍历发现满 足最小支持度阈值的频繁项集。【结果/结论】文中的方法可以快速发现大量基础数据中的涉恐关联属性,有利于在 系统中自动搜索重点涉恐人员,为反恐预警系统提供决策参考。通过与其他产生关联规则的方法结合使用,还可 以发现暴恐活动中不同因素的因果关系。  相似文献   

15.
【目的/意义】属性在RDF表示及其数据连接实现中发挥了重要作用。对Wikidata属性的特点、内容进行 全方位的研究,旨在揭示属性的使用特征,对于RDF描述中属性的定义、描述、应用具有重要参考价值。【方法/过 程】采用归纳总结及比较研究的方法,从术语、约束、声明等方面详细介绍了Wikidata的属性。此外,针对属性间关 系各自的特点采用Gephi网状分析工具对其进行深度挖掘。【结果/结论】Wikidata属性具有数据来源多样、协作编 辑、逻辑推理的特点,其利用率呈现持续增长的趋势,且各属性之间可以通过一些关系彼此联系,为数据共享和连 接实现及其未来数据应用提供了丰富而充分的依据。  相似文献   

16.
【目的/意义】针对多组时间序列的海量数据集和以预测为目标的信息分析方法,提出了基于数据挖掘技术 的预测模型,在大数据环境下,提高了预测精度,以期在其他领域的信息分析和情报预测能有所借鉴。【方法/过程】 以集装箱海运价格预测为例,提出集装箱海运价格预测模型,设计自适应的网格搜索策略,高效准确地确定数据挖 掘算法中的超参数组合,提出基于时间序列留出法的评估方法,降低了集装箱运价这种多组时间序列数据集在数 据挖掘结果上的泛化误差,针对海量运价信息,对GBDT算法进行并行计算设计和预排序后的损失函数迭代计算 优化策略,提高了算法在大数据环境下的计算效率。【结果/结论】模型和算法运行结果仿真显示:对于传统的时间 序列问题,基于数据挖掘方法的预测模型取得了比传统时间序列方法更优的结果。  相似文献   

17.
传统的关联规则挖掘技术过于依赖数据之间的关联属性,造成挖掘算法在高冗余知识空间关联规则不明显或者较弱的情况下挖掘耗时。本文提出一种应用与高冗余知识空间的优化数据挖掘算法。该算法首先找出最大频繁项集和频繁1-项集进行区域分类,然后利用已有频繁项集找出所有的其它频繁项集,去除冗余关联环境,节省了计算频繁项集的时间,节约了存储空间,使算法的效率得到提高。仿真实验结果证明了改进算法的可行性和有效性。  相似文献   

18.
王颖  于改红  谢靖 《情报科学》2021,39(8):67-77
【目的/意义】通过对学术资源进行深度挖掘与语义化组织,实现学术资源及其内部知识之间的关联发现。 【方法/过程】本文提出基于全文知识网络的学术资源关联发现方法,设计了全文知识网络的模型和构建流程,以 Pubmed Central数据库中拟南芥(Arabidopsis)相关的520篇期刊论文全文数据为实验对象,通过全文解析和挖掘将 其分解为细粒度的知识,形成全文知识网络。然后利用SPARQL查询和RelFinder可视化工具从数字资源层、知识 单元层和知识对象层三个层次开展关联发现实验。【结果/结论】本文构建全文知识网络对学术资源进行细粒度组 织和挖掘,有助于发现不同学术资源及其内部知识之间的潜在关联,对学术资源的深度利用具有重要的意义。【创 新/局限】本文创新之处在于通过构建全文知识网络对学术资源进行细粒度揭示和组织并进一步发现潜在关联,局 限在于尚未开展大规模应用实践。  相似文献   

19.
魏伟  郭崇慧  唐琳  陈静锋 《情报科学》2017,35(6):138-144
【目的/意义】文献挖掘是文本挖掘领域中的重要研究方向,文献挖掘技术在信息化时代发挥着越来越重要 的作用。【方法/过程】首先在文献挖掘过程中引入知识元概念,提出了一套基于知识元的文献挖掘处理模式。其次 针对海关贸易档案文献资料,提出了一种五元组结构的知识元表示方法,并用领域知识元本体进行领域知识元间 的组合链接。同时针对期刊文献资料,提出了五类知识元共同表示一篇期刊文献的知识元表示方法。最后以“粤 海关”相关贸易档案文献资料和中文期刊文献资料为例,运用所提方法进行知识元的抽取和表示,在知识元的基础 上进行知识元间的组合链接进而实现快速精确的领域知识挖掘。【结果/结论】基于知识元的文献挖掘模型,能够增 强文献挖掘过程的可重复操作性并提高挖掘成果的可重复利用性。  相似文献   

20.
邓淑卿  徐健 《情报科学》2017,35(11):83-88
【目的/意义】梳理情报学的研究内容分布以及研究主题发展情况。【方法/过程】选取2006年到2015年十年 内发表于九种情报学核心刊物的论文作为研究数据源,采用构建基于LDA算法的主题模型的方法挖掘情报学的研 究主题。【结果/结论】2006年到2015年情报学的研究主题有13个,其中在内容分布上,总体研究热度较高的是图书 馆管理、文献计量、知识管理与服务、信息素养和情报学基础理论。在主题变化上,研究热度上升的主题有文献计 量、社会网络分析、信息行为研究和数据挖掘;研究热度下降的主题有信息素养、情报学基础理论、信息检索和企业 竞争情报。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号