排序方式: 共有58条查询结果,搜索用时 140 毫秒
1.
[目的/意义]分析科技创新路径识别研究中用到的主要研究方法与开源工具,提出利用引文内容挖掘实现科技创新路径识别方法及开源工具。[方法/过程]首先,基于引文分析、结构洞分析、凝聚子群分析、文本内容挖掘、引文内容挖掘等不同角度分析了科技创新路径识别的主要方法;其次,从数据源、文本格式、挖掘内容、处理能力等方面阐述了用于实现引文内容挖掘的科技创新路径识别的3个开源工具:Mallet、Knime、NLTK;最后,分析了实现科技创新路径可视化的5个开源工具:Pajek、Ucinet、Gephi、D3.js、VOSViewer。[结果/结论]通过研究发现,利用开源工具深入挖掘引文内容中蕴含的丰富语义信息,识别不同引用动机,进而进行可视化展示可以有效的实现科技创新路径表达。 相似文献
2.
[目的/意义] 针对SAO结构短文本分类时面临的语义特征短缺和领域知识不足问题,提出一种融合语义联想和BERT的SAO分类方法,以期提高短文本分类效果。[方法/过程] 以图情领域SAO短文本为数据源,首先设计了一种包含"扩展-重构-降噪"三环节的语义联想方案,即通过语义扩展和SAO重构延展SAO语义信息,通过语义降噪解决扩展后的噪声干扰问题;然后利用BERT模型对语义联想后的SAO短文本进行训练;最后在分类部分实现自动分类。[结果/结论] 在分别对比了不同联想值、学习率和分类器后,实验结果表明当联想值为10、学习率为4e-5时SAO短文本分类效果达到最优,平均F1值为0.852 2,与SVM、LSTM和单纯的BERT相比,F1值分别提高了0.103 1、0.153 8和0.140 5。 相似文献
3.
[目的/意义] 学科主题演化研究有助于掌握学科发展现状、研究热点、研究前沿和发展趋势等情况,是进行科技创新的基础,是面向科技创新的重要研究方向。[方法/过程] 提出一种语义分类的学科主题演化分析方法:将关键词分为研究问题、研究方法和研究技术3类,构建不同语义分类的共词网络;然后基于Fast Unfolding社区发现算法识别具有语义特征的社区(主题);利用相似度算法计算相邻子时期主题间的相似度,构建学科主题演化图谱,以分析某学科领域研究问题、研究方法和研究技术的变化,实现深度、细致的学科主题演化分析。[结果/结论] 通过对2012-2015年CNKI数据库收录的我国大数据研究领域相关论文数据的处理分析,证明该方法的准确性和有效性。 相似文献
4.
k-clique社区知识创新演化方法研究 总被引:3,自引:0,他引:3
提出一种基于k-clique社区的知识创新演化揭示方法。首先,构建科技文献时序关键词共词网络。然后,将共词网络划分为n个最大完整子网络Gs,在Gs中寻找k-clique(2 < k < s)。最后,在给定阈值k的情况下,计算k-clique社区的演化情况,从而揭示知识创新情况。该方法不仅能够有效揭示知识创新演化过程,而且能够通过k-clique社区的关键节点,揭示知识创新过程中的共性知识以及不同知识创新领域的互相影响情况。通过对碳纳米管研究领域2008-2012年SCI数据库论文数据的实验证明,该方法能准确识别出该领域知识创新主要方向,并能准确反映其演化情况。 相似文献
5.
本文利用大规模搜索日志对用户中文长句查询的情况进行了统计研究.通过分析搜索日志中的中文长句查询确定了经常发生的查询类型特点,并对用户搜索行为与查询长度、查询类型和查询频率的关系进行了研究.进一步了解了session中用户查询词修改情况,总结了用户查询修改方法和长度修改方面的特征和规律.最后,将不同长度的查询放到了三个商业搜索引擎中分别进行检索,计算其重叠率.通过以上的分析研究发现虽然目前大部分查询都是短查询,但短查询并不能满足用户所有的检索需求,特别是在搜索引擎向语义检索不断发展的今天,长句检索的分析和利用能够从更深层次上了解用户的查询用语特点和搜索点击行为,这对于查询技术的改进和语义空间的构建都具有积极的作用. 相似文献
6.
7.
【目的/意义】为揭示中外图书情报领域对大数据研究的现状和发展趋势,挖掘研究热点主题及其演化过
程。【方法/过程】文章统计分析了近十年图情领域大数据研究的论文发文数量、核心机构和核心作者等指标,采用
文本数据挖掘的方法识别出不同领域时期的研究热点主题,并分析了随时间的推移研究主题的演变情况。此外,
论文还对比分析了中外图情领域研究主题的相关性和差异性,展现出中外图情领域对大数据研究的联系和区别。
【结果/结论】随着时间的发展,中外大数据研究主题趋于相似。大数据研究主题的趋势向着研究主题多元化,结构
层次鲜明化的方向发展,在未来几年将会有更多新颖的研究主题产生。 相似文献
8.
国外主要可视化数据挖掘开源软件的比较分析研究 总被引:1,自引:0,他引:1
选取了WEKA、RapidMiner、KNIME和Orange四种国外主要的可视化数据挖掘开源软件,对它们在数据挖掘方法、可视化功能、使用容易程度等方面进行了比较.通过比较发现RapidMiner具有丰富的算法和优秀的可视化效果,而WEKA和KNIME在算法上较Orange要多,但Orange 在可视化功能上要比两者强.所以四种软件都有各自的适用范围,可以适用不同操作用户的需求. 相似文献
9.
10.
[目的/意义] 提出利用数字技术来追溯现代精神文明的古典参照,试图探寻我国精神文化建设的可靠历史依据,树立坚定的文化自信。[方法/过程] 以稷下学派为例,收集现代期刊论文和古代史书典籍,利用机器学习和自然语言处理技术构建古今思想文化的对比映射框架。分别通过古今文本的特征表示、主题聚类和思想聚合,实现现代文明对于古典思想的参照,并从治国理政、经济建设、法治思想、教育思想、生态环境等5个方面进行深入分析。[结果/结论] 分析表明,现代精神文明与古典文化意识既相通又存在差异。现代的孝道、德治思想在稷下思想中都有所体现。现代教育体系中的素质教育、思想教育能够追溯到古典精神中品德教化踪迹。古今的法制建设在观念上趋同,但在形式上存在差异。经济建设体系的不同也影响了生态建设观念的差异。本研究的设计与实现初步展示现代数字技术对于映射古今思想对照的可行性,为数字人文中的精神思想挖掘提供新思路,尤其对于追寻我国现代文明建设的历史依据具有重要的现实意义。 相似文献