首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 518 毫秒
1.
[目的/意义]文本智能计算是近年来的新兴交叉学科,揭示其研究动态对情报学研究有重要意义。[方法/过程]从关键词共现网络的视角,以WOS核心合集中的文献为分析样本,借助复杂网络计算、社区划分以及可视化等技术手段,揭示了文本智能计算研究的主题结构和演化脉络,并总结归纳了其发展态势。[结果/结论]当前文本智能计算研究的结构趋于稳定,各子领域关联性较强。研究当前主要分为5个子领域,人工智能、数据挖掘是当前的领域研究热点,文本分析领域将有所突破,并成为新的研究重心。  相似文献   

2.
[研究目的]专利是技术信息的载体,以专利数据为研究对象,在产业链视角下进行技术主题提取及识别,从专利数据中识别新兴技术可以有助于把握新兴技术的发展动态。[研究方法]首先,根据产业链的概念和专利IPC分类号构建出产业链各个层级对应的专利集;然后,结合专利文本的特点提出EW-LDA主题模型,从词汇权重和语境两个角度对LDA主题模型进行改进,使用EW-LDA模型提取出产业链的各个层级中得技术主题;最后,根据专利文本及新兴技术的特点,从新颖度、热点度、关注度和增长率四个方面入手构建新兴技术主题识别指标,将技术主题分为新兴、热点、潜在、衰退和噪音五类。并在人工智能领域的专利数据上进行实验。[研究结论]结果表明,提出的EW-LDA主题模型具有更好的主题建模效果,产业链视角下的新兴技术主题识别方法可以有效的识别出新兴技术。  相似文献   

3.
阿柔娜 《情报科学》2023,(5):153-160
【目的/意义】分析数据隐私风险的时序主题关联,理清热点主题的演化路径,探索有温度的数据隐私风险治理。【方法/过程】基于WOS核心合集和Scopus数据库收录的数据隐私风险领域相关文献,通过LDA主题模型将文本按照时间片切分,并识别各时间片的研究主题;再通过余弦相似度计算分析相邻时间片主题的时序关联,梳理主题演化路径并探索研究前沿。【结果/结论】数据隐私风险研究的关注点逐渐从对识别、评估和缓解数据隐私风险技术本身的关注,转向对平台、算法和场景整体性情境的关注,这需要通过数字伦理、法律和社会等方面共同助力形成负责任的技术,以期构建数字信任环境。【创新/局限】本研究对跨学科和跨领域的数据隐私风险研究的演化路径进行梳理,探索数据隐私风险治理的有效路径。未来可进一步细化不同时期的主题,并深入分析不同时间片的新兴技术对数据隐私风险的影响。  相似文献   

4.
高楠  高嘉骐  陈洪璞 《情报科学》2023,(3):127-135+172
【目的/意义】通过综合使用论文和专利数据源,开展新兴技术的识别与演化路径方法研究,期望以此提高学科领域新兴技术探测研究的准确性和科学性。【方法/过程】首先,针对集成电路这一特定领域使用Word2Vec语义相似度与字符串相似度相结合的方法构建词袋,并利用LDA主题模型发现并识别集成电路领域隐含的技术主题,构建新颖度、强度和热度等多维指标对新兴技术进行对比和甄别。其次,划分时间窗,采用余弦相似度算法计算相邻时间窗内主题间的相似性,以可视化路径的形式将筛选结果进行呈现,以此判断主题演化关系类型。【结果/结论】研究发现,集成电路领域呈现学界与业界研究成果相互促进的良好态势,结合论文与专利数据的新兴技术识别方法,可以有效且清晰的发现集成电路研究领域的热点型、增长型、成熟型和潜在型技术主题,并通过新兴技术演化路径的构建,揭示了领域科学与技术间知识的交互与转移。【创新/局限】本研究创新性采用Word2Vec语义相似度与字符串相似度相结合的方法构建词袋,提高了词袋构建质量,为后续基于LDA主题模型识别隐含的技术主题奠定了基础,但在数据源的多样性、时滞性问题,以及模型阈值设置的客观性上还存在局限性,需要...  相似文献   

5.
朱光  潘高枝  李凤景 《情报科学》2022,40(4):127-137
【目的/意义】识别信息隐私研究领域的热点主题,梳理主题演化路径。【方法/过程】针对主题识别语义杂乱 等问题,提出时序关联与结构表征视角下的主题演化分析方法。首先利用LDA(Latent Dirichlet Allocation)模型识 别多时间窗口下的文献主题,进一步运用共词分析绘制语义更为独立的主题凝聚子群。在此基础上,从时序关联 维度计算相邻窗口下主题间的相似度,梳理演化路径;从结构表征维度,设计主题新颖度、中心性、影响力等计量指 标,探寻信息隐私前沿和热点主题的演化变迁。【结果/结论】实证分析结果表明,本文方法可以深度挖掘信息隐私 领域研究主题,从宏微观两个维度全面梳理主题的演化路径。研究有利于探测信息隐私研究的前沿。【创新/局限】 综合运用LDA主题模型与共词分析方法绘制主题凝聚子群,从时序演化和结构表征两个维度探寻主题演化路径。 未来研究中有待于引入多种数据源以对比主题差异,有待于引入多元组术语改善主题识别效果。  相似文献   

6.
【目的/意义】为揭示中外图书情报领域对大数据研究的现状和发展趋势,挖掘研究热点主题及其演化过 程。【方法/过程】文章统计分析了近十年图情领域大数据研究的论文发文数量、核心机构和核心作者等指标,采用 文本数据挖掘的方法识别出不同领域时期的研究热点主题,并分析了随时间的推移研究主题的演变情况。此外, 论文还对比分析了中外图情领域研究主题的相关性和差异性,展现出中外图情领域对大数据研究的联系和区别。 【结果/结论】随着时间的发展,中外大数据研究主题趋于相似。大数据研究主题的趋势向着研究主题多元化,结构 层次鲜明化的方向发展,在未来几年将会有更多新颖的研究主题产生。  相似文献   

7.
[目的/意义]对比论文数据和专利数据的特征指标,识别热点、新兴、潜在和消亡研究前沿主题。[方法/过程]利用LDA主题模型,对智能汽车领域相关的论文数据和专利数据进行主题提取,计算两个数据源下各主题的强度和主题新颖度并进行对比分析。[结果/结论]本文识别出路径规划技术等热点研究前沿6个、智能计算等新兴研究前沿2个、安全认证技术等潜在研究前沿6个、车载平台等消亡研究前沿6个。本文在前沿识别方法上进行了创新,有效识别出领域内研究前沿并进行分类,为相关机构和研究人员提供借鉴。  相似文献   

8.
[目的/意义]探究在线健康社区的研究热点及主题演化脉络,为在线健康社区领域的探索研究提供借鉴,同时在一定程度上助力健康中国战略的实施。[方法/过程]以2006—2021年Web of Science核心集中有关在线健康社区领域的339篇文献为研究对象,利用SciMAT软件制作关键词重叠图、主题战略坐标图和主题演化路径图,分析在线健康社区领域的研究热点和演化路径。[结果/结论]在线健康社区领域各时期聚类的主题数量先减后增,主题类团的演化能力不断增强,演化路径日渐平稳。三条主要的主题演化路径为:(1)在线健康社区的社会支持研究:社会支持→社会支持→社会支持→社会支持、癌症;(2)在线健康社区的在线社交媒体研究:质量→在线社交媒体→在线社交媒体;(3)在线健康社区的在线评论研究:口碑→在线评论。  相似文献   

9.
[研究目的]改进或丰富现有的颠覆性技术识别方法和相关实证研究,对于区域和企业创新战略规划,以及相关科技政策制定均具有积极的决策参考意义。[研究方法]在已有的颠覆性技术识别量化分析方法基础上,导入专利文本主题强度概念,通过主题强度变化来辅助识别技术演进中的热点主题,然后根据不同年份的时间序列数据,引入在水文和气象监测领域的BUT(Buishand U test)突变检测方法,并结合专利文本主题演进模式区分,提出了一个较新颖的颠覆性技术分析框架。[研究结论]在实证分析部分,将专利文本主题强度突变检测应用到了工业互联网领域,并识别出部分具有颠覆性潜力的技术主题,从而进一步丰富了当前有关颠覆性技术识别的方法体系。  相似文献   

10.
[目的/意义]通过对美国空军公布的专利进行研究,揭示其不同阶段的重点研究方向,更好地把握技术变化,为相关决策提供参考。[方法/过程]引入时间维度将主题模型生成的"文档—主题"分布转换为"年份—主题"分布,结合t-SNE降维并可视化来划分时间段。采用专利分类号与技术领域的映射关系和社会网络分析方法做粗粒度的技术领域演化及可视化分析,并综合运用LDA和JS散度对其中某一技术领域做细粒度的技术主题演化与可视化分析。[结果/结论]将美国空军公布的1958—2019年的专利划分为7个时间段,得到技术领域演化河流图以及"测量"技术领域的技术主题演化桑基图。结果表明该方法可以较好地识别美国空军不同阶段的核心技术演化过程,是从专利的角度研究国防技术发展趋势的一次积极探索。  相似文献   

11.
[目的/意义]预测社科领域在未来有发展潜力的研究主题对于科研工作者寻找新的学科增长点和政府部门优化资源配置至关重要。文章提出一种基于语义表示和动态主题模型的社科领域新兴主题预测框架,以期丰富和完善主题预测研究的方法体系。[方法/过程]首先,使用BERT模型和UMAP算法对文本进行语义表示和向量降维,再通过动态主题模型对嵌入向量进行聚类,从而获得全局主题;其次,构建新兴主题指标计算公式,基于Neural Prophet模型和非参数检验方法预测新兴主题;最后,通过划分时间窗将全局主题细化为多个局部主题,以定位最近时间段的新兴词汇。[结果/结论]选取“人口老龄化”领域的学术论文和报纸进行实证研究,并采用资料验证法进行方法有效性分析,结果表明该方法能够快速准确地预测社科领域中的新兴主题。  相似文献   

12.
[目的/意义]旨在为图书情报学科发展的有效探究提供参考。[方法/过程]结合CSSCI核心期刊论文、国家社会科学基金(NSSFC)和国家自然科学基金(NSFC)多项数据作为数据源,从宏观层面对图书情报领域近十年成果进行统计分析,归纳其研究发展过程和变化趋势,从微观层面对对图书情报领域成果进行文本挖掘,发掘出近十年研究热点。[结果/结论]图书情报领域热点主题以“图书馆”“情报”为侧重点,呈交叠式融合、各热点之间互相交错关联的社交网络图。这从侧面也证明了图书情报是一门交叉学科,其主题具有多学科、综合性强的特点。  相似文献   

13.
李静  徐路路 《现代情报》2019,39(4):23-33
[目的/意义]细粒度分析学科领域热点主题发展脉络并对利用机器学习算法对未来发展趋势进行准确预测研究。[方法/过程]提出一种基于机器学习算法的研究热点趋势预测方法与分析框架,以基因工程领域为例利用主题概率模型识别WOS核心集中论文摘要数据研究热点主题并进行主题演化关联构建,然后选取BP神经网络、支持向量机及LSTM模型等3种典型机器学习算法进行预测分析,最后利用RE指标和精准度指标评价机器学习算法预测效果并对基因工程领域在医药卫生、农业食品等方面研究趋势进行分析。[结果/结论]实验表明基于LSTM模型对热点主题未来发展趋势预测准确度最高,支持向量机预测效果次之,BP神经网络预测效果较差且预测稳定性不足,同时结合专家咨询和文献调研表明本文方法可快速识别基因领域研究主题及发展趋势,可为我国学科领域大势研判和架构调整提供决策支持和参考。  相似文献   

14.
[目的/意义] 运用概率主题模型全面研究专利文献主题演化,分析专利技术发展过程及趋势。[方法/过程] LDA模型按时间窗口对专利文本建模,困惑度确定最优主题数,按专利文本结构特性提取主题向量,采用JS散度度量主题之间的关联,引入IPC分类号度量技术主题强度,最后实现主题强度、主题内容和技术主题强度3方面的演化研究。[结果/结论] 实验结果表明:该方法能够深入挖掘专利文献的主题,可以较好地分析专利技术随时间的演化规律,帮助相关从业人员了解专利技术的演化过程及趋势。  相似文献   

15.
[目的/意义]旨在发现国内用户画像研究领域的研究主题以及这些主题的发展脉络,为图书馆用户画像的构建提供参考。[方法/过程]运用LDA主题模型对国内用户画像研究论文的题目、摘要和关键词等内容进行文本挖掘,按年度对热点主题进行分析并发现各主题的演化趋势。[结果/结论]国内用户画像研究领域大体可划分为8个研究主题:新媒体营销、电商系统与精准营销、推荐算法与推荐系统、健康信息服务、教育教学、金融服务、社交网络与内容分析、高校图书馆与信息服务。研究主题按年度演化趋势可分为上升主题、平稳主题和衰减主题3类。高校图书馆与信息服务是上升幅度最大的主题,这表明研究人员越来越关注用户画像在图书馆及相关领域的应用研究。  相似文献   

16.
王婧  武帅 《情报探索》2024,(2):1-11
[目的/意义]现有学科研究主题的梳理多为领域专家的定性分析和学科学者的文献梳理,一定程度会由于研究思维的局限性和获取知识的片面性造成学科研究主题误判,为有效避免漏判误判现象的发生,提出识别模型。[方法/过程]首先,运用传统LDA模型分析主题特征词;其次,结合上下文语义信息进行中文分词,形成学科主题词库;最后,结合隐含位置聚类算法发现潜在社区,提高主题识别效果。[结果/结论]提出的方法一定程度上优化了主题挖掘算法在识别短文本主题的效果,消除主观意愿。由计算机自行分类并实现科学研究前沿主题的预测,揭示前沿领域的研究热点,为致力于研究前沿学科的新兴学者提供参考价值。  相似文献   

17.
[目的/意义]为提高新兴技术主题识别的全面性、准确性,在专利、论文信息的基础上,融入舆情信息,提出一种复合型的新兴技术主题识别方法,以期能为微观层面新兴技术主题识别方法的研究提供参考。[方法/过程]面向专利、期刊论文、学位论文、会议论文、舆情共5种不同的科技文献类型,运用LDA模型从多源异构文本中获取主题词,并进行融合分析,提取候选新兴技术主题;设计识别指标体系,弥补现有指标体系缺乏未来前景相应指标的不足;运用CRITIC法进行综合评价,确定最终的新兴技术主题。[结果/结论]以智能网联汽车为实验对象,成功识别出多传感器融合信息技术这项新兴技术,实验结果与业界分析保持一致,说明多源信息视角下的多指标新兴技术主题识别方法能有效地对多源异构文本开展新兴技术的主题识别。  相似文献   

18.
黄晓斌  罗海 《现代情报》2019,39(1):126-136
[目的/意义]分析2007-2016年中国竞争情报年会会议论文的基本情况,揭示竞争情报研究热点主题及其演化规律,探索竞争情报的未来发展趋势。[方法/过程]选取2007-2016年中国竞争情报年会会议论文,对高频关键词综合运用共词分析、聚类分析和战略坐标图方法进行分析。[结果/结论]展示我国竞争情报研究的主题演化特征,表明竞争情报系统是领域研究的基础主题和活跃主题,大数据和智库研究将会是我国竞争情报发展新的挑战,以情报池为基础的综合情报分析将会是未来竞争情报研究的趋势。  相似文献   

19.
[目的/意义]分析国内外话语权研究现状,掌握其热点主题及演化趋势,对于破解中国话语困境,推动国内话语权研究的创新发展具有重要参考意义。[方法/过程]选取1990—2022年间国内外话语权相关研究文献,采用DTM动态主题模型对其进行主题挖掘,并从热点主题识别与分析、主题强度演化趋势及主题关键词演化路径三方面对比分析国内外话语权研究的现状及差异。[结果/结论]国内外话语权研究在热点主题、研究方法、主题强度及主题演化趋势等方面均存在较大差异:(1)在热点主题的研究方法上,国内研究更注重开展思辨研究,而国外研究更倾向于采用定量研究方法开展实证研究;(2)在主题强度演化趋势上,国内研究的主题强度变化波动较大,而国外研究的研究主题则具有较强的传承性和递进性;(3)在热点主题的识别和主题关键词演化路径上,国内研究的热点主题多于国外,且国内外同一研究主题处于不同发展阶段时的研究重心存在显著差异,与时代背景密切相关。  相似文献   

20.
[研究目的]跨领域关键共性技术强调技术的跨领域关联与主导作用,对其识别将为政府推动跨产业跨领域创新、提前布局相关技术领域提供决策支持。[研究方法]首先,运用GloVe模型向量化专利文本,按照专利与技术领域的语义接近程度划分专利所属领域;其次,基于GMM算法提取各领域技术主题,依据技术主题之间的语义距离,构建技术主题关联网络;最后,利用漏斗模型,依据技术主题的共性指标、跨领域指标、关键性指标筛选出跨领域关键共性技术。[研究结论]运用养老科技领域专利数据进行实证研究,结果显示“智能控制辅助技术”“无接触式躯体感知技术”“沟通与信息辅助技术”“适用性技术”为跨领域关键共性技术,通过比对国家相关政策内容,验证了方法的有效性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号