共查询到19条相似文献,搜索用时 78 毫秒
1.
信息网络文献数据库设计的思考 总被引:2,自引:0,他引:2
信息网络将是信息化社会发展的必然趋势,分布式数据库管理系统是未来网络文献数据库发展的潮流。分布式数据库不同于集中式数据库管理系统,也不是简单的数据的分散管理,而是分布式数据库管理系统机制通过系统目录实现的;对分布式数据库管理系统环境与工具的选择应遵循信息系统的要求与产品所具有的特性为原则;汉字分布式数据库管理系统在网络上传递信息,汉字将会成为通信上的“瓶颈”,解决这个“瓶颈”问题传统的词切分模式与单汉字模式都会无能为力,应该根据汉字本身固有的特性,即汉字属性,构造一种新的模式;汉字定位码值等值算法,是作者利用汉字属性进行查重的一种尝试,具有可操作性和新颖性。 相似文献
2.
著者试图通过对MIS中分布式数据库的设计,引出在MIS中对分布式数据库应采取的存储、访问、备份等技术,并加以剖析,以期对MIS的发展和分布式数据库技术在MIS中的应用有所贡献。 相似文献
3.
分布式数据库系统及其应用前景 总被引:3,自引:0,他引:3
陈江萍 《现代图书情报技术》1996,12(3):29-31
本文分析了分布式数据库系统的组成、结构、特点和数据分布的方法和类型, 介绍了分布式数据库系统技术及产品的应用现状, 认为随着社会的发展和网络通信技术的进步, 分布式数据库系统将会有越来越广泛的应用前景。 相似文献
4.
5.
郑冠德 《福建广播电视大学学报》2002,(2)
本文主要介绍用记录型信息量及 P、V 原语对进程同步问题进行算法设计时,在避免死锁的前提下,提高资源利用率的一般思路。并以一典型题目为例,介绍了具体的解法。 相似文献
6.
通过对移动Agent和民文文献分布式数据库相关理论的简单介绍,给出了基于移动Agent的民文文献分布式数据库访问模型,并指出了这一模型的功能和特点。 相似文献
7.
提出了一种利用深度学习算法结合工业相机的烟支激光打孔异常检测方法。针对该检测过程中的难点,包括图像采集困难、检测响应时间要求和抗干扰性等问题,作者选择了彩色工业相机进行图像采集,并采用YOLOv3目标检测算法进行烟支打孔点位的定位和分类。详细介绍了YOLOv3检测算法的实现流程,包括数据标记、模型训练、调整置信度和非极大抑制等步骤。此外,为了提高图像清晰度和检测速度,提出了图像增强和使用图像金字塔变换的方法。经过实际测试,该方法在烟支激光打孔异常检测中取得了很好的效果,具有高准确率、强抗干扰性和实时性等优点。 相似文献
8.
目前分布式数据库发展迅速值得关注,本文就分布式图书馆建设将会涉及到一些关键技术,如CORBA、Java、XML等分别进行讨论,说明了分布式数据库应用的可行性,对于下一步设计工作起到基础工作作用。 相似文献
9.
基于句子相似度的文档复制检测算法研究 总被引:3,自引:0,他引:3
秦新国 《现代图书情报技术》2007,2(11):63-66
提出一种基于句子相似度的文档复制检测技术,在抓住文档的全局特征的同时又兼顾文档的结构信息,克服以往检测算法两者不可兼顾的缺陷,提高检测精度。最后,给出该算法与其他算法检测结果的比较情况。实验证明,该算法是可行的。 相似文献
10.
方正 《现代图书情报技术》1988,4(3):2-5
本文叙述了科技情报检索系统中分布式数据库的主要技术问题,如分布式数据库结构,查询,事务并发控制,目录管理等,还叙述了上海地区科技情报检索网络在实现分式布数据库中的一些设想,为研制工作提供一些经验。 相似文献
11.
陶剑文 《现代图书情报技术》2006,1(12):49-53
引入移动Agent技术,提出一种面向E-Learning的集成群Agent与Web服务的分布式智能推荐系统模型,其能有效地帮助学员找到所需的信息。构造MASWSIRS的体系结构,说明系统的工作流程;详细阐述了MASWSIRS的各主要功能模块的实现算法,包括系统整体实现算法、系统聚簇算法及推荐算法。 相似文献
12.
分布式检索中查询结果合并方法研究 总被引:2,自引:0,他引:2
查询结果合并是分布式信息检索中的一个重要步骤,其合并方法的选择直接影响检索结果的质量.本文首先对两种查询结果合并算法,即经典的CORI算法与新近提出的回归分析与选择下载相结合的Hybrid算法的基本原理进行了讨论研究,然后通过实验对这两种算法的性能进行了深入的比较分析.在实验过程中,采用平均准确率指标对检索结果进行评价.通过比较两种合并算法产生的平均准确率来评价二者的性能.结果表明,在不同的实验环境下,新的Hybrid算法的性能都要优于CORI算法.选择Hybrid算法进行查询结果合并能够取得令人满意的结果,比较适合作为分布式检索的查询结果合并算法. 相似文献
13.
[目的/意义] , 从大规模已知文本集中检测出与待检测论文的相似文本并计算相似度大小, 用于满足在线论文相似性检测秒级响应需求。[方法/过程] 采用分治法策略, 对已知文本句集进行基于正交基的软聚类预处理, 并对软聚类后的每个簇建立倒排索引。接着在快数据处理平台Spark上执行相似性检测, 采用字符结合词组形式计算出待检测论文与已知文本的相似度大小。[结果/结论] 通过200万规模的已知文本集实验结果显示, 综合4种类型的待检测论文, 所提出的倒排索引结合软聚类算法准确率P为100.0%, 召回率R为93.6%, 调和平均值F为96.7%。调和平均值F比相似性检测算法LCS高10%左右, 比Simhash算法高约23%。在检测速度上, 对于一篇字数为5 000左右的待检测论文, 检测时间约为6.5秒, 比Simhash算法快近300倍, 比LCS算法快约4 000倍。此外, 实验结果还表明基于Spark的分布式并行相似性检测算法具有较好的可扩展性。 相似文献
14.
[目的/意义]基于科技论文多特征项共现突发强度的分析方法研究是将各学科领域科技论文文献载体中的多特征项共现信息定量化、重点热点突发的信息内容可视化的知识图谱分析方法。从动态论文等文献的文档流中探测出突发的特征项对识别密集的内容、活跃的特征项以及预测文本内容的发展走势具有重要的意义。[方法/过程]本研究针对科技论文多特征项共现的突发监测问题,对比目前已有的突发监测分析算法,将改进后的基于卡方统计的热点词计算方法进一步应用于本研究所设计的多特征项突发共现分析方法,并自主开发多特征项突发共现可视化分析工具,用于科技论文多特征项突发共现的图谱可视化,以期通过该研究来揭示相关科技文献的变化状况及突发的热点内容。[结果/结论]通过将本方法应用到科研机构年度发表论文的监测当中,可以监测分析科研机构发文作者、关键词、发表期刊及其相互间关系(如作者-关键词等)在各年的突发情况,并能通过该分析方法以及交叉图谱进一步解读突发特征项的含义,并能揭示出比分析单一特征项突发情况更为广泛和深入的知识内容。 相似文献
15.
综述国内外学术论文复制检测的研究现状,针对存在的问题提出以后研究的新思路: 构建某一学科领域学术论文语料库;以信息论为工具,针对某学科领域建立基于学术论文语料库的统计语言模型;结合学术论文抄袭剽窃的特点,通过赋予描述资源对象语义信息的不同元数据项以不同的权函数,设计相似度算法;使用Lemur工具箱,在标准的TREC文档集上对模型和算法进行检验;与Turnitin侦探剽窃系统进行实验对比,评价该模型和算法的有效率和效果。 相似文献
16.
[目的/意义]从全文本内容分析的角度对算法的学术影响力进行分析。[方法/过程]以自然语言处理领域十大数据挖掘算法使用为例,分析不同算法在特定领域的影响力。通过对1965年-2006年间发表的自然语言处理领域10 922篇学术论文的调研,从其全文内容中抽取6 001条包含十大数据挖掘算法的句子(简称算法句);针对算法句从提及论文数、总提及次数、提及位置等3个方面,对不同算法的影响力进行比较分析。[结果/结论]以不同特征作为影响力衡量标准,十大数据挖掘算法在自然语言处理领域学术论文中的影响力有明显区别,在基于论文数、提及数和提及位置的评估标准中,SVM算法表现出较高的影响力,Apriori算法的影响力则明显低于其他算法。本研究为量化评估算法的影响力提供了新思路。 相似文献
17.
论电视谈话类节目主持人的情感把握 总被引:2,自引:0,他引:2
在目前的电视谈话节目中主持人的情感运用存在不少问题,主持人刻意煽情、热衷隐私、追求眼泪使电视谈话节目陷入一个僵局因此,在电视谈话类节目中主持人要正确把握情感的运用,以打破此种僵局。 相似文献
18.