首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 484 毫秒
1.
厘清当前阶段人工智能训练数据在AI开发者端口的来源渠道与使用情态是进一步探讨AI训练数据治理的基础与前提.本研究在扎根理论的指导下,以滚雪球抽样法获得的100位AI开发者为研究对象,通过半结构化访谈结合非正式沟通、现实观察、内部与公开资料搜集等方式获取研究数据并提炼概念与范畴,勾勒出现阶段人工智能训练数据在AI开发者端...  相似文献   

2.
生成式人工智能引爆AI新时代,新技术不断涌现并快速迭代更新,AI技术应用呈现出百花齐放、百家争鸣的繁荣发展局面。借助AI发展东风,智慧数据的生成进入了高效、深化、多模态集成的新阶段,提升了数据驱动的文化遗产活化利用创新手段和创新形式的丰富度与可行性。本文旨在探索面向文化遗产活化利用的智慧数据生成路径。首先,从AI技术视角,对文化遗产智慧数据的内涵与价值进行回顾并知新;其次,系统分析从多元异构数据资源中生成智慧数据的典型做法;再次,以羌年为例,探讨非遗活态文化的智慧数据生成思路。最后,总结归纳AI赋能文化遗产智慧数据生成路径的四点参考策略:(1)抓住AI赋能机遇,补齐数据基础设施短板,加强数据资源体系建设;(2)尽快开展馆藏数据资源的“大语言模型+知识库”结合工作,实现智能分析与计算增强;(3)鼓励更广泛的文化遗产数据开放与共享,支持活化利用的创新应用;(4)确保可信的智慧数据。图3。表1。参考文献68。  相似文献   

3.
数据是计算机管理档案的核心,没有数据、数据量不足或数据质量差都将使整个计算机管理系统失去应有的使用价值. 一、标准化、规范化是数据准备的基础 标准化是组织现代化管理的重要手段,在具体工作中应以国家标准、行业标准为准则,根据实际情况,制定并完善本……  相似文献   

4.
王伟 《档案时空》2015,(12):36-38
一、大数据的概念 当前,关于大数据的定义,众说纷纭,虽然没有一个统一的描述和定义,但其内涵基本一致.麦肯锡将其定义为:"大小超出了典型数据库工具收集、存储、管理和分析能力的数据集."这说明了大数据不仅体现了数据量巨大,而且是传统方法无法处理的数据集.大数据同过去的海量数据有所区别,正如IBM公司根据其本质将大数据的特征概括成三个"V",也就是规模(Volume),快速(Velocity)和多样性(Variety). 规模是指聚合在一起,供分析的数据量必须是非常庞大的,从TB级别,跃升到PB级别.  相似文献   

5.
丁鑫 《图书馆学刊》2014,(10):118-120
随着“大数据时代”的到来,各种信息数据量剧增,原有的图书数据存储模式由于其包身固有的缺点,已无法适应这种大趋势.全息数据存储技术是近年发展起来的一种新颖存储技术,具有较高的存储密度及数据传输速率等优点.通过对比分析数字图书馆相对于传统图书馆的先进性,并结合全息存储技术的优缺点,阐述了将全息数据存储技术用于数字图书馆建设的应用前景.  相似文献   

6.
一、计算机管理系统的特点档案室计算机管理系统处理的数据量大。我院现存50年的各类档案全部按项目级—案卷级—文件级建立了档案目录数据库。处理的档案条目达几十万条,图纸扫描9万多张,收集电子图纸4万多张,并进行全部挂接。如果要按档案原文处理,数据量更是海量,数据存贮要求高。由于档  相似文献   

7.
鲁德武 《档案》2014,(4):13-15
档案大数据是指一定空间与时间范围内所有档案数据的集合。档案大数据与大数据既有数据量巨大、数据类型繁多、处理速度快的共性,亦有数据相对分散、单一种类档案数据价值密度高、数据可靠性与保真性高的差别。挖掘提取有价值信息,进行科学预测是档案大数据的核心内容。  相似文献   

8.
正大数据时代的到来对传统出版产业带来众多影响,并由此对图书编辑提出了许多新要求,只有适应这些影响且具备相应的应对能力,才能顺应出版产业新形态的时代发展,履行推动文化传播的重要职责。维基百科对大数据的定义为:大数据,或称巨量数据、海量数据、大资料,指的是所涉及的数据量规模巨大到在合理时间内无法通过人工达到截取、管理、处理,并整理成为人类所能解读的信息。在总数据量相同的情况下,与个别分析独立的小型数据集相比,将各个小型数据集合后进行分析可得出许多额外的信息和数据关系性,可用来察觉商业趋势、判定研究质量、避免疾病扩散、打击犯罪或测定实时交通路况等,这样的用途正是大数据盛行的原因。  相似文献   

9.
企业发展会积累大量有价值的档案数据,照片档案因其直观性强,成为具有影响力的重要资源。为充分利用这部分数据,需要将原单一图片管理系统中海量历史照片数据导入新的档案管理系统,实现照片档案的在线查询和利用,发挥照片档案的不可替代的历史凭证价值。历史数据迁移是目前档案管理系统管理中一项重要工作,因数据种类多、数据量大,完整无误的迁移成为未来档案信息查询利用的关键。  相似文献   

10.
[目的/意义] 人工智能(AI)正引发链式反应般的科学突破,引领新一轮科技革命和产业变革,图书文献情报领域如何利用AI技术提供智慧知识服务与智能情报系统是当前行业关注的焦点与热点。[方法/过程] 从图书情报行业内外综合分析AI技术与大数据为知识服务范式带来的新平台、新服务以及新机遇与新挑战,提出"AI技术+大数据"驱动的智慧知识服务生态体系建设的总体思路,从智慧数据、智慧中台与智慧服务3个层面共同构建"科情大脑",提供覆盖科技管理、科技创新与社会学术信息环境的开放智慧知识服务生态环境。[结果/结论] 以中国科学院文献情报中心的文献情报数据湖、智能知识服务引擎、智慧知识发现、智慧知识管理、智能情报分析系统以及智能感知环境6个方面进行探索建设,取得有意义的成效。面向未来,阐明AI技术在面向大数据治理、细粒度知识识别、精准服务提供等方面,仍需要在数据、技术以及服务模式上进一步提升。  相似文献   

11.
倪惠杰 《传媒》2023,(1):38-40
智库化转型是媒体机构转型升级的现实需要,也是适应媒体融合趋势的主流方式。面对媒体融合与智库建设战略的时代语境,南方都市报以“大数据+AI”为动力,以“全面智库化”为方向,采取“媒体+智库”两元发展策略,通过将智库产品深度嵌入社会治理、企业运营等多元应用场景,实现了媒体智库化的成功转型。通过分析“大数据+AI”赋能南方都市报智库化转型的机遇、实践举措,为传统媒体办智库提供启示。  相似文献   

12.
【目的】我国推进媒体深度融合发展、建设新型主流媒体已经从最初的探索推进深入到深度发展阶段,以大数据大模型为基础的生成式AI将成为推动传媒行业进入新一轮结构性改革的新动能,如何构筑这个新动能是媒体人必须面对的一个重要课题。【方法】高质量数据是人工智能发展的基础,本文通过理论与实践结合,分析数据标准作为媒体建设高质量数据关键要素,必须要工程化、系统化以及保持开放性去建设。【结果 /结论】进入AIGC时代,媒体必须通过体系化构建好数据标准,才有可能、有能力应对因“大体量、多模态、机器化”的内容数据生产、加工、应用所带来的各种发展及安全问题。  相似文献   

13.
人工智能生成内容(AIGC)已经开始应用于学术论文的写作,如何判别此类文本成为学界的重大挑战。文章选取了2022年发表的100篇医学综述的文摘,随机选择50篇利用ChatGPT4.0进行重写(AI写作组),余50篇不做处理(原文对照组)。在整合处理后将两组文本进行万方文献相似性检测系统检测,同时将两组数据随机打乱后交给AI检测工具和评审者以评定是否为AI写作,并比较他们在判别能力上的差异。结果发现上述两组数据基于文字的相似性检测结果显示,AI写作组相似性比例仅为6.19%,远低于原文对照组的55.91%(P<0.01)。在识别是否由AI写作方面,ChatGPT无法执行此类任务。AI检测工具和评审者均能较好地完成检测任务,其准确率分别为81.0%和77.9%(P>0.05),两组间差异未见有显著的统计学意义。然而,在考察假阳性两组间表现出显著差异(4.0%比14.7%,P<0.01),在假阴性方面组间没有差异(34.0%比29.6%,P>0.05),说明评审者更容易误将人类撰写的文本判定为AI写作,识别AI写作文本稍胜一筹,但差异不大。上述研究指出学术编辑可以发现...  相似文献   

14.
随着信息技术的发展,需要存储和传播的信息数据量越来越大,数据的种类和形式越来越丰富,数据资源呈现规模大、多源性、多语言等特点,使得海量数据资源的组织和管理面临极大的挑战.本文分析和阐述海量数据资源在组织与管理等方面的问题和方法,并介绍在相关领域的研究工作和体会.  相似文献   

15.
倪娅静 《兰台世界》2016,(15):62-64
在大数据和网络化的时代,数据量急剧膨胀和信息来源多样化必将对高校图书馆的传统优势造成深刻的影响,数据的处理、挖掘和服务将是当今高校图书馆核心竞争力之所在。高校图书馆为保持长久竞争优势应积极转型和创新,注重核心竞争力的培养,遵循顶层设计与实践相结合、观念与行动相结合、时代与现实条件相结合的原则,培养以数据为中心的核心竞争力。  相似文献   

16.
《中国传媒科技》2005,(7):22-23
多媒体数据与传统数据有着显著的区别。首先,多媒体数据量远远大于传统媒体数据。典型的MPEG-1码率为1.5Mbps,1分钟MPEG-1码流的数据量高达11.25MB,远远超出了传统媒体的数据量。其次,多媒体有媒体质量属性。如视频、音频均可用峰值信噪比(PSNR)来衡量媒体质量,部分丢失媒体数据使媒体质量下降,但不至于使信息完全丢失。还有就是用户对多媒体数据有特殊操作。在VoD系统中,用户交互包括暂停、恢复、前跳,后跳等,这些操作都是多媒体应用所特有的。因此,流媒体与传统网络媒体也有着显著的差别。  相似文献   

17.
可变数据印刷的数据基础需要花费一定的时间才可能建立起来。现在我们已经看到了可变数据印刷的零星应用,如上面谈到的汽车经销、博彩,超市及其他商业领域。这些可变数据印刷的应用者已经拥有了可变数据直邮的基础数据,并正在开始利用这些数据。然而,要想使这些基础数据得到更充分的应用,还需要进行更加深入的数据挖掘,这项工作需要大量的时间投入,可能几年,甚至十几年。专家们已经预测,随着基础数据量的不断增大,几年后,信息数据挖掘将会成为数据基础工作的主流。  相似文献   

18.
徐莹 《档案管理》2007,(3):75-75
文献与档案数字化是高校信息化建设的核心.没有数据或数据量不足或数据质量不高都将影响高校计算机信息系统的效用,甚至使其失去应有的使用价值.要做好高校文献与电子文件数据的保存与积累工作.需做到下几点:  相似文献   

19.
数据科学解决的是海量数据的快速处理和精准分析等问题,而档案数据管理在数据量急速增长的现实环境中,亟须新技术、新方法和新理念来减轻海量数据处理的负担,数据科学的相关技术和思维在一定程度上为档案数据管理突破“困局”提供了便利。数据科学影响下档案数据管理的突破口(1)数据分析和加工技术促进档案数据管理的“有序化”。依靠数据加工和数据分析技术,庞杂无序的档案数据可以在最短的时间内呈现相互关联、有序的状态,使得档案数据管理获得关联清晰、逻辑清晰、价值清晰的数据序列,为档案数据的进一步加工、利用奠定坚实的数据基础。  相似文献   

20.
大数据不仅指庞大的数据量,同时也是一种解决问题的方式.基于大数据的精确营销在各行各业已经得到广泛应用,对图书馆信息营销也将起到巨大的促进作用.通过对大数据的筛选、挖掘,图书馆可以准确把握用户信息需求,实现资源特点与用户信息需求的精确匹配,在此基础上部署和实施信息营销策略,节约营销成本,提升营销效率.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号