欢迎光临深圳市莞深恒源科技有限公司官网!
全国咨询热线:13144843931
当前位置: 首页 >> 新闻中心 >> 常见百科

大数据时代档案数字化发展方向

时间:2022-01-23 17:07:36 作者:超级管理员 点击:1108次

●大数据时代,人工智能正在引领各领域、各领域的变革与变革。被称为“大数据之父”的美国软件开发商维克托·迈尔·舍恩伯格将互联网大数据概括为“生活、工作和思维的巨大转变”。2014年3月,大数据首次被纳入工作报告;2015年8月,国务院发布《促进大数据发展行动纲要》;2015年10月,党的十八届五中全会正式提出“实施贵阳大数据战略,推动数据资源建立开放”,说明中国已经将人工智能作为重要资源,提升为建设战略。在人工智能浪潮汹涌的时代,档案机构要顺应时代,推动大数据时代档案管理的产业转型。

●2019年4月,国家保密局与财税金融部联合组织电子发票无纸化报账、核算、备案试点区,确定7家试点企业。此次试点的成功,将使大量具有原生数据状态的档案资源成为未来档案机构的主要监管对象。“万物皆数”的思维,潜移默化地让曾经作为传统信息载体存在的事物在未来以数据的形式存在,这也预示着档案与数据的界限在未来会越来越模糊。狭义地说,档案数字化管理一般包括传统电子档案和电子档案的数字化处理和原生数据文件的管理。广义而言,档案存储与管理是档案管理信息化的深化和升级,是未来档案的发展方向信息化建设。

●档案管理工作正在经历从数字化到数字化的转变,这是纸质档案数字化工作的提升,是档案利用的深度发展,是推动档案服务升级的新机遇。本文认为,大数据环境下档案管理数据智能化的转型具体表现在以下几个方面:

人工智能引领未来,引领档案管理的信息管理思维。

●档案管理从互联网到数据驱动的过程中,管理对象的变化带来了诸多挑战,创新思维是引领档案管理数字化转型的基本要素。要转变档案存储和管理的思维,首先要明确档案与数据的关系。大数据时代档案的定义将进一步巩固大档案的概念,拓展档案的内涵和外延。从大数据云计算的角度来看,档案是精华的宝库数据资源,可以将档案转化为便于计算和处理的数据,或者将档案转化为用户使用的数据;数据也是档案,在网络社会中承载着人类记录的印记。面对纷繁复杂的数据,档案机构应强化数据归档意识,及时改变传统的档案思维,建立以数据为导向的档案思维,掌握档案管理数据的智能化发展方向,能够积极应对档案管理信息化带来的一系列挑战。

●勋伯格认为,大数据对人的思维的改造体现在三个方面:开放全信息模型、拥抱杂合、关注线性关系。不,这些思想可以映射到大数据管理文件的思维转换上。首先,全数据决策的建立有利于海量数字档案的利用,这是指档案资源的开发和利用。目前档案数字化全文开发刚刚步入正轨。2020年6月,上海市档案馆数字档案公众查阅平台可完成馆藏开放档案93万余份档案级目录的在线查阅,并可申请预约部分原始档案。同时还可以观看3万多份档案的数字化全文和部分史料研究成果2.。但是,数字化转型的全文查询仅仅达到了大量文档的水平,还没有渗透到档案的内容中,所以还没有偏离把文档作为一个整体的管理理念。随着大数据挖掘的不断创新,海量的数字档案将形成庞大的数字档案,注册信息资源的开发利用将更加多元化。其次,包容性并不意味着文件数据的质量和内容的真实性会降低,而是对于不同格式数字文件兼容性的提升,虽然复杂多变的数字文件对档案管理工作提出了挑战,但不同格式的数字文件可以重新定义数据管理的思维局限,打开看待整个文件的全新视角。*后,重视正相关可以作为我们档案保管和管理的目标。数字化后,档案会随着粒度的减小而变得分散。重视数字化档案之间的关联性,就是通过关联来聚合零散的数字化档案,而不仅仅是把档案和整体档案作为房屋开发,它善于在更细的粒度层次上发掘更大范围的档案利用价值。

●电子发票是练习数字思维的违法案例。电子发票应用类似关系数据库的文件结构。这种文件只需要定义它的关键数据项和打印布局。发票要素的所有动态数据都以数据库系统的形式集中存储。用户购买的发票数据自动读入数据库,成为数据仓库表文件中的记录存储。当用户需要下载、查询、打印发票时,可以将该数据在相关数据库表中的记录转换为PDF或JPG发票单据。以京东集团为例。购物体验结束后,填写公司名称、座机号码、邮箱地址等电子发票信息。收到货物后,申请签发电子发票。经过一系列的上传和审核工作,电子发票云服务平台按照电子发票机制和要求生成带有出票人签名的电子发票及其格式文件,市场消费者可以自行下载。大数据时代,许多纸质文档在产品周期中的生成、存储、存储、利用等管理过程,已经不适合遵循数字时代的思维模式,而必须在数据驱动的框架下进行重构。

数据的广泛应用不仅改变了人们的记录工具,也革新了人们观察世界的思维和视角。未来传统的档案思维也需要改革,即在重新认识档案与服务关系的基础上,建立以数据为导向的档案思维,从数据整合的角度思考档案管理。思维先行是档案机构应对人工智能挑战的首要准备。

发展导向、落后需求和现实瓶颈驱动着档案资源数字化。

●之所以推动档案管理信息化向大数据转型,既是高技术的迭代,也是信息社会档案数据资源利用的现实瓶颈,即现有的数字扫描资源无法满足档案用户多样化的现实需求。我国档案数字化工作的兴起摆脱了档案信息远程指导和利用的困境,但未完成的任务包括计算机可读和可理解的数据粒度(指数据在数据结构表中的精细化和集成化程度)。按照数据粒度细化,细化程度越高,粒度越小;精细化程度越低,颗粒度越大)层面的管理和开发,尤其是科研用户的综合化、多样化利用需求仍得到充分满足。任越等学者在对黑龙江省市级综合性国家档案馆调研论证的基础上,总结出登记信息资源保护过程中存在的数据驱动处理深度不足、档案部门数据意识淡薄、数字档案相关性低等矛盾问题。青岛市档案馆杨来青主任还结合信息化工作实践,提出了档案内容的精细化管理和开发,这是档案“再管理信息化”战略的重要环节之一。

●需求与现有数字档案发展成果的不匹配,使得档案发展转向逻辑层面,使得档案管理信息化成为大数据时代档案工作的发展新方向。数字化的主要目标是档案内容的大数据化,即将档案内容的智能碎片化学习转化为计算机可读的可测数据形式,通过碎片化学习数据和数据集实现数据的紧密构建和重组,*终对数字化档案进行语义简单处理和多维数据化。具体来说,档案媒体的数字化包括:档案管理水平的递进、档案开发粒度的细化、档案内容语义关联的加强。首先,档案管理从数字化技术向数字化运营转变带来的*显著的变化是档案管理水平的进步和数据管理对象的转变,即从传统的管理程序向存储管理转变,数字化运营后的档案和原始数据形态电子档案对以“档案”为运营单位的传统人事管理体系提出了挑战。其次,相对于传统的档案信息化和电子档案的发展,大数据之后,档案开发单位会下大力气将文档细化到内容,将内容语义化为数据,档案开发的粒度会不断细化。散落在海量档案中的数字档案,将通过本体、语义理解等技术,*大限度地实现档案价值的关键开发。*后,档案媒体数字化的*终目标是利用数字档案实现海量档案之间跨文件、跨文件的相关内容关联,有利于用户检索,*终提供更好、更完整的档案服务。数字档案经过碎片化学习后,需要借助语义处理等技术,基于语义对零散的数字档案进行分类合并,以突出数字档案之间的语义负相关,进而优化档案检索,发现档案之间的深层关系。

●基于内容的档案数据可以视为档案存储和管理转型的基本内容。它既是档案机构基于大数据时代实践做出的环境适应性战略转型,也是档案用户需求信息爆炸与档案机构工作瓶颈突破实现自我升级的契合点。目前,实现档案媒体数字化的典型案例是各个国家和地区的数字人文工程。在数据智能的基础上,对档案内容文本进行分类、聚合和关联,利用GIS、VR、AR等技术对档案内容进行展示。比如1993年,美国俄亥俄大学数字历史研究中心在美国推出的美国南北战争时期以地痞档案为主题的“影谷计划”,记录并展示了南北战争时期许多平民的信件、日记、声明、公告、报纸、演讲等原始资料。“影谷工程”网站展示的主题都是档案视频资源。

面向客户、数据授权、多服务示例升级文件

档案信息管理*终将受益于档案用户。基于数据的档案资源、数据技术、建模技术等多种因素的碰撞,将使未来的档案消费体验与传统档案还原服务完全不同,数据是提升档案服务的核心因素。

●首先,支持数据的文件服务很有技巧。基于数据的档案资源为档案的技术服务提供了源源不断的原材料和坚实的大数据体系,数据管理数据驱动是推动这一发展的强大动力。近两年,我国学者开始尝试从操作层面探索文物等原始档案的数据驱动工作。比如王开队借鉴CDBD和CHGIS技术,驱动徽州族谱中的人和地理的数据。文件服务技术化的实现需要借助语义、本体、知识地图等技术对文件内容进行语义拆分、清洗、合并和可视化,*终整体呈现丰富全面的文件知识成果。随着技术的不断发展,档案资源的数字化水平也将不断提高。在满足档案用户日常参考需求的同时,档案服务将由数据驱动成为精英。

●二是基于数据,档案机构全方位合作。在这个“数据为王”的时代,数据是组织之间相互竞争的战略资源,但也是不同管理组织之间全方位合作的基础。2017年,《文化部“十三五”时期文化科技创新规划》提出:“依托数字历史资源数据项仓库建设,收集数据,组织关联。研究用户数据采集标准,推动全国学校图书馆、大型博物馆、县级文化馆、展览等用户数据采集共享。引导社会共同开发利用人力资源数据,选择优质数据资源与人力资源数据相衔接”。档案机构保存着大量的文化旅游资源。然而,该计划并未明确提及档案机构应如何参与。目前,我国在政府层面已经有了档案机构跨方向合作的业务计划,这说明我国档案机构跨合作领域还有很大的发展空间。2020年新规《中华人民共和国档案法》提出:“国家推进档案数据共享服务体系建设,推进档案数字资源跨区域、跨部门信息利用”。利用数字档案馆推动档案机构跨机构、跨旅游等领域,并通过不同领域海量数据的关联和聚合,积极结合国情、档案、展览等合作联盟的销售经验,稳步推进与学校图书馆、城市博物馆、美术馆、城市群美术馆等历史遗产机构的合作,不断拓展档案数据资源数据库,是档案机构实现档案资源开发的必由之路信息化建设。不可避免的是,包括数字人文项目在内的档案馆、档案馆、博客等组织间信息共享的合作框架,在新技术的支持下,将为档案用户带来更加立体的使用体验。

●第三,文件用户收集数据并使用优化的文件服务。除了类似的档案媒体数字化之外,过去没有注意到的档案用户数据的获取和利用,也是档案管理信息化的表现之一。在隐私和安全的前提下,使用用户生成的人工智能可以满足更加个性化和精准化的归档服务。图书馆学界有学者提出,要利用个人用户形成的“小数据”,实现各类档案资源的综合服务。一般来说,是利用个人用户形成的用户习惯、资源供需等数据勾勒出“用户行为”,从而实现对档案用户的针对性服务,与开发用户积累的大数据并不矛盾。个人档案用户形成的“小数据”,是形成档案用户云计算的大数据系统。海量的档案用户数据有利于大多数用户掌握档案利用的整体情况,有利于档案资源的高利用率,有利于档案用户满意度的提升和反馈。档案用户数据的利用可以与“小数据”和“大数据云计算”紧密结合,在大体掌握档案用户资源的前提下,进一步满足个性化服务。