大宗小白|非结构化数据管理与应用设计

内容
 
发送至邮箱

大宗小白|非结构化数据管理与应用设计


【摘要】 : 非结构化数据与结构化数据是两种差异巨大的数据类型,随着大数据存储和计算能力的增强,非结构化数据由于其丰富的信息量,相较结构化数据拥有更大的数据资产化价值空间。

非结构化数据管理与应用设计

一、非结构化数据

随着互联网技术的日新月异,内容数据逐渐在各行业的业务中占据更重要的地位。日常的业务过程中,需要处理的大量电子文档、图片、音频、视频等,都属于内容数据范畴。非结构化数据指的是:数据结构不规则或不完整,没有预定义的数据模型,不方便用数据库二维逻辑表来表现的数据。在企业的整体数据架构中,非结构化数据包括所有格式的办公文档、图像和音频视频文件以及工程电子图等,约占企业数据存储量的80%以上。

非结构化数据与结构化数据是两种差异巨大的数据类型,随着大数据存储和计算能力的增强,非结构化数据由于其丰富的信息量,相较结构化数据拥有更大的数据资产化价值空间。

二、非结构化数据治理

非结构化数据治理是开展非结构化数据管理工作的关键,以统筹和协调非结构化数据管理各项工作有序开展为主要内容,其核心要素体现在组织、制度、文化和考核四个方面。

非结构化数据治理是为了消除信息孤岛,提高数据质量,共享信息资源,非结构化数据数量大、范围广、数据状态繁杂,涉及部门、人员和系统众多,正所谓牵一发而动全身。因此,要顺利开展非结构化数据的治理,必须充分做好前期的准备工作和规划。

三、非结构化数据管理解决方案

非结构化数据管理在企业实践中主要体现为 ECM 企业内容管理,其解决方案是通过企业内容管理系统来得到各项非结构化数据管理工作的具体落地实施。ECM 企业内容管理是指以一种战略或方法,来帮助企业获取、管理、存储、保护、利用和洞察企业组织流程相关的非结构化数据。电子文件管理推进联盟认为非结构化数据管理主要包括非结构化数据标准、元数据、数据质量、数据安全、数据合规和数据集成等六个方面内容。

1.数据标准

非结构化数据管理同样是需要建立相应的数据标准,以保证其管理的规范性。对于非结构化数据标准应规定其内容模型、内容分类、编码命名、内容格式、内容本体、版本策略、元数据、内容指标和内容接口等规范的标准。

2.元数据

元数据是描述数据的数据(Data about data),主要是描述数据的上下文信息。非结构化数据的元数据建立可以通过结构化数据的管理快速、便捷的发现、管控和使用非结构化数据。

3.数据质量

数据质量管控是数据价值化的必要条件,对于非结构化数据质量管理也需要制定管控目标、执行策略、管理制度等体系,围绕数据产生价值的全生命周期持续推进,以保证数据质量在其生命周期内真实、有效。

非结构化数据质量管理需要获得业务、信息和技术的全面支撑,且需要获得相应的资源投入支持。

4.数据安全

数据安全是实现非结构化数据价值的基础及保障,因此非结构化数据需要全面的、合适的、有计划的安全管控。应遵从企业信息安全和网络安全体系总体要求,根据其存储和使用的特点构建企业非结构化数据安全管理体系。

5.数据合规

企业数据的价值化建设是需要遵从法律、法规和企业制度管理要求的,不仅需要注重合规、隐私等方面的管控要求,还需要避免侵害国家、企业的相关权益,要受相关行业的监管和法律的约束。因此对于非结构化数据合规管理是确保数据资产保值、增值和价值变现的基础。企业需要根据非结构化数据特点构建完备合规体系,基于数据全生命周期的合规控制,对数据收集、数据处理、数据保管、数据共享、数据交易、数据披露、数据处置等各个环节进行合规评估和审计。

6.数据集成

非结构化数据集成主要分为两方面,一是为各种应用系统提供实时的、平台型的非结构化数据统一存储服务;二是为新业务应用输出各种非结构化数据服务,从而形成数据与业务的双向融合。

数据的价值,需要经过经过挖掘、清洗、提炼、分析、集成、应用、展示才能实现其资产价值。非结构化数据是企业数据的基石,因此对于非结构化数据的治理和管理是企业数据价值化的必由之路,通过科学、完整的管理方法论,才能构建出完整的非结构化数据管理体系,推动数据向数据资产的转化,为企业数字化经营、发展带来真正价值。

免责声明:本文部分引电子文件管理推进联盟文字资料版权归版权所有人所有,转载目的在于传递更多信息。如涉及作品内容、版权和其它问题,请在30日内与笔者联系,我们将在第一时间删除内容!



【摘要】 : 非结构化数据与结构化数据是两种差异巨大的数据类型,随着大数据存储和计算能力的增强,非结构化数据由于其丰富的信息量,相较结构化数据拥有更大的数据资产化价值空间。

非结构化数据管理与应用设计

一、非结构化数据

随着互联网技术的日新月异,内容数据逐渐在各行业的业务中占据更重要的地位。日常的业务过程中,需要处理的大量电子文档、图片、音频、视频等,都属于内容数据范畴。非结构化数据指的是:数据结构不规则或不完整,没有预定义的数据模型,不方便用数据库二维逻辑表来表现的数据。在企业的整体数据架构中,非结构化数据包括所有格式的办公文档、图像和音频视频文件以及工程电子图等,约占企业数据存储量的80%以上。

非结构化数据与结构化数据是两种差异巨大的数据类型,随着大数据存储和计算能力的增强,非结构化数据由于其丰富的信息量,相较结构化数据拥有更大的数据资产化价值空间。

二、非结构化数据治理

非结构化数据治理是开展非结构化数据管理工作的关键,以统筹和协调非结构化数据管理各项工作有序开展为主要内容,其核心要素体现在组织、制度、文化和考核四个方面。

非结构化数据治理是为了消除信息孤岛,提高数据质量,共享信息资源,非结构化数据数量大、范围广、数据状态繁杂,涉及部门、人员和系统众多,正所谓牵一发而动全身。因此,要顺利开展非结构化数据的治理,必须充分做好前期的准备工作和规划。

三、非结构化数据管理解决方案

非结构化数据管理在企业实践中主要体现为 ECM 企业内容管理,其解决方案是通过企业内容管理系统来得到各项非结构化数据管理工作的具体落地实施。ECM 企业内容管理是指以一种战略或方法,来帮助企业获取、管理、存储、保护、利用和洞察企业组织流程相关的非结构化数据。电子文件管理推进联盟认为非结构化数据管理主要包括非结构化数据标准、元数据、数据质量、数据安全、数据合规和数据集成等六个方面内容。

1.数据标准

非结构化数据管理同样是需要建立相应的数据标准,以保证其管理的规范性。对于非结构化数据标准应规定其内容模型、内容分类、编码命名、内容格式、内容本体、版本策略、元数据、内容指标和内容接口等规范的标准。

2.元数据

元数据是描述数据的数据(Data about data),主要是描述数据的上下文信息。非结构化数据的元数据建立可以通过结构化数据的管理快速、便捷的发现、管控和使用非结构化数据。

3.数据质量

数据质量管控是数据价值化的必要条件,对于非结构化数据质量管理也需要制定管控目标、执行策略、管理制度等体系,围绕数据产生价值的全生命周期持续推进,以保证数据质量在其生命周期内真实、有效。

非结构化数据质量管理需要获得业务、信息和技术的全面支撑,且需要获得相应的资源投入支持。

4.数据安全

数据安全是实现非结构化数据价值的基础及保障,因此非结构化数据需要全面的、合适的、有计划的安全管控。应遵从企业信息安全和网络安全体系总体要求,根据其存储和使用的特点构建企业非结构化数据安全管理体系。

5.数据合规

企业数据的价值化建设是需要遵从法律、法规和企业制度管理要求的,不仅需要注重合规、隐私等方面的管控要求,还需要避免侵害国家、企业的相关权益,要受相关行业的监管和法律的约束。因此对于非结构化数据合规管理是确保数据资产保值、增值和价值变现的基础。企业需要根据非结构化数据特点构建完备合规体系,基于数据全生命周期的合规控制,对数据收集、数据处理、数据保管、数据共享、数据交易、数据披露、数据处置等各个环节进行合规评估和审计。

6.数据集成

非结构化数据集成主要分为两方面,一是为各种应用系统提供实时的、平台型的非结构化数据统一存储服务;二是为新业务应用输出各种非结构化数据服务,从而形成数据与业务的双向融合。

数据的价值,需要经过经过挖掘、清洗、提炼、分析、集成、应用、展示才能实现其资产价值。非结构化数据是企业数据的基石,因此对于非结构化数据的治理和管理是企业数据价值化的必由之路,通过科学、完整的管理方法论,才能构建出完整的非结构化数据管理体系,推动数据向数据资产的转化,为企业数字化经营、发展带来真正价值。

免责声明:本文部分引电子文件管理推进联盟文字资料版权归版权所有人所有,转载目的在于传递更多信息。如涉及作品内容、版权和其它问题,请在30日内与笔者联系,我们将在第一时间删除内容!


    
查看详情》
相关推荐
 

招投标大数据

查看详情

收藏

首页

最近搜索

热门搜索