如今,各行各业都被“疯狂”的大数据所包围。企业需要收集、归档和研究越来越多的数据。面对海量数据,企业管理者应该如何管理数据并充分利用数据的价值?答案是“元数据”。
Gartner曾在一份研究报告中指出,“元数据管理将是未来企业信息化的核心基础设施”。特别是在大数据环境中,如果企业不通过元数据管理来管理各种复杂的信息,就很难有效利用信息。
“那么,什么是元数据和元数据管理?本文将为每个人整理元数据的概念,并帮助企业理解元数据管理的作用。”
一、什么是元数据?
元数据被定义为关于数据和信息资源的描述性信息。简而言之,“关于数据的数据”
例如,在网上购物时,网上商店展示的每件衣服都是数据。其中,服装的品牌、款式、尺寸、颜色、面料材料和适用年龄都是元数据,详细描述了服装的具体信息,为您的购物选择提供参考。
在生活中,元数据有许多应用场景。甚至可以说,自从我们第一次了解这个世界,我们就与元数据密不可分。例如,图书馆收藏信息卡和个人信息注册都是元数据应用程序。
二、元数据有什么特点?
三、元数据的作用
01。元数据对于数据集成是必要的。
我们知道数据仓库* * *的特点是它的集成。这一特性不仅体现在它所包含的数据中,也体现在数据仓库项目的实施过程中:
一方面,从每个数据源提取的数据应该按照一定的模式存储在数据仓库中,这些数据源与数据仓库中的数据之间的对应关系和转换规则应该存储在元数据知识库中。另一方面,在数据仓库项目实施过程中,直接建立数据仓库往往需要时间和精力。
因此,在实践中,人们可能首先根据统一的数据模型构建数据集市,然后在每个数据集市的基础上构建数据仓库。然而,随着数据集市数量的增加,很容易形成“蜘蛛网”现象,元数据管理是解决“蜘蛛网”的关键。
02。元数据可以帮助用户理解数据仓库的数据。
系统用户无法像数据仓库系统管理员或开发人员那样熟悉数据库技术,因此迫切需要一种“翻译”,使他们能够清楚地理解数据仓库中数据的含义。
元数据可以实现业务模型和数据模型之间的映射,因此数据可以按照用户需要的方式“翻译”,从而帮助最终用户理解和使用数据。
03。元数据是确保数据质量的关键。
企业数据集成完成后,用户在使用过程中会经常怀疑数据。这是因为底层数据对用户来说并不“透明”,用户自然会怀疑结果。
在元数据管理系统的帮助下,最终用户可以很容易地获得每个数据的事件顺序以及数据提取和转换的规则,因此他们自然会对数据有信心。当然,数据的质量问题也很容易发现。
04。元数据可以支持需求的变化。
随着信息技术的发展和企业职能的变化,企业需求也在不断变化。传统的信息系统通常通过文档来适应需求的变化,但是仅仅依靠文档是远远不够的。
元数据独立于平台,可以有效管理整个业务的工作流、数据流和信息流,使系统独立于特定的开发人员,从而提高系统的可扩展性。
四、元数据管理功能
metadata management通过绘制数据图、统一数据口径、标记数据方向、分析数据关系、管理模型变化、分析对大数据平台现场层面的影响、突破上下游数据继承关系的断层,为数据质量维护和业务逻辑可视化奠定了坚实的基础。
这里我们主要深入了解元数据管理中的数据映射、血缘关系分析和影响分析功能。
01,数据地图
数据地图以拓扑图的形式分层显示企业运营过程中的技术元数据和业务元数据,并控制不同层次图形显示的粒度,以满足开发、运营和维护或业务中不同应用场景的图形查询和辅助分析的需要。
02,血缘分析
血缘分析(Blood Relation Analysis)是指从某个实体开始,追溯其处理过程,直到目标分析对象根据转换关系逐步展开。
血缘关系分析直观地显示了目标对象的生成过程,包括哪些表被转换,以及经历了哪些转换,从而帮助业务人员理解它在过程中被赋予的含义以及它将受到的影响。
03,Impact Analysis
Impact Analysis描述了信息之间依赖关系的详细信息,并分析了数据源中更改的影响。
影响分析反映了当前对象参与企业系统平台形成的元数据。用户可以使用影响分析来观察对象的影响能力,即哪些子元数据将受到当前元数据修改的影响。在
五、结束语
大数据时代,无法挖掘的数据将毫无价值,换句话说,如果元数据管理不善,收集和存储的数据将失去意义,也没有商业价值。
因此,只有重新拾起元数据,使用元数据作为数据治理的起点,逐步理清企业数据和关系,加强控制,企业信息管理者才能更好地管理企业数据资产。
极牛网精选文章《从概念到管理,一文读懂元数据》文中所述为作者独立观点,不代表极牛网立场。如若转载请注明出处:https://geeknb.com/5041.html