支持快速搜索定位,找到企业中各种数据资产,形成有效的数据交汇,来支持应用分析。
提供各种数据资产快速展现的个性化形式,方便使用者获取所需要的关键信息。
积累过去所有进行过的数据加工知识,在相似场景下可以更好的推送或重复使用这些数据。
在数据的搜索结果上,直接配备方便的分析工具,让数据使用的更加得心应手。
建立数据资产分布及综合评估的入口,更好的了解数据资产使用的各个方面。
数据是什么:需要知道数据形式是怎么样的,比如结构化或非结构化;数据定义是什么,比如技术、业务、管理等;数据的使用特性如何,比如频度、评价、质量、安全级别等;数据包含什么信息,比如时间周期、业务分类、信息密度。
数据在哪里:需要知道数据存放的位置,与业务相关的数据还有过去曾今用过且值得参考的数据有哪些,与数据使用相关的辅助性工具在哪里,等等。
数据如何取:需要提供一系列工具及辅助信息,帮助实现数据采样、数据查询、数据下载、数据安全沙箱建立各种使用数据的方式。
数据怎么用:需要帮助使用者更快速便捷地获取数据内在信息,例如,数据摘要信息、数据快速分析、数据报表工具、数据分析模型、知识帮助指导等。
独立于数据地图的数据资产开发者:数据地图作为一种对数据资产分布及运行情况的反馈的工具,用于帮助开发工作的有序进行。例如,对于业务部门提出的新增指标需求的开发,如果缺少数据地图对整个企业数据资产的全盘映射,则研发人员无法准确知道该指标是否已经存在,以及重复开发的可能,长期这样的话,会导致企业数据资产冗余低效,但依托数据地图,则可以通过指标注册、存在分析、链路比较等功能对指标的新增需求、加工流程进行一个统一的管理。
以数据地图为入口的数据资产开发者:可以参考框计算,数据地图可以实现对各种数据工具的集成,从而变成一个全新的入口整合平台。比如,原来搜索出来的报表,只知道名称和位置,要获取加工和所处位置,要获取信息或者做拆分加工,还需要启动开发流程,但借助数据地图,提供的工具集成,可以在搜索完之后,立刻进行简单的数据摘要信息展现、初步加工分析或者通过链接去调用其他系统的核心服务功能,这样便能让数据地图的功能更好丰富。
数据体检:提供对数据在设计、加工、运行、管理等不同的环节关键指标的采集,基于预设算法进行健康评估,从而为解决数据健康问题提供参考。数据体检是驱动数据治理不断完善的内生驱动力,它是高品质数据资产环境可持续发展的有力保障。
运维监控:配合运维日常管理制度和人员,基于各种技术监控、预警、问题诊断、干预等手段,并且依托数据地图来统一展现和管理交互,因此保障数据质量的可靠性。
安全评估:从数据安全角度提供评估分析能力,例如,数据敏感度、客户隐私信息和各环节审计日志记录管理等。
数据平台为数据使用者回答,数据是什么,数据在哪里,数据如何获取,数据怎么用这四个问题
数据是什么:需要知道数据形式是什么,eg:结构化,非结构化;数据定义是什么,eg:技术,业务,管理等;数据的使用特性如何,如频度,评价,质量,安全级别; 数据包含什么信息,如时间周期,业务分类,信息密度等。
数据在哪里:数据存放的位置,与业务相关的数据还有过去曾经使用且值得参考的数据有哪些,与数据使用相关的辅助性工具在哪里等,eg:记录数据相关的所做的处理过程名称,上下游关联表
数据如何获取:需要提供一系列的工具及辅助信息,帮助实现数据采样,数据查询,数据分发推送,等各种使用数据的方式。eg:记录数据的获取方式,是否需要走流程开权限,是否需要支持某些开放的接口,还是已经有一些现成的查询工具
数据怎么用:需要帮助使用者更快速,便捷地获取数据内在信息,eg:数据摘要信息,数据快速分析,数据报表工具,数据分析模型,知识帮助指导等
数据地图作为对数据分布和运行情况的反馈能力,用于能够帮助开发工作的有序进行。例如,一企业业务指标一般都是成百上千。如果没有通盘了解以前做的工作,或者对业务有足够的理解,很可能重复指标开发。造成功能冗余,产能低效。但数据平台具备的功能,则可以通过指标注册,存在分析,链路比较等功能对指标的新增需求,加工流程进行统一管理,减少重复开发,也加深了每个数据开发者对业务的立体化理解。
数据平台,可以输出各类数据 API,功能 API,对各类数据工具的集成,形成一个开发的数据中心和开发的计算平台。eg:例如分析企业担保圈,担保圈算法开发人员,针对数据平台提供数据输出接口,计算平台的输入格式,输出格式,甚至兼容自定义输出格式,开发自己的算法。
对于数据管理者来说,需要了解数据的全局情况,以及通过工具手段来评估数据资产在配置合理性,应用充分性,质量可靠性,风险可控性等方面的清苦啊,从而针对性地进行决策分析,并落实管理工作,具体表现在三个方面的能力
数据体检:通过对数据在设计,加工,运行,管理等不同环节关键指标的采集,基于预设算法进行健康度评估,从而为解决数据健康问题提供参考。数据体检是驱动数据治理不断完善的内,生驱动力,他是高品质数据资产环境可持续发展的有力保障。
运维监控:配合运维日常管理制度和人员,基于各种技术监控,预警,问题诊断,干预等手段,且依托数据平台来统一战线和管理交互,从而对确保数据质量可靠。
安全评估:从数据安全角度提供评估分析能力,例如,数据敏感度,客户隐私信息和各环节审计日志管理等
数据体检是保障数据质量的一个关键手段,可以及早发现问题隐患并预计及金额,放缓数据质量问题引起不良后果的重要手段。可以考虑从三个方面进行思考和研究:系统资源,数据流转,使用,存储状态,管控
系统资源
系统资源的充足健康,是数据产生价值的基础。