数据平台的功能有哪些?数据平台的功能有什么优势?
大数据平台:是指以处理海量数据存储、计算及不间断流数据实时计算等场景为主的一套基础设施。典型的包括Hadoop系列、Spark、Storm、Flink以及Flume/Kafka等集群。
大数据平台的功能是为了满足企业对于数据的各种要求而产生的。
大数据平台的功能至少应该提供以下4方面:
1、业务测试流程(测试用例)与测试数据的关联管理
这个数据平台的功能的主要作用是方便测试组管理测试过程中的数据准备工作,在执行某项测试任务或测试用例之前,可以把关联的造数过程自动触发执行,测试用例执行完成之后,再触发数据清理恢复的动作。
2、数据关系可视化
测试数据之间的关系可视化管理,有利于测试人员理解测试数据之间的关联关系,对照业务功能层面的关系进行梳理,以便正确地设计造数方法、造数脚本。
3、测试数据批量生成
大批量的数据生成不可能人工执行,必须依赖上述造数方式的自动化执行,通常需要利用一些脚本、工具辅助完成。
4、测试数据验证
造数完成后,需要结合业务规则、数据关联关系、数据字段设计规范等对已造数据进行自动化的快速验证。
数据平台的功能优势:
1、容纳海量数据
2、速度快
3、兼容传统工具
4、利用Hadoop
5、为数据科学家提供支持
6、提供数据分析功能