建议项目名称
(中文)
|
电信和互联网行业数据仓库平台能力要求
|
建议项目名称
(英文)
|
Capability requirements of data warehouse platform for telecommunication Internet industry
|
制定或修订
|
■制定 □修订
|
被修订标准号
|
|
采用程度
|
□IDT □MOD □NEQ
|
采标号
|
|
国际标准名称
(中文)
|
|
国际标准名称
(英文)
|
|
采用快速程序
|
□FTP
|
快速程序代码
|
□B □C
|
ICS分类号
|
35.020
|
中国标准分类号
|
L70
|
牵头单位
|
中国信息通信研究院
|
体系编号
|
S-02-02-09
|
参与单位
|
中国移动通信集团有限公司,阿里云计算有限公司,腾讯云计算(北京)有限责任公司
|
完成周期(月)
|
24
|
目的、意义
或必要性
|
从上世纪90年代开始,随着电信行业垄断格局被打破,电信行业的市场竞争越来越激烈,在2000年左右,电信企业间的竞争已经不满足于单纯的价格战手段,迫切需要提升竞争的手段和方法,为提升企业市场竞争力,充分使用各种信息化手段,其中数据仓库是主要的手段。同时互联网行业为提升自身竞争力,满足业务变化快、实时性要求高、数据量大的诉求,使用数据仓库进行决策分析,做到快、精、准响应,来满足企业在数据运营、价值挖掘、运维等方面的需求。
数据仓库可以将分散在不同数据库中的多个数据源进行汇聚、抽取、清晰、转换等操作,最终汇总成一系列面向企业所需要主题的数据集合,用于对管理决策过程的支持。数据仓库是解决企业数据问题应用的过程,是企业信息化发展到一定阶段不可缺少的一步,也是发展数据化管理的重要基础。
本标准主要针对数据仓库平台,梳理其应具备的技术能力要求,以供开发者参考比照,选购者根据标准测试情况选购核实自身的产品,从而使供需双方能够更顺畅的对接。
|
范围和主要
技术内容
|
本文件规定了数据仓库平台的基本能力、运维能力、安全能力、高可用能力、扩展性能力。
本文件适用于数据仓库平台的设计、测试、评估和验收等,主要面向电信、互联网行业的数据仓库平台的测试和选型,其他行业也可参考。
主要技术内容涵盖存储、计算分析、查询、安全、运维等模块,具体分为1、实时查询与分析能力、实时写入能力、实时加工能力等基本能力;2、弹性能力、负载隔离能力、监控告警能力等运维能力;3、数据加密解密、数据脱敏等安全能力;4、高可用切换、备份等高可用能力;5、外部数据湖存储、自定义函数等扩展性能力。
|
国内外情况
简要说明
|
相关标准中有(GB/T 38676-2020)《信息技术 大数据 存储与处理系统功能测试要求》、YD/T 3761-2020《大数据 数据集成工具与测试方法》、YD/T 3760-2020《大数据 数据管理平台技术要求与测试方法》、YD/T 3773-2020《大数据 分布式批处理平台技术要求与测试方法》、3774-2020 《大数据 分布式分析型数据库技术要求与测试方法》:
其中GB/T 38676-2020《信息技术 大数据 存储与处理系统功能测试要求》、YD/T 3761-2020《大数据 数据集成工具与测试方法》、YD/T 3760-2020《大数据 数据管理平台技术要求与测试方法》、YD/T 3773-2020《大数据 分布式批处理平台技术要求与测试方法》标准包含了不同类型数据存储系统相关的能力,但尚未对数据存储、处理的时效性进行约束。
3774-2020《大数据 分布式分析型数据库技术要求与测试方法》约束了分析型数据库的技术要求,未对实时性、云原生特性进行约束,此外还借鉴了3774-2020《大数据 分布式分析型数据库技术要求与测试方法》中的高可用相关的能力。
国际标准参考ITU-T F.743(Big data infrastructure evaluation framework)无实时性相关要求。
ISO/TS 29585:2010《Health informatics — Deployment of a clinical data warehouse》介绍的是临床数据仓库部署相关内容,非数据仓库平台技术能力要求。
GB/T 35295-2017《信息技术 大数据 术语》中数据仓库指在数据准备之后用于永久性存储数据的数据库。
|
备注
|
|
牵头单位
|
(签字、盖公章)
月 日
|
标准化技术组织
|
(签字、盖公章)
月 日
|
部委托机构
|
(签字、盖公章)
月 日
|
|