“2023全国企业数字化建设优秀案例征集”活动,由《中国企业报》集团、《互联网周刊》共同发起,活动启动后得到了广大企业的积极申报。2023年12月28日,“2023中国企业数字化发展大会暨优秀案例发布”在京举办,会议正式发布了“2023全国企业数字化十佳、优秀案例”,其中“2023全国企业数字化发展十佳行业应用示范案例”10家、“2023全国企业数字化建设优秀案例”95家、“2023全国企业数字化服务优秀案例”55家。
中企报数字经济微信公号自1月10日起陆续对2023年度入选案例进行展示,希望通过这些优秀案例的示范效应,为更多正在或即将开始数字化转型的企业提供宝贵的经验和启示。
本期展示的是“建设类”案例。
中国银行企业级数据平台建设项目
申报单位:中国银行软件中心
一、企业概况
中国银行软件中心始建于1992年5月,作为中国银行信息科技体系的重要组成部分,软件中心担负着中国银行应用软件开发、应用软件质量控制、应用系统维护工作,总部设在北京。经过30多年在金融软件产品开发和研究方面的积累,借鉴国内外先进经验,软件中心创建了一套基于矩阵式管理的技术管理架构,建立了覆盖全行软件产品开发的全生命周期管理机制。2009 年成为国内金融IT开发机构中首家通过国际软件能力成熟度4(CMMI 4)级认证的金融软件企业,2010 年通过国际化标准组织的(ISO 9001:2008版)质量体系认证,2017年通过国际化标准组织的(ISO 27001)信息安全管理体系认证。形成了稳定高效的技术中台体系,全面支撑行内企业级架构转型、信创国产化、一体两翼等,对外输出科技治理能力,释放“互联网+”新动能,加快金融数字化进程。
二、主要措施
2019年10月,中国银行积极响应国家大数据发展战略,启动数据治理体系改革,从组织架构入手,以客户信息治理等重点项目为切入点,举全行之力,实施中国银行“三横两纵一线”企业级数据平台建设项目。2021年2月起,陆续完成数据字典、数据湖、数据仓库、分析师工作台、统一数据门户、数据纵横APP、数字资产协同等应用的投产上线,“三横两纵一线”企业级数据平台架构落地,数字资产价值正在逐步显现。2022年4月,为进一步完善治理体系,成立数字资产运营中心,强化应用职能,形成“管好”和“用好”数据良性循环。截止目前,经历多批次投产完善及推广实施,逐步实现了系统功能及底座的全面升级,在集团“一体”全面落地,并在海外区域中心和综合公司独立部署,全面辐射至海外分行及综合经营公司。
在项目建设过程中,中国银行多举措并举,持续推动中国银行业级数据平台建设项目稳步实施,全方位提升企业数据治理水平,实现集团层面的统一数据、统一架构和统一生态。
(一)建成“三横两纵一线”数据治理体系架构
中国银行企业级数据平台建设项目旨在搭建“三横两纵一线”的集团数据治理体系,为业内首创。体系架构如图所示。
“三横”是一个集团统一数据平台,构建企业级“数据+分析+展现”三层架构体系,为数字资产的共享、分析应用、服务提供和价值创造提供全面、敏捷、精细的能力支撑。“两纵”是指集团统一数据字典和标准质量全流程管控机制。一本集团统一数据字典,从源头规范产生的数据;一套标准质量全流程管控机制, 将数据标准、数据质量嵌入到系统从需求提出、开发到投产以及数据分析应用的全生命周期。“一线”是指一条数据红线,全面推行数据认责,业务制度与管理制度并重,严肃数据纪律,明确数据红线。
(二)构建统一数据字典平台
构建统一数据字典平台,提供丰富数据治理功能,形成全行统一数据资产地图。按照业务管理功能进行模块切分,不同模块数据隔离存储,模块间数据交互通过本模块对外暴露的接口进行访问。WEB层对外提供用户交互页面。服务层基于PAAS平台,采用微服务架构。
(三)建设数字资产协同平台
深度整合流程引擎、表单引擎、流程建模工具,提供灵活可配置的数据流程建模、执行、管理能力。数字资产协同平台主要分为流程引擎技术平台和流程应用两个相互独立的子系统,均采用前后端分离的架构设计,流程引擎提供灵活可配置的流程建模和执行能力,流程应用通过API网关提供高质量高性能的稳定服务,并提供与其他系统的快速对接能力。
(四)打造企业级数据湖和数据仓库
打造内容丰富(包含集团内外部数据、历史数据和新增数据)的数据湖和算力强大、标准统一的数据仓库,并构建湖仓协同的数据存储加工体系,流批一体的综合处理架构。以“Hadoop技术”构建贴源数据层、归集数仓及数据应用结果数据,发挥其对多态、复杂结构数据的归集、存储和处理能力,搭载适用于海量数据处理、交互式分析和实时计算与访问的配套组件,提升数据应用效率,降低实施运维成本。利用“MPP数据库”搭建数据仓库基础主题层和汇总共享层,解决复杂数据关系下的关联计算问题,保障数据仓库模型架构稳定和数出同源。以“云上服务”构建湖仓应用服务,发挥云平台易扩展特点,基于IAAS搭建的对象存储,为数据湖提供统一的原始数据存储服务,支持横向扩展,沉淀全行数据资产;基于PAAS搭建数据库以及消息队列等基础服务,为湖仓协同信息流交互提供保障;SAAS提供统一数据服务管控全行服务资产。
(五)构建1+N服务模式
搭建统一服务中心,构建1+N服务模式,统一纳管数据服务生成、订阅,提供数据服务公共能力基础,满足稳定性固定的用数场景。建立“沙箱态、开发态、灰度态、生产态”四态环境,协同赋能,构建敏捷高效的DataOps体系,打造“自主用数”的分析师工作台,提供分析工具、资源环境、内外部数据统一访问,实现了既能集中统一管理又能灵活“主动用数”的平台架构,支持不同角色用户开展数据分析应用。提供基于BI工具的灵活查询与报告制作等功能,基于人工智能的机器学习模型训练能力,为分析师提供丰富的机器学习算法,实现从数据预处理、切分到模型训练的全流程。
(六)打造全新可视化交互模式及PC和移动端协同多元展示渠道
提供统一认证、统一展现、统一用户体验的自主前端框架,打造全新可视化交互模式及PC和移动端协同多元展示渠道。提供数据治理、产品交付、信息应用、成效评估等价值链的全过程展示能力,为信息治理方、建设方、服务方、应用方提供沟通、交流、分享、协作的平台,并提供丰富友好的数据展现功能和用户服务,构建统一的数据资产生态圈。
(七)构建基于“国芯”“国魂”国产化架构的企业级数据平台
基于“国芯”“国魂”的大数据全栈国产化架构构建了“一云多芯”企业级数据平台,实现了整个数字资产管理和运营领域的全栈国产化。项目全采购国产设施,从硬件、操作系统、中间件三个维度以全国产厂商的供应链为基础搭建技术架构。技术架构具备高可用、易扩展等特点,结合虚拟化技术,构建底层资源可统一管理、动态调配的IAAS及PAAS服务,无对外服务的故障“断点”,基于自研国产化分布式服务框架构建云上服务,多地多中心部署,保障应用服务高可用、不间断。业界首创大数据灾备体系,构建无间断的大数据服务体系。
(八)建设敏捷高效的大数据技术平台
通过敏捷高效的大数据技术平台建设,构建集“采、存、算、用、管”五大核心能力为一体的技术底座,为大数据应用系统的开发、运行和运维提供技术支撑能力。通过大数据开发框架的建设,为大数据开发测试人员,提供统一的在线开发站点,实现了开发、测试、运维一站式流程化服务,并制定了开发规范、用数规范和指标加工规范等标准规范,在降低开发难度的同时显著提高了开发效率。通过大数据作业调度引擎的建设,为大数据领域各应用系统及租户提供统一的作业调度服务,屏蔽了底层技术栈的差异,同时支持分层的调度体系,提供多调度引擎的分层调度管理,实现了统一的作业、作业管理和监控运维。
三、应用效果
(一)打造自主知识产权
1.在系统架构上,中国银行“三横两纵一线”企业级数据平台从硬件、操作系统、中间件三个维度以全国产厂商的供应链为基础搭建技术架构。采用联想国产服务器搭配海光、鲲鹏国产化芯片搭建基础架构,运用国产中标麒麟操作系统、国产化关系型及列式数据库构建基础系统环境。同时将信创建设和数字化重构紧密衔接,广泛开展技术升级和平台迁移,用分布式替代集中式、云架构替代传统IT架构,国产化替代“IOE”,自研代替开源。
2.在应用软件上,一是基于HADOOP+MPP的混合技术栈,建立一套企业级数据底座(即三横两纵的数据层),面向所有后续数据集市、监管报送等分析层应用场景提供统一、一致的高阶数据。通过数据层和分析层两相结合构建出分层次、分领域的企业级数据资产全景,再通过展现层统一对外展现,实现数据加工、数据展现的分层级管理,做到数据管用分离。二是自主建立一套数据管理体系(即两纵的数据字典平台、数字资产协同平台),统一管理所有OLTP、OLAP系统的元数据信息,建立数据血缘链路,为全集团数据应用提供企业级的数据标准,从源头实现数据标准一致管控。建立一套数据管理机制流程,将数据认责融入其中,确保数据仅在权限范围内可见与可用,从而实现数据安全的全流程管控。三是自主开发了星汉大数据开发平台,统一数据类应用开发框架和流程,统一研发标准与工艺流程,提升研发效率。
(二)推广应用成效显著
结合全球区域管理要求,由总行统筹,以“三横两纵一线”体系架构统一的标准、流程、平台、机制,实现集团“一体两翼”(以商业银行服务为主体,以综合化服务、全球化服务为两翼)快速推广。截至目前,“三横两纵一线”企业级数据平台项目已经在中银集团“一体”全面落地,并正在海外区域中心部署,全面辐射至海外分行及综合经营公司,取得了良好成效。
(三)促进多方面效益转化
1.战略效益
项目建设积极响应国家和行业号召,坚持自立自强,围绕数字经济、信创工程、创新驱动发展战略。一是促进西部地区绿色经济发展。规划落成内蒙古大数据机房,依靠当地绿色能源技术和资源优势,深入推进大数据、云计算技术落地实施。通过外租机房模式,带动当地绿色经济发展。二是执行信创国产化建设。三是推动数据要素跨域流动。东数西算,积极引导项目资源向西部地区倾斜。积极探索利用公共存储和计算资源实现数据跨域存储和主权管理的新机制、新方法。
2.经济效益
项目推动数据和技术从“支撑赋能”向“价值赋能”变革演变,形成包括前、中、后台,业务条线、数据要素与信息科技“多兵种”协同作战,面向银行未来业务和未来管理,实现数据价值创造。打造领先的数据要素创新能力,2021年和2022年,在客户洞察领域、智能风控领域、数据治理领域、智能运营等领域组织81个数据应用项目落地,消灭50个集市、建成43个领域应用,取得了良好的应用成效。实现智能的数据服务能力,通过分析师工作台为业务部门、分行、各类柔性组织建立84个租户,算法及模型1856个,分析师用户3000+,累计点击量53万+。构建一体的数据运营能力,数据湖和数据仓库自2021年2月和7月分别投产以来,实现了对行内主要数据平台的功能承接和数据覆盖,日均接收文件45万个,目前沉淀数据资产28PB,提供5年历史数据,基本实现了数据既全且通的目标。打造统一的大数据技术平台,目前已服务产品70+,以可视化、低代码等建设特性,每年可节省开发工作量12900人天。
3.社会效益
项目贯彻落实国家大数据战略,充分体现新时代国有企业的使命和担当,支撑科学决策,防范化解风险;维护数据安全,防范数据霸权;实现数据协同,促进数据融通,为同业破解数据难题、实现组织协同提供中行方案。
4.管理效益
“三横两纵一线”数字资产运营服务体系框架已全面建成并辐射至中国银行全集团,中行方案为金融行业数据治理、管理和运营提供了最新思路和实现路径。提升全面的数据管理能力,建立数据生命周期管理机制,保持企业级数据标准的权威性,实现了对OLTP、OLAP系统的全域管理。2022年5月,中行企架客户、机构、员工、权限组件上线,覆盖集团“一体两翼”,涉及百亿级数据迁移,全部遵循企业级字典的标准和规范实施。构筑长效的数据续航能力,建立、培育内部人才“生产力”,数据分析师序列专业资格认证人数超4000,其中高级资格人员100+,中级资格人员2000+,初级资格人员2000+。
(四)项目建设成效获得业界广泛认可
项目建设成效得到人民银行、银保监会等监管机构的充分肯定,并获得多项业内权威奖项。2021年,人民银行有关部门主动调研借鉴中国银行数据治理制度体系、数据字典内容建设等经验。银保监会在风险防范座谈会上,对中国银行数据治理工作给予充分肯定和认可,认为中行的数据治理工作在同业中处于较高水平。项目建设成果荣获中国人民银行2021年度金融科技发展奖一等奖、NIISA国家互联网数据中心产业联盟2021技术创新项目奖特等奖、金融电子化2022金融业数字化转型突出贡献奖和2022IDC中国金融行业技术应用场景创新奖。
案例编写组成员:王继武、赵小柱