中信建投在金融电于化期刊发布 DataOps 实践

文 ‖ 中信建投证券股份有限公司 马丽霞 高宇航 李可 许哲 李海伟

file

近年来,数据的分析和应用对各行各工业的业务模式和竞争形态进行重塑,而积极应对挑战和顺应时代变化是各个市场参与者的必选项。作为资本市场数字化转型的领航者,中信建投证券重视数字化转型机遇,陆续启动了各业务领域的数字化转型建设。

DataOps 作为近年来数据管理领域兴起的工程文化和实践,借用了 DevOps 敏捷交付的基础框架,揉合了 DAMA 数据治理理念,强调在如此激烈竞争的商业环境下,最大限度地快速匹配业务部门的需求和资源开展交付,加速业务价值的试验与试错,持续实现数据价值。

为高质量服务公司数字化转型,中信建投证券于 2021 年正式启动 DataOps 能力建设,结合公司现状打造了 DataOps 研发管理创新体系,梳理优化需求、设计、开发、测试、投产的全过程及相关支撑工具的整合,逐步建立了标准化、全线上流水线,支持数据持续集成和交付,为数据供给提供效率和质量的双重保障,支撑公司数字化转型。

基于DataOps的券商数据平台与应用服务体系建设

1. 面向“汇聚共享”的数据底座

中信建投证券建设了信创化的云原生湖仓一体数据底座。该平台是将数据湖的灵活性和数仓的易用性、规范性、高性能结合起来的融合架构,是公司打造的新代数据底座,满足了数据高效汇聚、数据算力灵活扩展、资源隔离的需求。

file

通过建设数据底座,打破了公司数据“烟囱”壁垒,将公司内外部的数据汇聚在一起,并参考证券行业SDOM数据模型结合公司数据标准规范和实际情况,对数据进行重新清洗、整理、组织和联系,逐步形成公司级的高质量、可信的、标准化的产品、客户、机构等共性数据,为经营分析、风控等数据消费提供数据供给。

同时探索建立指标标签管理体系,在共性数据的基础上,数据底座还构建了指标标签工厂。一方面推动指标标签的定义归集、计算(结果)归集和服务归集 ;另一方面通过解耦指标标签需求与数据开发,通过提供统一语义层,下游数据消费者可以方便地将业务语言转换为技术语言,快速实现业务服务。

2. 建设“服务化”的数据中台

搭建企业级数据能力框架,弥合数据供需鸿沟,用户不需关注数据架构和技术只需关注业务实现,快速响应数据需求数据中台服务化分为数据技术服务化和数据服务化。

数据技术服务化通过搭建数据基础能力平台,为用户提供开箱即用的数据开发能力。为此,数据中台构建了数据开发中心和数据基础服务中心。

数据开发中心:构建统一、标准化的一站式数据开发协作平台,完成采集、建模、加工、测试、调度、发布、监控功能的整合和集成,降低数据开发门槛,提升开发运维效率。中信建投联合白鲸开源基于WhaleScheduler产品基础上打造了全栈信创化的数据开发平台,实现统一数据开发、任务编排、任务调度,更好地完成了离线批处理、实时流处理等任务,有效峰低了数据加工处理成本,真正实现精益敏捷的数据运营。

数据基础服务中心:数据中台搭建了AI、BI、图计算、OLAP、实时计算等基础服务集群,封装了对应的数据服务能力,满足各种业务场景对计算能力的要求,帮助下游系统快速构建数据应用。

“数据服务化” 体现为封装数据底座数据应用的数据接口,提供服务化的数据调用介入方式。为此,数据中台构建了数据服务中心和数据资产中心。

数据服务中心:在数据安全合规的前提下,将数据以API、文件等形式开放供业务流程调用、下游系统交换数据使用。

数据资产中心:建设数据门户,提供企业级数据资源访问入口和数据工作展示服务窗口。将数据资产目录建设为公司级的数据资产查询和操作系统,解决数据“是什么,在哪里”的问题,具备向数据服务引流的能力,支持数据应用。同时整合公司各项数据能力,打造数据工具箱,面向不同用户提供不同的数据能力服务,着力解决数据“怎么用”的问题。

3. 打造“敏捷高效”的数据产品交付中心

数据需求方面,通过“两归口”实现需求统筹管理。一方面,发挥SI制度优势由业务部门SI归口本部门数据需求,从源头上规范数据需求:另一方面,组织数据专家形成评审委员会,对重点项目重点需求开展评审,借助专家经验不断提升交付质量。

数据研发方面,通过一站式数据开发协作平台与公司DevOps持续交付体系结合起来,数据开发协作平台统一对接Gitlab进行代码托管,将各种数据任务类型构建数据研发流水线,提高数据研发效率和交付能力。同时,数据研发过程引入数据模型管控,通过对接数据模型管理工具,实现数据模型设计标准化。

CI/CD方面,数据流水线通过持续集成插件自动化进行代码规范扫描、业务规则测试、测试报告生成,满足数据测试质量要求版本后,运维人员可以一键确认和发布,极大节省了测试和运维工作量,提升了版本发布效率和成功率,实现了数据产交付的标准化规范化。数据研发流水线可以实现开发、测试和部署的多重保障降本增效,提升大规模数据需求交付能力实现数据价值快速输出。

4.面向“自助消费”的数据服务体系

传统的企业数据需求很大一部分是通过内部数据查询单的模式触发数据分析工作,由于开发人员工作排期及需求理解等问题,分析需求需要多轮迭代才能完成导致数据分析的时效性低。针对这一问题中信建投证券探索建立自主消费的数据服务体系。

从工具层面,基于数据中台打通了数据探源、整合及分析展现的整个链路构建自助分析体系,通过可视化低代码开发代替专业工具代码开发将以往的开发门槛大大降低。通过数据自助分析,业务用户可以更快速地进行数据探查和分析模型迭代,极大提高了数据分析的时效性。

从制度文化层面,持续开展数据分析师培训,帮助更多人建立数据思维。从人力资源层面,以数据中台为依托,举办数据分析师培训及作品评比比赛,通过作品评选挖掘发现潜在种子用户、种子部门逐步建立企业数据分析师团队。

5.构建“智能”数据管理与运营平台

(1)价值驱动的数据交付。倡导由数据价值驱动的数据开发运营,评估数据产品的业务价值和经济价值。企业数字化的目标是要建立长期目标和规划的,以关键项目为抓手,集中最优势的资源,攻坚克难,解决业务发展中最迫切的数智化要求。

(2)开发治理一体化。遵从源头管控的原则,积极开展数据治理并将相关动作尽量前置,并与数据的研发工艺有机结合.在数据产生阶段即开展数据治理。通过数据开发和治理的统一规划管理,推动数据汇聚和标准化,强化大数据融合分析。

(3)运营管理一体化。数据产品的强大生命力,一方面依赖于高质量的数据数据研发;另一方面通过收集和挖摇用户需求,以及实际的使用效果和反馈,不断优化迭代数据产品,将其建设为业务级甚至是公司级的重量级数据产品,实现数据运营与研发管理的协同。

未来展望

DataOps能力体系的建设是一个不断打磨、精益求精的过程,中信建投证券将在不断探索和总结中持续前行,为公司数字化转型提供更多动力和支持。

一是加强业务赋能。围绕关键数据应用和场景、数据组织,借助DataOps开展持续集成交付,提高数据仓库、数据中台等平台类工程建设的ROI,实现数据组织协作效能最大化,帮助企业实现数字化转型。

二是聚焦内功、不断进化。目前DataOps理念和方法论还在不断演进中因此,需积极对标最佳实践,完善我司DataOps体系,同时也会积极参与相关标准的制定和推广工作。

file

文章来源于金融电子化第355期期刊

本文由 白鲸开源科技 提供发布支持!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/206046.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

python动态加载内容抓取问题的解决实例

问题背景 在网页抓取过程中,动态加载的内容通常无法通过传统的爬虫工具直接获取,这给爬虫程序的编写带来了一定的技术挑战。腾讯新闻(https://news.qq.com/)作为一个典型的动态网页,展现了这一挑战。 问题分析 动态…

指针(2)

函数指针数组 函数指针数组是一个用来存放函数指针(地址)的数组。 如上图,是将两个函数指针存入数组中。如何写函数指针数组名呢?我们可以先写出函数指针类型int (*)(int,int)然后在(*)里面加上数组名[]即可。 指向函数指针数组…

面试题:什么是负载均衡?常见的负载均衡策略有哪些?

文章目录 一、负载均衡二、负载均衡模型分类三、CDN负载均衡四、LVS负载均衡4.1 LVS 支持的三种模式4.1.1 DR 模式4.1.2 TUN 模式4.1.3 NAT 模式 4.2 LVS 基于 Netfilter 的框架实现 五、负载均衡策略是什么六、常用负载均衡策略图解6.1 轮询6.2 加权轮询6.3 最少连接数6.4 最快…

Ubuntu使用Nginx部署前端项目——记录

安装nginx 依次执行以下两条命令进行安装: sudo apt-get update sudo apt-get install nginx通过查看版本号查看是否安装成功: nginx -v补充卸载操作: sudo apt-get remove nginx nginx-common sudo apt-get purge nginx nginx-common su…

解决:ModuleNotFoundError: No module named ‘xlrd‘

解决:ModuleNotFoundError: No module named ‘xlrd’ 文章目录 解决:ModuleNotFoundError: No module named xlrd背景报错问题报错翻译报错位置代码报错原因解决方法今天的分享就到此结束了 背景 在使用之前的代码时,报错: pin_r…

C 中的结构 - 存储、指针、函数和自引用结构

0. 结构体的内存分配 当声明某种类型的结构变量时,结构成员被分配连续(相邻)的内存位置。 struct student{char name[20];int roll;char gender;int marks[5];} stu1; 此处,内存将分配给name[20]、roll、gender和marks[5]。st1这…

11-30 JavaWeb

修改与删除操作 防止空指针异常 localhost:8080 -> 分页查询 修改流程:(先查后改(两个servlet)) 修改: 传用户id(用户id怎么得到 -> 循环一次得到一个user 对象 user对象里用user.getId()得到用户id) UpdateUserQueryServlet.java (…

「Verilog学习笔记」状态机-重叠序列检测

专栏前言 本专栏的内容主要是记录本人学习Verilog过程中的一些知识点,刷题网站用的是牛客网 读入数据移位寄存,寄存后的数据与序列数做对比,相等则flag为1,不等则为0 timescale 1ns/1nsmodule sequence_test2(input wire clk ,in…

计网Lesson5 - MAC 地址与 ARP

文章目录 M A C MAC MAC 地址1. M A C MAC MAC 地址的格式 2. M A C MAC MAC 地址的获取3. A R P ARP ARP 协议4. A R P ARP ARP 缓存5. R A R P RARP RARP M A C MAC MAC 地址 1. M A C MAC MAC 地址的格式 每个网卡都有一个 6 6 6 字节的 M A C MAC MAC 地址 M A C…

最大公约数的C语言实现xdoj31

时间限制: 1 S 内存限制: 1000 Kb 问题描述: 最大公约数(GCD)指某几个整数共有因子中最大的一个,最大公约数具有如下性质, gcd(a,0)a gcd(a,1)1 因此当两个数中有一个为0时,gcd是不为0的那个整数&#xff…

ios 逆向分分析,某业帮逆向算法(一)

用到工具: 爱思助手CrackerXL(砸壳软件)越狱手机ida反汇编软件分析login 的sign 签名算法中自己写算法 已知我们32位,我们不妨猜测是md5 ,那我们试图使用CC_MD5 ,这个是ios 中的标准库, 我们使用frida-trace 注入hook一下,看看有没有 经过 是经过了这个函数,密码也是…

计算机服务器中了_locked勒索病毒如何处理,_locked勒索病毒解密数据恢复

网络技术的不断发展,给企业的生产生活提供了极大便利,越来越多的企业走向数字化办公时代,但网络的发展也为网络安全埋下隐患,网络安全威胁不断增加。近期,云天数据恢复中心陆续接到很多企业的求助,企业的计…

FO-like Transformation Oracle Cloning

参考文献: [RS91] Rackoff C, Simon D R. Non-interactive zero-knowledge proof of knowledge and chosen ciphertext attack[C]//Annual international cryptology conference. Berlin, Heidelberg: Springer Berlin Heidelberg, 1991: 433-444.[BR93] Bellare M…

网狐类源码游戏配置数据库数据(一键配置网狐数据库)

网狐类源码游戏配置数据库数据(一键配置网狐数据库) 一般拿到网狐的源码或组件,需要先附加或配置数据库,以下为全部需要更改数据的地方,这里以荣耀系列版本数据库为例: 1. 数据库设置 [RYPlatformDB].…

appium :输入框控件为android.view.View 时输入内容(如:验证码、密码输入框)

问题背景 输入密码的组件信息为&#xff1a;<android.view.View resource-id“com.qq.ac.android:id/pwd_input”> 由于输入框控件是android.view.View&#xff0c;不是android.widget.EditText&#xff0c;所以只能点击&#xff0c;而启动appium后&#xff0c;会将输入…

华为全屋智能5.0,无为而“智”

在赖特西塔里埃森混凝土墙的中心壁龛里&#xff0c;一块铜牌上刻着一些英文&#xff0c;意思是“建筑的意义不是屋顶和墙&#xff0c;而是人们生活于其中的空间”。 这句话&#xff0c;取自老子《道德经》中的“凿户牖以为室&#xff0c;当其无&#xff0c;有室之用”。 《理想…

知乎禁止转载的回答怎么复制做笔记?

问题 对于“禁止转载”的回答&#xff0c;右键复制是不行的&#xff0c;ctrl-c也不行&#xff0c;粘贴之后都是当前回答的标题。稍微看了代码&#xff0c;应该是对copy事件进行了处理。不过这样真的有用吗&#xff0c;真是防君子不防小人&#xff0c;只是给收集资料增加了许多…

osgFX扩展库-刻线特效、立方图镜面高光特效(2)

刻线特效 刻线特效(osgFX::Scribe)是一个双通道的特效&#xff0c;第一个通道以通常的方式渲染图形&#xff0c;第二个通道使用线框模式。用户设置好光照和材质之后&#xff0c;即可使用指定的颜色进行渲染。这个特效使用了PolygonOffset渲染属性类来避免多边形斑驳(Z-fighting…

【多传感器融合】BEVFusion: 激光雷达和视觉融合框架 NeurIPS 2022

前言 BEVFusion其实有两篇&#xff0c; 【1】BEVFusion: A Simple and Robust LiDAR-Camera Fusion Framework. NeurIPS 2022 | 北大&阿里提出 【2】BEVFusion: Multi-Task Multi-Sensor Fusion with Unified Bird’s-Eye View Representation 2022 | MIT提出 本文先分…

Constraintlayout

goneMargin 约束的View隐藏时的margin 约束链风格 chainStyle 权重 bias 设置宽高比 w,h 百分比 GuideLine 基线 上下的间距 Group 指定一系列View进行绑定进行操作 通过init加载 然后setIds进行绑定 然后通过group进行操作 Layer 设置动画 Barrier Flow
最新文章