指标管理必知的真相:订单事实表里没有原子指标

上篇文章「一个问题鉴定指标管理真实力:订单表里有原子指标吗?」写完以后,分享到一个群里,有同行回复:有,比如订单金额。

看到回复,我脑子突然就断电了,好像对诶!确实是有原子指标叫订单金额的。

果然,哪怕推导过依然会经常忘记,我当时是咋推导出来的呢?跟我一起来看看~

01 先看一些材料

阿里的数据团队基于电商的海量大数据,在国内构建顶级的数据系统,也输出了很多数据理论和规范,他们产出OneData指标理论体系,也可以说是业界公认的标准体系了。

以下两段内容以及图片都来源于阿里云dataworks-智能建模/原子指标

指标是衡量业务特征的统计数值,用于体现企业某一业务活动的业务状况。指标通常分为原子指标和派生指标,与指标相关的参数还包括修饰词和时间周期。派生指标则是由原子指标 + 时间周期 + 一个或多个修饰词组成。

原子指标用于明确业务的统计口径和计算逻辑,是基于用户的业务活动(即业务过程)创建的,用于统计业务活动中某一业务状况的数值。例如,用户的业务活动为购买,则原子指标就可以指定为支付金额。

图片

下面这张非常经典的图估计你也看过,也是来源于阿里数据团队的书:《阿里巴巴·大数据实践之路》,被很多数据领域的文章和书籍所引用。

图片

第一次看这张图,我很震撼。因为当时对指标体系的认知很模糊,相当于给我当时错乱的脑子梳理出来一个非常清晰的逻辑。

但其实,有一些东西深究下去,发现自己不理解

比如,维度为什么指向属性?是维度表里属性字段的意义吗?那什么是度量,度量和指标是一个意思吗?数据域是什么?如何划分?划分的标准是什么?

但后来,我发现很多书、文章都是基于这套理论系统来展开的,有的甚至把原子指标、派生指标这套体系大讲特讲,但始终没把蠢蠢的我讲懂、讲服

其实,这些问题萦绕在脑子里,需要结合实际数据慢慢去去理解,甚至是需要自己依照这个图的结果自行给出合理的解释,才能说服自己(就这样吧,别纠结了吧)。

好吧,但既然大家都这么说,那我也就随大流吧。但始终我还是觉得没懂,不太舒服,直到我捋清楚了。

02 为啥没有原子指标

接下来,我说说为啥订单事实表里没有原子指标。

以下,我们结合数据仓库的知识一起来看几个点(包含我的个人理解)

第一,指标定义

指标是对事实的数字化度量。

第二,原子指标特点

原子指标是最细粒度、不可拆分的指标。

第三,派生指标的定义

派生指标 =  一个或多个修饰词 + 时间周期 + 原子指标(有的公司也叫衍生指标,不管叫啥定义都差不多,有的公司定义是这样:衍生指标 = 维度+时间周期+业务限定+原子指标)

第四,事实表的特点

事实表,包含维度属性字段和事实字段。如果有疑问,可以看《数据仓库工具箱·维度建模权威指南》里对事实表的定义。

也可以看各个数据产品中数据建模的功能模块,在创建事实表时,字段会分不同的类型,维度 or 指标 or 事实。

可以参考官方文档:华为云数据治理中心 DataArts Studio> 用户指南> 数据架构组件> 模型设计> 维度建模> 新建事实表

图片

也可以参考:有数数据开发及管理平台用户手册 V6.5.0 Update /离线用户手册/模型设计中心使用指南/外部数据源建表演示

图片

当然,你依然可以参考:大数据开发治理平台 DataWorks 操作指南/数据建模 DataWorks智能数据建模/维度建模/可视化建模/创建逻辑模型:明细表

不过需要补充说明,阿里的dataworks这款产品里,维度和粒度很容易把人绕晕(关联粒度,也就是关联维度)

图片

图片

有了这四个前提,很明显看到:订单事实表得有维度,而原子指标没有维度

故而,订单事实表没有原子指标

那表里面有啥指标呢?表里有数,所有的数对应的都是衍生指标,或者派生指标(或者复合指标),都是具有非常明确业务含义的指标

正如这篇文章衬衫的价格是九磅十五便士,那么你应该选…提到的:一个美丽小胖黑孩(皮肤黝黑),买了一个中国的纯棉衬衫,衬衫的价格是九磅十五便士。

单纯说「订单价格」这个指标,是没有任何业务含义的,在具体的业务场景里的解释一个具体的数字才有实际意义

就好像,平台打广告给咱们说:诶呀,双十一衬衫跳水价啦!但是呢,你喜欢的特定品牌的、M码的、黑色经典款的衬衫价格没降,结果你没下单,系统也没订单生成。

就算咱们把这个订单金额的指标定义出来了,有啥真实意义呢?没数哇,分析啥?要解释啥?啥也没有,洗洗睡了。

聊抽象的东西,可以聊,但是分析一个真实发生了的、一个具体的什么样的人、买了一件具体的什么样的衬衫价格多少,才有意义。

03 不争了,而且我知道你懂,请让我再说一句

到这里,问题的争论就结束了,咱也不掰扯概念了。

不管认不认可答案,只要知道:衍生/派生指标由修饰词/维度/时间周期/原子指标组成,你肯定也知道指标该怎么管。

原子指标,只不过定义了数该怎么算,从哪算。除了原子指标以外,其他构成派生指标的其他元素,是叫做修饰词、维度、业务限定,都无所谓了。

再多的前缀,也都是修饰,形容词。

「原子」这个词语在我们中文语义里,是不能再细拆的,而当我们加形容词,描述的粒度反而越来越细,这个结果跟对词语的理解是完全相反的,很容易给人带来错误的感觉。

任何的形容词,都是对原子指标的细致解释。最终,我们反过来看。与其叫做原子指标,不如换种说法叫词根指标

比如:近1天线上渠道订单金额、近1天线上渠道会员订单金额、近1天上午时段线上渠道高级会员订单金额。

当我们彻底搞明白了指标的定义,有了自己的理解,哪怕真实的工作中业务复杂,有成千上万的指标,我们也不会怕了,一眼就能识别出来。

希望看完文章的你,不用再为概念纠结了,也不会被别人轻易地唬住了,也能一眼识别对方是在不懂装懂,还是真的OneData大师~

-end-

接下来,我们可以看看指标具体怎么管,指标管理系统如何构建,会碰到哪些问题,而这,是一个复杂的系统性工程。

以上~

感兴趣的话,记得点赞、在看、收藏,如果还有问题,记得留言喔,这样我才有继续写的人情,我们下回见!

-推荐阅读-

一文帮你更好地理解指标

四千字全面解析数据产品经理必知概念:标签、维度、指标

-链接我-

一个人走得快,但是一群人走得更远。欢迎链接,请写明来源:公众号

非球友的微信私信问题不会回答,如果有问题,请加入星球提问

让我们彼此尊重,一起探索有价值的问题。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/203738.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

借助 DPM 代码扫描的力量解锁医疗设备的可追溯性

在当今的医疗保健系统中,医疗设备的可追溯性变得比以往任何时候都更加重要。为了增强现代医疗保健领域的可追溯性和安全性,UDI 条形码充当唯一设备标识的标准,为医疗设备提供唯一标识符。 DataMatrix 代码(或直接零件标记代码&am…

Python爬取某电商平台商品数据及评论!

目录 前言 主要内容 1. 爬取商品列表数据 2. 爬取单个商品页面的数据 3. 爬取评论数据 4. 使用代理ip 总结 前言 随着互联网的发展,电商平台的出现让我们的消费更加便利,消费者可以在家里轻松地购买到各种商品。但有时候我们需要大量的商品数据进…

网络和Linux网络_7(传输层)UDP和TCP协议(端口号+确认应答+超时重传+三次握手四次挥手)

目录 1. 重看端口号 1.1 端口号的概念 1.2 端口号的划分 2. 重看UDP协议 2.1 UDP协议格式 2.2 UDP的特点 3. 重看TCP协议 3.1 TCP协议格式 3.2 TCP的解包分用 3.3 TCP的可靠性及机制 3.3.1 确认应答ACK机制 3.3.2 超时重传机制 3.3.3 连接管理机制(三次…

内存泄漏检测工具valgrind

示例: class Person { public:Person(int age){//将年龄数据开辟到堆区m_Age new int(age);}//重载赋值运算符 写法2 此代码在linux测试Person& operator(Person& p){*m_Age *p.m_Age; //通过linux下valgrind工具检测,无内存泄漏情况。//此语…

LVS+Keepalived实验

实验前准备 主DR服务器:(ens33)192.168.188.11 ipvsadm、keepalived (ens33:0)192.168.188.188 备DR服务器:(ens33)192.168.188.12 ipvsadm、keepalived (ens33:0)192.168.188.188 Wbe服务器1:(ens33)192.168.188.13 (lo:0)192.168.188.188 W…

UG\NX二次开发 获取对象上属性的锁定状态UF_ATTR_ask_locked

文章作者:里海 来源网站:里海NX二次开发3000例专栏 感谢粉丝订阅 感谢 2301_80435318 开发 订阅本专栏,非常感谢。 简介 设置对象上属性的锁定状态UF_ATTR_set_locked,需要先在“用户默认设置”中勾选“通过NX Open锁定属性”&…

【攻防世界-misc】[简单] 凯撒大帝在培根里藏了什么

1.下载文件,打开后是这样子的 2.根据题目提示说是有凯撒密码和培根密码,因为文件内容为AB形式,不符合凯撒条件,所以先用培根解,将文件内容复制,CTF在线工具-CTF工具|CTF编码|CTF密码学|CTF加解密|程序员工具…

虚拟机安装centos7系统后网络配置

一.桥接网络和nat网络的区别1,桥接模式(如果外部访问虚拟机,最好选这个) 通过使用物理机网卡 具有单独ip,但是需要手动配置。 在bridged模式下,VMWare虚拟出来的操作系统就像是局域网中的一台独立的主机,它…

数字孪生智慧园区:企业与政府合作的共赢之选

随着科技的快速发展和数字化转型的推动,数字孪生技术正逐渐成为智慧城市和园区建设的重要方向。数字孪生智慧园区,以数字孪生技术为驱动,通过对园区实体和虚拟环境的全面感知和深度理解,为园区管理者和入驻企业提供智能化决策支持…

2023 BUCT 计算方法实验报告

前言 Textlive版本:2023 textstudio版本:4.6.3 名字和日期在以下地方修改: 图片下载地址; figures.zip LiangCha_Xyy/Source - Gitee.com 如下图,.tex文件和figures文件夹放在同一路径下即可 .tex代码 \documentclass[UTF8]{ctexart} \usep…

行业研究:2023年建筑涂料市场需求及发展方向分析

目前绿色化经济成为社会经济主旋律,涂料行业作为高污染行业,国家层面出台了一系列政策规划引导行业向绿色、安全、环保发展。例如,禁止使用高VOCs含量的溶剂型涂料,推广水性涂料等低VOCs含量涂料,鼓励外商投资高性能涂…

电力变压器行业分析:预计2029年将达到84亿元

随着中国“节能降耗”政策的不断深入,国家鼓励发展节能型、低噪音、智能化的配电变压器产品。在网运行的部分高能耗配电变压器已不符合行业发展趋势,面临着技术升级、更新换代的需求,未来将逐步被节能、节材、环保、低噪音的变压器所取代。 电…

ffmpeg 把mp4文件中某段视频转成gif文件

一 缘起背景: 有视频文件转gif动图的需求;网上下载的转换工具需要注册会员、否则带水印,还限制时长。 二 工具环境: win10 下 dos 操作 ffmpeg 三 操作命令: ffmpeg -i test.mp4 -ss 00:01:01 -t 00:00:19 -vf &q…

Springboot——HttpClient入门(Get和Post)

1. HttpClient 1.1 介绍 HttpClient 是Apache Jakarta Common 下的子项目,可以用来提供高效的、最新的、功能丰富的支持 HTTP 协议的客户端编程工具包,并且它支持 HTTP 协议最新的版本和建议。 HttpClient作用: 发送HTTP请求接收响应数据…

Windows系统下使用PHPCS+PHPMD+GIT钩子

前言 使用PHPCSGIT钩子保障团队开发中代码风格一致性实践 使用PHPMD提高代码质量与可读性 0.介绍 PHP_CodeSniffer php代码嗅探器 包含phpcs(php code standard 代码标准) phpcbf(php code beautify fix 代码美化修复) 是一个代码风格检测工具,着重代码规范 它包含两类脚本…

GEE数据集——NOAA全球蒸发应力指数 (ESI)

NOAA 蒸发应力指数 (ESI) 蒸发应力指数 (ESI) 由 NOAA 卫星应用与研究中心 (STAR) 和 USDA-ARS 水文与遥感实验室制定。蒸发应力指数 (ESI) 是异常蒸散条件的热指标,可用于干旱监测。蒸发压力指数 (ESI) 描述蒸散量 (ET) 的时间异常,突出显示地表用水率…

asp.net基于WEB层面的区域云LIS系统平台源码

随着计算机技术在检验管理方面的广泛应用,以及各种先进的检验仪器在检验医学领域的使用,检验科室对信息化管理提出了更高的要求。正是在这样的背景下开发出了实验室信息管理系统(简称LIS) 结合当今各检验科管理及实验室规模的不同状况&#x…

流批一体历史背景及基础介绍

目录 一、历史背景1.BI系统2.传统大数据架构3.流式架构4.Lambda架构5.Kappa架构 二、流批一体与数据架构的关系数据分析型应用数据管道型应用 三、流与批的桥梁Dataflow模型四、Dataflow模型的本质一个基本点两个时间域三个子模型1.窗口模型2.触发器模型3. 增量计算模型 四个分…

Vue项目解决van-calendar 显示白色空白,需滑动一下屏幕,才可正常显示

问题描述,如图 ipad(平板)或者 H5移动端引入Vant组件的日历组件(van-calendar),初始化显示空白,需滚动一下屏幕,才可正常显示 解决方法 需在van-calendar上绑定open"openCalendar"事件…

APP测试的测试内容有哪些,常见的Bug分类介绍!

对于产品的手机项目(应用软件),主要是进行系统测试。而针对手机应用软件APP的系统测试,我们通常从如下几个角度开展:功能模块测试、兼容性测试、安装和卸载测试、软件更新测试、性能测试、用户体验性测试、交叉事件测试…
最新文章