发现数据异常波动怎么办?别慌,指标监控和归因分析来帮你

企业搭建完善、全面的指标体系是企业用数据指导业务经营决策的第一步。但是做完指标之后,对指标的监控,经常被大家忽视。当指标发生了异常波动(上升或下降),需要企业能够及时发现,并快速找到背后真实的原因,才能针对性地制定相应策略,否则就是盲打,原地打转。

指标异常波动的具体场景,比如:

· 企业关键词的搜索流量突然降低了,是什么原因?

· 3月的GMV数字比2月下降了40%,应该如何分析?

· 最近某个品类的订单数猛增,为什么?

那么,本文将详细介绍如何建立完善的指标异常监控及其对应归因分析机制,让大家今后在遇到此类问题时,能够快速从数据中发现业务问题与机会,提升业务推进速度。

基于统计分析检测指标异常

企业的日常数据走势会在一定范围内上下浮动,但不同的指标其浮动范围会有差异。当业务在高速增长期,指标每日波动幅度较大;业务在平稳期,指标每日波动幅度则较小;统计粒度越粗,数据量越大,统计结果的波动性也越小。因此,对于不同的指标需要用不同的标准去衡量指标波动是否存在异常。

指标异常监控方法主要有三种:

· 基于实际业务经验进行阈值设置

· 基于数据结果进行统计分析

· 融入算法进行建模预测

本文将主要介绍如何基于统计分析方法来评估指标波动是否异常。

统计学中,指标的数据分布通常满足正态分布。正态分布具有对称性,会用到均值、标准差两个数据。其中均值可以反应数据的平均水平,标准差可以反应数据波动幅度,标准差越大, 反映出数据波动性越大。标准差的计算公式如下:

file

利用数据在正态分布中的位置可以判断指标波动是否符合预期。在正态分布中,数据分布在2倍标准差内的概率是95.5%,在3倍标准差的概率内是99.7%。日常可以使用2倍标准差作为衡量标准。

正常数据结果会在 均值±2* 标准差范围内浮动,若实际数据超出了这个范围,则认为本次数据波动异常。

日常数据波动规律会以日、周、月、年为单位出现相同或相似的变化规律,此处以日活指标为例,来说明指标异常波动的监测过程。

某游戏类APP日活指标通常以周为单位进行数据波动,现计划基于过去五周的数据走势来判断本周一的日活数据是否出现异常波动。

数据准备如下:

file

上述数据的前五周周一的均值:10900,标准差:1507,数据的2倍标准差分别为7887、13913,本周周一数据为7700,在2倍标准差范围外,则说明本周一日活指标数据波动异常,需要进一步分析异常波动原因,以判断业务是否真正存在异常。

指标异动归因分析

指标异动归因方法有很多,总结起来可以分为两大类:横向归因分析和纵向归因分析。

横向归因分析

横向归因分析,指的是对于组合型的指标可以对过程指标做拆分,分析每个过程指标的波动影响因素,再对多个影响因素做整合分析。

如:昨日的付费金额显著增高。分析增高原因时,先对付费金额做工时拆解:付费金额 = 日活 * 平均付费金额,平均付费金额在正常范围内波动,日活显著增加,进一步对相关业务做分析,发现是昨日买量增加带来的结果影响。

纵向归因分析

纵向归因分析,即对指标通过维度下钻进行归因分析。维度下钻分析主要包括两个分析粒度:一是分析各维度对指标的贡献程度,二是分析维度值对指标的贡献程度。

维度的贡献程度计算可基于每个维度值的贡献程度汇总得出,而每个维度值的贡献程度计算有多种计算方式,贡献程度的计算可以基于预测算法等多种方法进行。本文介绍一个简单的基于增长率平均值计算贡献程度的方法。

单一维度下,每个维度值贡献程度可通过下列公式计算:

file

下面,以销售额为例,介绍一下计算过程。

某产品线1月1日和1月2日销售额分别为3097万元、3300万元。细分到城市维度,每个城市两天的数据表现如下:

file

城市维度中:

file

基于上述步骤即可简单地实现维度贡献度及维度值贡献度的计算。

智能指标波动监测&智能归因分析

在实际的数据场景中,每个维度下维度值的数量少说几十上百个,多则成千上万个,每天纯手动计算维度贡献程度将是一个巨大的工作量。分析效率过于低下,导致业务方很容易根据经验进行结论推断,如果推断错误,将很有可能产生错误决策。

袋鼠云指标平台的智能指标波动监测与智能归因分析功能可以快速、全面的帮助用户追踪业务表现,从而进一步推动业务发展。

指标看板查看

对于企业关注的指标,可以将指标添加到关注看板中进行日常数据观察与监控。在看板中可直观查看所有指标的当前数据表现、近期数据走势。系统会根据当前数据做智能诊断,判断指标波动是否为正常波动,帮助用户快速定位异常数据,针对性分析与应对数据变化。

file

指标归因分析

当一个指标结果出现异常时,如果依次对维度、维度值进行归因分析是一件工作量很大的事情。能够将分析方法、分析过程系统化,会大大提升归因分析效率,对业务发展形成极为正向的促进作用。

file

对执行指标归因分析时,系统会区分维度值计算指标波动情况,进一步计算出维度贡献度,并根据贡献度大小进行降序排序,让用户聚焦于头部更重要的影响因素。

在关注的维度下,用户可以进一步查看细分维度值的贡献度,快速发现数据变化原因,通过数据推动业务提升。

点击下方链接可免费试用【指标管理平台】: https://www.dtstack.com/easydigit/dataindex?src=szsm

《行业指标体系白皮书》下载地址:https://www.dtstack.com/resources/1057?src=szsm

《数栈产品白皮书》下载地址:https://www.dtstack.com/resources/1004?src=szsm

《数据治理行业实践白皮书》下载地址:https://www.dtstack.com/resources/1001?src=szsm

想了解或咨询更多有关大数据产品、行业解决方案、客户案例的朋友,浏览袋鼠云官网:https://www.dtstack.com/?src=szcsdn

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/496632.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Xcode删除原本的Git,再添加新的git

本文参考:Xcode怎么删除原本git,在重新设置新的git地址_ios xcode 删除原本git-CSDN博客 开发中会有一个问题。Xcode项目A 提交到Git服务器server1,此时项目A内部已经存在一个Git文件,与server1相关联。 此时你想将项目A提交到 另一个Git…

算法打卡day30|贪心算法篇04|Leetcode 860.柠檬水找零、406.根据身高重建队列、452. 用最少数量的箭引爆气球

算法题 Leetcode 860.柠檬水找零 题目链接:860.柠檬水找零 大佬视频讲解:柠檬水找零视频讲解 个人思路 5元最通用,然后是10元,所以如果是对于20元找零直接先找10元,也涉及到贪心的思想,可以用贪心算法。 解法 贪心法…

加密流量分类torch实践5:TrafficClassificationPandemonium项目更新3

加密流量分类torch实践5:TrafficClassificationPandemonium项目更新3 更新日志 代码已经推送开源至露露云的github,如果能帮助你,就给鼠鼠点一个star吧!!! 我的CSDN博客 我的Github Page博客 3/23日更新…

打造核心竞争力:高效Web系统数据中台的设计与实践_光点科技

在数字化的浪潮中,数据已经成为企业赖以生存和发展的核心资源。一个高效的Web系统数据中台,能够赋予企业在激烈的市场竞争中立于不败之地的能力。本文将深入探讨如何设计和实施一个能够提升企业数据管理水平和支持业务决策的高效数据中台架构。 数据中台…

基于Python实现多功能翻译助手(下)

为了将上述步骤中的功能增强与扩展具体化为代码,我们将实现翻译历史记录功能、翻译选项配置以及UI的改进。 翻译历史记录功能 import json # 假设有一个用于存储历史记录的json文件 HISTORY_FILE translation_history.json # 初始化历史记录列表 translati…

数组---

1、数组的定义 Java中,数组存储固定大小的同类型元素。 数组是多个相同类型数据按一定顺序排列的集合,并使用一个名字命名,通过编号的方式对这些数据进行统一的管理。 数组的特点: 数组本身是引用数据类型,但数组中的…

Spring使用(一)注解

Spring使用 资源 Spring 框架内部使用 Resource 接口作为所有资源的抽象和访问接口,在上一篇文章的示例代码中的配置文件是通过ClassPathResource 进行封装的,ClassPathResource 是 Resource 的一个特定类型的实现,代表的是位于 classpath …

vue3+Pinia的使用 - 封装

目录: persist.ts 可存储到本地 import { PersistedStateOptions } from "pinia-plugin-persistedstate";/*** description pinia 持久化参数配置* param {String} key 存储到持久化的 name* param {Array} paths 需要持久化的 state name* return per…

基于Transformer的医学图像分类研究

医学图像分类目前面临的挑战 医学图像分类需要研究人员同时具备医学图像分析和数字图像的知识背景。由于图像尺度、数据格式和数据类别分布的影响,现有的模型方法,如传统的机器学习的识别方法和基于深度卷积神经网络的方法,取得的识别准确度…

2024第六届环境科学与可再生能源国际会议能源 (ESRE 2024) 即将召开!

2024第六届环境科学与可再生能源国际会议 能源 (ESRE 2024) 即将举行 2024 年 6 月 28 日至 30 日在德国法兰克福举行。ESRE 2024 年 旨在为研究人员、从业人员和专业人士提供一个论坛 从工业界、学术界和政府到研究和 发展,环境科学领域的专…

Kubernetes 知识体系 系列一

多年前,大多数软件应用程序都是大型的单体,要么作为单个进程运行,要么作为少数服务器上的少量进程运行。这种过时的系统一直延续很久。 它们的发布周期较慢,更新相对较少。 在每个发布周期结束时,开发人员将整个系统…

算法第三十四天-有效数独

有效数独 题目要求 解题思路 一个简单的方法是,遍历9*9书读三次,以确保: 行中没有重复的数字列中没有重复的数字3*3子数独中没有重复的数字 但是,实际上,所有的一切都以可以在一次迭代中完成 可以使用box_index (r…

网约车APP小程序源码代驾顺风拼车货运司乘端安卓苹果源码可二开

内容目录 一、详细介绍二、效果展示1.部分代码2.效果图展示 一、详细介绍 系统是基于Thinkphpuniapp开发的,全开源未加密,这套源码可以拿回去自己做二开 后台用户端司机端 功能详情介绍: 车主实名认证,驾驶证认证,车…

Python列表、元组、字典及集合

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 一、列表定义方式: 二、元组1、定义方式:2、元组中的物理存储地址不可修改,如果修改则会报错,但是元组中的列表、字典项等却可以…

代码随想录算法训练营第三十七天 | 738. 单调递增的数字、968. 监控二叉树

代码随想录算法训练营第三十七天 | 738. 单调递增的数字、968. 监控二叉树(待刷) 738. 单调递增的数字题目解法 968. 监控二叉树(待刷) 738. 单调递增的数字 题目 解法 class Solution { public:int monotoneIncreasingDigits(in…

File和IO流

1. File类常用方法 1.1 获取基本属性 • public String getName() :获取名称 • public String getPath() :获取路径 • public String getAbsolutePath():获取绝对路径 • public File getAbsoluteFile():获取绝对路径表示…

嵌入式培训3-28

编写一条学生链表&#xff0c;写一些能够像链表里边添加数据的函数 实现&#xff1a;将链表中的所有内容保存到文件中去 以及 读取文件中的所有内容&#xff0c;加载到链表里面 #include <stdio.h> #include <string.h> #include <stdlib.h> #include <ma…

AD学习笔记

1. EOS 选择中心点 2. PDL 标记距离 3. 选择线框&#xff0c;按DSD重新定义板框 4. su框选&#xff0c;sl线选 5. mx x/y轴移动 6. dk 打开层叠管理器 7. shifts单层显示 8. 单端引脚不报错&#xff0c;CO工程选项下关闭报错即可。 9. PCB界面中寻找元件&#xff1a;…

蓝桥杯 - 小明的背包3(多重背包)

解题思路&#xff1a; 动态规划 多重背包问题需要在01背包问题&#xff08;不重复&#xff09;的基础上多加一层循环进行遍历&#xff0c;并且dp[ j ]的式子也需要修改 import java.util.Scanner;public class Main {public static void main(String[] args) {Scanner scan …

【JavaSE】网络编程

定义&#xff1a;在网络通信协议下&#xff0c;不同计算机上运行的程序&#xff0c;进行的数据传输 常见的软件架构&#xff1a; C/S&#xff1a;Client/Server&#xff08;客户端/服务器&#xff09; 在用户本地需要下载并安装客户端程序 画面可以很精美&#xff0c;用户体…