Clickhouse中物化视图和位图和索引的用法

目录

  • 聚合函数
  • 表引擎AggregatingMergeTree
  • 物化视图
  • 位图
  • Clickhouse实现数据的有限更新
  • 索引

聚合函数

例如 max(val) , argMax(arg,val)
如果在聚合函数后面加入后缀if,则是
maxIf(val,UInt8)
argMaxIf(arg,val,UInt8)
也就是当满足某个条件时候,才会对这一行数据进行函数处理。
例如:
字段:is_deleted AggregateFunction(argMaxIf, Int32, Int64, UInt8)
该字段插入数据:

insert into table A
slect 
argMaxIfState(is_deleted, event_behavior_timestamp, isNotNull(is_deleted)) AS is_deleted
from B

表引擎AggregatingMergeTree

该引擎继承自MergeTree,改变了数据部分合并的逻辑。ClickHouse将所有具有相同主键的行替换为存储聚合函数状态组合的单行。
您可以使用AggregatingMergeTree表进行增量数据聚合,包括聚合的物化视图。
使用该引擎的表中,除了主键外其余使用 AggregateFunction、SimpleAggregateFunction数据类型

AggregateFunction 是数据类型,第一个参数是使用的聚合函数名称,后面多个参数是聚合函数传入参数的类型。如果加入if后缀,则多出一个参数类型UInt8

聚合函数可以具有实现定义的中间状态,该状态可以序列化为AggregateFunction(…)数据类型,并通常通过物化视图存储在表中。生成聚合函数状态的常用方法是调用带有-State后缀的聚合函数。要在将来获得聚合的最终结果,必须使用带- mergessuffix的相同聚合函数。

CREATE TABLE test.agg_visits (
    StartDate DateTime64 NOT NULL,
    CounterID UInt64,
    Visits AggregateFunction(sum, Nullable(Int32)),
    Users AggregateFunction(uniq, Nullable(Int32))
)
ENGINE = AggregatingMergeTree() ORDER BY (StartDate, CounterID);

向表agg_visits 插入数据,根据group by进行聚合,聚合表存储聚合函数列的状态值,需要在对应的聚合函数上加入后缀State,例如sumState

insert into table test.agg_visits
SELECT
    StartDate,
    CounterID,
    sumState(Sign) AS Visits,
    uniqState(UserID) AS Users
FROM test.visits
GROUP BY StartDate, CounterID;

查看 test.agg_visits表数据,对应的聚合数据要儒后缀 Merge,例如sumMerge

SELECT
    StartDate,
    sumMerge(Visits) AS Visits,
    uniqMerge(Users) AS Users
FROM test.agg_visits
GROUP BY StartDate
ORDER BY StartDate;
-- 因为存储的是聚合函数的中间状态,所以不加group by的时候,是全局聚合。当插入数据的时候,存储的是以StartDate, CounterID分组下聚合函数的状态值,在查询的时候使用group by StartDate,则会对聚合函数状态下的值进行按照StartDate分组进行聚合函数。
-- 如果查询时使用group by StartDate,CounterID,aa 那么查出的时候也是按照StartDate,CounterID分组的,而不是StartDate,CounterID,aa。
-- 因为聚合表在建表的时候已经决定了存储主键相同下的聚合函数的中间状态值
SELECT
    
    sumMerge(Visits) AS Visits,
    uniqMerge(Users) AS Users
FROM test.agg_visits

物化视图

创建物化视图,物化视图和普通视图区别是,物化视图是存储数据得,并且可以动态得监听底表数据变化,并将变化得数据写入物化视图中。而普通视图是不存储数据的

CREATE MATERIALIZED VIEW test.visits_mv TO test.agg_visits
AS SELECT
    StartDate,
    CounterID,
    sumState(Sign) AS Visits,
    uniqState(UserID) AS Users
FROM test.visits
GROUP BY StartDate, CounterID;

视图visits_mv 是基于表agg_visits之上建立的,并将数据插入agg_visits和视图visits_mv。
底表是visits,当底表数据变化时候,agg_visits和visits_mv 会进行自动更新数据。
当直接向agg_visits插入数据,那么当底表visits插入了一条新数据时候,只能手动去更新agg_visits表数据,不能主动识别

生产例子

CREATE MATERIALIZED VIEW app.app_eap_entity_member_de_153578 TO app.app_eap_entity_member_aggregate_de_153578
AS
SELECT
    aliuid_info_final AS aliuid_info,
    aliuid_info_value_timestamp,
    birthday_final AS birthday,
    birthday_value_timestamp,
    cre_date_final AS cre_date,
    cre_date_value_timestamp,
    creator_final AS creator,
    creator_value_timestamp,
    creator_name_final AS creator_name,
    creator_name_value_timestamp,
    creator_store_final AS creator_store,
    creator_store_value_timestamp,
    data_trace_id_final AS data_trace_id,
    data_trace_id_value_timestamp,
    wechat_type_final AS wechat_type,
    wechat_type_value_timestamp,
    dt_final AS dt,
    version_timestamp_final AS version_timestamp,
    version,
    is_deleted_final AS is_deleted
FROM 
(
    SELECT
        argMaxIfState(event_behavior_timestamp, event_behavior_timestamp, isNotNull(aliuid_info)) AS aliuid_info_value_timestamp,
        argMaxIfState(aliuid_info, event_behavior_timestamp, isNotNull(aliuid_info)) AS aliuid_info_final,
        
     
        argMaxIfState(event_behavior_timestamp, event_behavior_timestamp, isNotNull(manager_name)) AS manager_name_value_timestamp,
        argMaxIfState(manager_name, event_behavior_timestamp, isNotNull(manager_name)) AS manager_name_final,
        
        argMaxIfState(event_behavior_timestamp, event_behavior_timestamp, isNotNull(member_creator)) AS member_creator_value_timestamp,
        argMaxIfState(member_creator, event_behavior_timestamp, isNotNull(member_creator)) AS member_creator_final,
        
        pguid AS pguid,
        
        argMaxIfState(event_behavior_timestamp, event_behavior_timestamp, isNotNull(wechat_type)) AS wechat_type_value_timestamp,
        argMaxIfState(wechat_type, event_behavior_timestamp, isNotNull(wechat_type)) AS wechat_type_final,
        argMaxIfState(dt, event_behavior_timestamp, isNotNull(dt)) AS dt_final,
        argMaxIfState(version_timestamp, event_behavior_timestamp, isNotNull(version_timestamp)) AS version_timestamp_final,
        maxState(event_behavior_timestamp) AS version,
        argMaxIfState(is_deleted, event_behavior_timestamp, isNotNull(is_deleted)) AS is_deleted_final
    FROM app.app_eap_entity_member_log_de_153578
    GROUP BY pguid
)

CREATE TABLE app.app_eap_entity_member_aggregate_de_153578
(
    `aliuid_info` AggregateFunction(argMaxIf, Nullable(String), Int64, UInt8),
    `aliuid_info_value_timestamp` AggregateFunction(argMaxIf, Int64, Int64, UInt8),
    `birthday` AggregateFunction(argMaxIf, Nullable(String), Int64, UInt8),
    `pguid` Int64,
    `wechat_type` AggregateFunction(argMaxIf, Nullable(Int32), Int64, UInt8),
    `wechat_type_value_timestamp` AggregateFunction(argMaxIf, Int64, Int64, UInt8),
    `dt` AggregateFunction(argMaxIf, String, Int64, UInt8),
    `version_timestamp` AggregateFunction(argMaxIf, Int64, Int64, UInt8),
    `version` AggregateFunction(max, Int64),
    `is_deleted` AggregateFunction(argMaxIf, Int32, Int64, UInt8)
)
ENGINE = ReplicatedAggregatingMergeTree('/clickhouse/tables/{shard}/app/app_eap_entity_member_aggregate_de_153578', '{replica}')
PARTITION BY xxHash64(pguid) % 10
ORDER BY pguid
SETTINGS index_granularity = 8192, only_allow_select_statement = 0
CREATE TABLE app.app_eap_entity_member_log_de_153578
(
    `event_data_id` String,
    `aliuid_info` Nullable(String),
    `birthday` Nullable(String),
    `cre_date` Nullable(Int64),
    `creator` Nullable(String),
    `creator_name` Nullable(String),
    `pguid` Int64,
    `takeover_time` Nullable(Int64),
    `version_timestamp` Int64,
    `is_deleted` Int32 DEFAULT 0,
    `dt` String
)
ENGINE = ReplicatedMergeTree('/clickhouse/tables/{shard}/app/app_eap_entity_member_log_de_153578', '{replica}')
PARTITION BY (tenant_channel, substring(dt, 1, 4))
ORDER BY (event_behavior_id, event_data_id)
SETTINGS index_granularity = 8192, only_allow_select_statement = 0

位图

https://blog.csdn.net/weixin_39025362/article/details/110390251

Clickhouse实现数据的有限更新

https://www.modb.pro/db/61195

select
        arrayJoin(bitmapToArray(groupBitmapAndState(pguid))) as pguid,
        'user_tag_huiyuan',
        'L0',
        '${start_date2}',
        'all',
        'all'
    from (
           select  bitmapBuild(groupArray(toUInt64(pguid))) as pguid
           from(
                   select pguid from app.app_eap_entity_member_aggregate_de
                   group by pguid
                   having argMaxIfMerge(user_status) in (  0  )
                      and argMaxIfMerge(is_deleted) =  0
               )
        )

索引

京东零售解决方案

既然有了ES,为何还用ClickHouse——从原理万字总结ClickHouse为何这么快

Clickhouse 索引原理

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/603198.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Xinstall助力推广结算统计,让数据一目了然

在当今数字化营销的时代,推广活动的成功与否往往取决于精准的数据统计和分析。然而,对于许多广告主和开发者来说,推广结算统计却是一个令人头疼的问题。数据分散、渠道繁多、统计口径不一,这些问题都给推广效果的衡量带来了极大的…

Unity图文混排EmojiText的使用方式和注意事项

​​​​​​​ 效果演示: 使用方式: 1、导入表情 2、设置图片格式 3、生成表情图集 4、创建/修改目标材质球 5、测试 修复换行问题 修复前: 修复后: 修复代码: 组件扩展 1、右键扩展 2、组件归类&#…

LINUX 入门 4

LINUX 入门 4 day6 7 20240429 20240504 耗时:240min 课程链接地址 第4章 LINUX环境编程——实现线程池 C基础 第3节 #define里面的行不能乱空行,要换行就打\ typedef 是 C 和 C 中的一个关键字,用于为已有的数据类型定义一个新的名字。…

新书速览|图神经网络基础、模型与应用实战

掌握PyTorch图神经网络基础与模型,实战自然语言处理、计算机视觉、推荐系统、社交网络应用开发 01 本书内容 图神经网络不仅能够解决传统机器学习方法无法解决的图数据问题,而且能够应用于许多实际场景,例如社交网络、药物发现、网络安全、…

新手向的s2-046漏洞复现

一、前期准备 1.docker容器 作为第一次接触struts2漏洞类型的小白,第一步从搭建环境开始。首先我们需要准备一个服务器或者本地系统,我这里是使用本地的kali,kali里面需要有docker容器,docker容器的安装教程请自行搜索&#xff0c…

女性名字有孤寡数,易离婚

丁老师:您好!我孩子(女孩)准备取名:周小程,宝宝出生于阳历2016年8月13号16时30分左右,准备给孩子取个名字,在网上查询了哈,这个名字的分数还蛮高的,99分&…

韦东山嵌入式Liunx驱动大全二

文章目录 一、LCD1-1 不同接口的LCD硬件操作原理1-2 LCD驱动程序框架1-3 结合APP分析LCD驱动程序框架1-4 LCD硬件时序图1-5 分析内核自带的LCD驱动程序1-6 编程LCD驱动程序框架_使用设备树1-7 LCD驱动程序框架_引脚配置1-8 LCD驱动程序框架_时钟配置1-9 LCD驱动程序框架_LCD控制…

1069 微博转发抽奖

solution #include<iostream> #include<string> #include<map> using namespace std; int main(){int n, m, s, loop 0, have 0;string id;map<string, int> mp;cin >> m >> n >> s;for(int i 1; i < m; i){//编号从1开始cin…

专题五_位运算(3)

目录 137. 只出现一次的数字 II 解析 题解 面试题 17.19. 消失的两个数字 解析 题解 137. 只出现一次的数字 II 137. 只出现一次的数字 II - 力扣&#xff08;LeetCode&#xff09; 解析 注意这里指的是比特位上的01来进行统计的 题解 class Solution { public:int sin…

Unity与C#的关系

第一&#xff0c;我们首先需要知道Unity与C#的关系是什么&#xff1f; 第二&#xff0c;我们要明白为什么Unity会使用C#&#xff0c;而不是C&#xff1f; 第三&#xff0c;我们需要知道Unity是怎么使用C#的&#xff1f; 第一点&#xff1a; 先说结论&#xff1a;C#是Unity用…

windows如何安装python框架

windows如何安装Python框架&#xff1f;以安装Django框架为例&#xff0c;具体如下&#xff1a; 在idea上运行Python项目时&#xff0c;出现了如下错误&#xff0c;这是因为系统中只安装了Python&#xff0c;没有安装Django。 既然报错的原因就是缺少Django&#xff0c;那我们…

深度解析 Spring 源码:揭秘 AbstractAutowireCapableBeanFactory 的 Bean 生命周期处理

文章目录 一、AbstractAutowireCapableBeanFactory 概述1.1 详细分析1.2 设计思想 二、深入解析AbstractAutowireCapableBeanFactory 的实现细节2.1 Bean 实例化过程分析2.1.1 createBean()2.1.2 createBeanInstance() 2.2 Bean 属性注入的实现机制2.2.1 populateBean()2.2.2 a…

560. 和为 K 的子数组 974. 和可被 K 整除的子数组 【前缀和】

题目链接 ​​​​​​​974. 和可被 K 整除的子数组 560. 和为 K 的子数组 今天刷题的时候&#xff0c;刷了这两题&#xff0c;感觉挺有意思的。代码写起来挺简单的&#xff0c;但是思路和其中的细节以及涉及到的知识点确实让我挺意外的。这里写个博客解析一波&#xff0c;也是…

Charles抓包工具

Charles是一个HTTP代理工具&#xff0c;使开发人员能够查看客服端和服务器之间的所有HTTP/ HTTPS/SSL网络请求。 Charles是在PC环境下常用的网络抓包截取工具&#xff0c;在做移动开发时&#xff0c;我们为了调试客户端与服务端的网络通讯协议&#xff0c;常常需要截取网络请求…

MCP3008-I/SL 模数转换器ADC SPI接口 模拟信号采集

MCP3008-I/SL 模数转换器ADC 贴片SOIC16 MCP3008-I/SL 是一款模数转换器&#xff08;ADC&#xff09;&#xff0c;属于 SAR&#xff08;逐次逼近寄存器&#xff09;架构的 ADC。它具有以下特点&#xff1a; 8 通道单 ADC 最大采样率&#xff1a;200ksps&#xff08;千样点每秒…

鸿蒙内核源码分析(编译环境篇) | 编译鸿蒙防掉坑指南

几点说明 kernel_liteos_a_note | 中文注解鸿蒙内核 是在 OpenHarmony 的 kernel_liteos_a 基础上给内核源码加上中文注解的版本.与官方源码按月保持同步,同步历史如下: 2021/10/09 – 增加性能优化模块perf,优化了文件映射模块2021/09/14 – common,extended等几个目录结构和M…

文献速递:深度学习医学影像心脏疾病检测与诊断--基于深度学习的低剂量SPECT心肌灌注图像去噪:定量评估与临床表现

Title 题目 Deep learning–based denoising of low‑dose SPECT myocardialperfusion images: quantitative assessment and clinical performance 基于深度学习的低剂量SPECT心肌灌注图像去噪&#xff1a;定量评估与临床表现 01 文献速递介绍 单光子发射计算机断层扫描&a…

uniapp + vue3 设置 axios proxy 代理,并重写路径

uniapp vue2 设置代理如下&#xff1a; 已生成的项目架构里面找到manifest.json文件&#xff0c;通过源码视图的方式打开文件&#xff0c;在文件中添加一下代码即可完成代理&#xff1a; "h5": {"devServer": {"disableHostCheck": true, //禁…

基于StatefulSet控制器在Kubernetes上部署MySQL一主多从

一、前提--StatefuSet特性 1.1 有状态的节点控制器 -- StatefulSet 及其网络状态 容器的解决方案是针对无状态应用场景的最佳实践&#xff0c;但对于有状态应用来说&#xff0c;就并非如此了。Kubernetes 用 StatefulSet 解决了有状态应用编排的问题&#xff0c;本文我们就来…

GitHub介绍,GitHub如何订阅充值?

一、GitHub介绍 GitHub是一个面向开源及私有软件项目的托管平台&#xff0c;因为只支持git 作为唯一的版本库格式进行托管&#xff0c;故名Github。 GitHub于2008年4月10日正式上线&#xff0c;除了git代码仓库托管及基本的Web管理界面以外&#xff0c;还提供了订阅、讨论组、…
最新文章