数据建模及可视化解决方案

一、需求背景

1. 数据量的爆炸性增长:随着互联网和物联网技术的发展,我们正处于一个数据爆炸的时代。企业和组织需要有效地管理和利用这些海量数据,而数据建模平台可以帮助他们实现这一目标。

2. 数据多样性和复杂性:数据来源的多样化和复杂性使得数据管理和分析变得更加困难。数据建模平台可以提供一套统一的工具和方法,帮助企业应对这些挑战。

3. 数据驱动决策的需求:在竞争激烈的市场环境中,企业需要基于数据做出决策。数据建模平台可以帮助企业提取有价值的信息,支持数据驱动的决策过程。

4. 数据安全和隐私保护:数据安全和隐私保护是企业面临的重要问题。数据建模平台需要考虑到这些因素,提供安全的数据处理和分析功能。

5. 人工智能和机器学习的发展:人工智能和机器学习技术的发展为数据建模提供了新的可能性。数据建模平台需要整合这些新技术,提供更强大的数据分析功能。

6、数据建模的应用非常广泛,包括金融、医疗、零售、交通、教育、科研等多个领域。例如,在金融领域,数据建模可以用于信用评分、股票价格预测等;在医疗领域,数据建模可以用于疾病诊断、药物研发等;在零售领域,数据建模可以用于销售预测、库存管理、客户细分等。

二、产品简介

数合建模是数据建模及可视化平台,提供一站式全链路数据生命周期管理方案,能够帮助用户管理数据资产并挖掘价值。数合建模提供多源异构的数据采集模块、支持实时/离线计算框架,简洁易用的操作环境和平台接口,为政府机构、企业、科研机构、第三方软件服务商等客户,提供大数据管理、开发和计算的能力。让客户最大化的发现与分析行业内部核心业务数据价值,挖掘现有业务和应用系统的潜在商机,培育完好的业务创新产业链,实现数据应用的完整闭环,帮助客户实现价值。

三、我们的方案

(一)产品亮点

易用性方面:通过可视化拖拽数据、算子图标的方式,就可以完成业务模型设计和数据分析工作,降低了技术门槛,大大提升了工作效率。

产品定位方面:既可以作为数据工程师降低门槛的数据建模平台,也可以作为业务人员进行数据分析的业务建模平台。产品的设计初衷即是去技术属性,让大多数的业务人员都能用起来。

性能方面:实时碰撞秒级响应。

后端适配方面:平台后端支持对接各类主流数据库,以及华为大数据平台。

数据接入及推送方面:适配多种类型数据库的数据抽取和数据推送。

权限方面:支持多用户,并分级权限管理,对原始数据、成果数据、算法模型和微应用提供分类管控。

数据挖掘业务方面:支持海量数据挖掘分析碰撞,支持9种主流智能分析算法。

AI大模型与BI结合的探索:通过输入文本,组织后台数据,生成指标查询结果集。

图谱应用方面:支持自定义实体、关系,建立知识体系并能挖掘知识的隐含关系,服务具体应用场景。

可视化图表设计方面:通过拖拽图表模版,设置数据来源,两步生成可视化图表。

(二)产品技术架构

1、基础支撑层:指围绕平台运行的软硬件环境,虚拟化环境,分布式大数据平台环境,数据库环境等等。

2、数据计算层:包括离线计算、实时计算、流计算、图计算等。

3、数据管理层:包括数据源管理、接入方式探查、数据接入、数据标准化、任务中心、数据目录、服务目录7部分内容,其中:

数据源管理提供数据源配置管理等功能;

接入方式探查对各来源的数据进行探查,包括:数据源、 业务信息、更新策略、字段信息以及质量信息;

数据接入,结合数据实际情况定制数据接入策略和标准。系统对元数据信息进行自动采集;

数据标准化,将数据与标准规范比对,标准化处理接入的数据。根据标准制定数据清洗、格式转换策略;

任务中心,数据接入、标准化任务管理中心,包括任务规则的查看、任务的启停、任务立即执行、规则修改等功能;

数据目录,提供数据接入、标准化资源的查看、检索功能

服务目录,提供服务目录的注册、数据资源申请审批、服务测试等功能

4、数据分析层包括目录管理、模型管理、算子管理、图谱管理、可视化建模五部分。其中:

目录管理,提供模型、标签、组件、看板目录管理功能;

模型管理,提供模型搜索、新建模型、编辑模型、删除模型、共享模型、共享标签、设为任务等功能;

算子管理,提供数据处理算子、智能算子、业务算子(数据标签)等功能;

图谱管理,提供实体管理、关系管理、关系入图等功能;

可视化建模,提供数据关联、筛选、并集、差集、交集、分组等可视化建模编辑工具,用户可依据建模需求进行灵活组合、构建模型。

5、数据服务层:包括应用超市、微应用服务和可视化图表。其中:

数据应用超市,提供数据模型的展示与分享。

微应用服务,提供应用模块化功能,将模型结果以API接口形式封装,提供给上层应用平台

可视化图表,提供图形化软件,可自由拖拽生成可视化面板,并进行数据展示等。支持可视化大屏发布。

(三)产品定位

1、单纯作为数据建模平台

以上示意图,描述了在一个项目中建模平台和上、下游的关系。

上游由ETL厂商将业务系统数据抽取/同步到大数据平台的接入层。
 数据建模环节的内容主要包括数据配置,数据建模、任务管理三部分。通过系统初始化工作将接入层数据库配置到数据建模平台;利用接入层数据及各类算子构建汇总模型、指标模型、风险模型等各类模型;并通过任务配置,定期生成各类模型结果,自动封装JSON格式的API接口服务。

应用厂商对接基于数据模型结果的API接口服务,进行上层应用的展现。

2、同时承担数据治理和数据建模的角色

以上示意图,描述了在一个项目中建模平台和上、下游的关系。

上游为源数据库,存储业务系统数据。建模平台同时承担数据治理和数据建模的角色。

先由数据管理平台按一定策略将数据抽到接入层,再基于标准化要求,及本地的知识库,以及数据的清洗规则和格转要求定义标准化规则,完成从接入层到标准层的计算,通过任务中心来管理和监控任务运行情况。
    数据建模环节的内容主要包括数据配置,数据建模、任务管理三部分。通过系统初始化工作将标准层数据库配置到数据建模平台;利用接入层数据及各类算子构建汇总模型、指标模型、风险模型等各类模型;并通过任务配置,定期生成各类模型结果,自动封装JSON格式的API接口服务。

应用厂商对接基于数据模型结果的API接口服务,进行上层应用的展现。

总结:建模平台既可以承担从数据治理、到建模、到应用展示全数据生命周期的角色,也可以承担单一角色,但无疑建模能力是建模平台的核心。建模平台标配的数据管理平台在数据标准化上起重要作用,能够大大提升后续建模的效率。

(四)产品功能架构

数合建模主要由数据管理、目录管理、模型管理、图谱管理、可视化图表管理、系统管理和配置管理7部分组成。具体如图所示:

(五)产品功能清单

序号

产品名称

一级目录

二级目录

三级目录

功能描述

是否必选

1

数合建模

数据管理

数据标准

数据元管理

标准数据元、自有数据元查询,体现数据包含哪些不重复的数据项

2

限定词管理

标准限定词、自有限定词查询,修饰数据元

3

字典管理

字典知识库,体现系统有多少个可转换的字典表

4

数据治理

接入方式探查

支持mysql\oracle\postgres\gaussdb等数据库,源端数据结构采集

5

数据接入

stg层数据抽取策略及表结构配置

6

数据标准化

ods层数据抽取策略、表结构、以及元数据库、字典、清洗规则等标准化元素配置等功能

7

任务中心

支持批量任务开始、停止,支持单个任务列表查询、任务规则查询、开始、停止,支持单个任务规则查询,支持单个任务规则修改、结构修改,支持立即执行单个任务、并查看运行进度

8

数据资产

数据资源目录

包括数据清单查询、数据项查询等功能

9

数据报表

数据更新情况查询

10

数据开放

<

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/356172.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

基于 GPU 渲染的高性能空间包围计算

空间包围检测在计算机图形学、虚拟仿真、工业生产等有着广泛的应用。 现代煤矿开采过程中&#xff0c;安全一直是最大的挑战之一。地质空间中存在诸多如瓦斯积聚、地质构造异常、水文条件不利等隐蔽致灾因素&#xff0c;一旦被触发&#xff0c;可能引发灾难性的后果。因此在安…

架构整洁之道-组件构建原则

5 组件构建原则 大型软件系统的架构过程与建筑物修建很类似&#xff0c;都是由一个个小组件组成的。所以&#xff0c;如果说SOLID原则是用于指导我们如何将砖块砌成墙与房间的&#xff0c;那么组件构建原则就是用来指导我们如何将这些房间组合成房子的。 5.1 组件 组件是软件的…

漏洞原理SQL注入 手工注入漏洞

漏洞原理SQL注入 手工注入漏洞 SQL 注入的前置知识 information_schema库information_schema 是mysql5.0以上版本中自带的一个数据库。tables表information_schema库中的tables表中table_schema列&#xff08;存储数据库名&#xff09;和table_name列&#xff08;存储表名&…

慎投!这3本期刊诚信风险高,被警告和风险低的期刊选哪个?

近年来&#xff0c;学术界对学术诚信的关注越来越多&#xff0c;期刊的学术诚信风险也日益受到关注。科睿唯安在今年三月份剔除的35本SCI期刊中&#xff0c;绝大多数涉及学术诚信问题&#xff01;据官方介绍&#xff0c;其已正式开发了一款AI工具&#xff0c;可以锁定存在学术诚…

R-YOLO

Abstract 提出了一个框架&#xff0c;名为R-YOLO&#xff0c;不需要在恶劣天气下进行注释。考虑到正常天气图像和不利天气图像之间的分布差距&#xff0c;我们的框架由图像翻译网络&#xff08;QTNet&#xff09;和特征校准网络&#xff08;FCNet&#xff09;组成&#xff0c;…

ES 分词器

概述 分词器的主要作用将用户输入的一段文本&#xff0c;按照一定逻辑&#xff0c;分析成多个词语的一种工具 什么是分词器 顾名思义&#xff0c;文本分析就是把全文本转换成一系列单词&#xff08;term/token&#xff09;的过程&#xff0c;也叫分词。在 ES 中&#xff0c;Ana…

部署一个私有化的博客系统

效果 安装 1.创建目录 mkdir /opt/typecho/usr cd /opt/typecho 2.编写配置文件 vim docker-compose.yml 内容如下 version: 3 services:typecho:image: joyqi/typecho:nightly-php7.4-apachecontainer_name: typechorestart: alwaysenvironment:- TYPECHO_SITE_URLhttp:…

大模型应用开发:为产品创建一个AI客服/智能助手

欢迎阅读本系列文章&#xff01;我将带你一起探索如何使用OpenAI API来开发GPT应用。无论你是编程新手还是资深开发者&#xff0c;都能在这里获得灵感和收获。 本文将继续展示AI助手的开发方式&#xff0c;在OpenAPI中它的名字是Assistants。 什么是Assistants&#xff1f; 在之…

《信息系统项目管理师》备考计划

《信息系统项目管理师》证书价值和作用 信息系统项目管理师证书的价值体现在提升专业知识、助力职业发展、职称评定、技能补贴和人才引进或积分落户等方面。 一方面可以通过系统学习&#xff0c;可以显著提高自己在信息系统项目管理领域的专业水平。方便自己以后向更多的方向…

【思科】 GRE VPN 的实验配置

【思科】GRE VPN 的实验配置 前言报文格式 实验需求配置拓扑GRE配置步骤R1基础配置GRE 配置 ISP_R2基础配置 R3基础配置GRE 配置 PCPC1PC2 抓包检查OSPF建立GRE隧道建立 配置文档 前言 VPN &#xff1a;&#xff08;Virtual Private Network&#xff09;&#xff0c;即“虚拟专…

路由进阶

文章目录 1.路由的封装抽离2.声明式导航 - 导航链接3.声明式导航-两个类名自定义匹配的类名 4.声明式导航 - 跳转传参查询参数传参动态路传参两种传参方式的区别动态路由参数可选符 5.Vue路由 - 重定向6.Vue路由 - 4047.Vue路由 - 模式设置8.编程式导航 - 两种路由跳转9.编程式…

AttributeError: ‘Plotter‘ object has no attribute ‘topicture‘

在以下网址找到自己的pytorch和cuda版本然后点击进入&#xff1a; https://nvidia-kaolin.s3.us-east-2.amazonaws.com/index.html 下载自己系统和python对应的最新版本 使用pip安装 pip install kaolin-0.14.0-cp38-cp38-linux_x86_64.whl

如何使用Everything随时随地远程访问本地电脑搜索文件

文章目录 前言1.软件安装完成后&#xff0c;打开Everything2.登录cpolar官网 设置空白数据隧道3.将空白数据隧道与本地Everything软件结合起来总结 前言 要搭建一个在线资料库&#xff0c;我们需要两个软件的支持&#xff0c;分别是cpolar&#xff08;用于搭建内网穿透数据隧道…

力扣日记1.28-【回溯算法篇】93. 复原 IP 地址

力扣日记&#xff1a;【回溯算法篇】93. 复原 IP 地址 日期&#xff1a;2023.1.28 参考&#xff1a;代码随想录、力扣 93. 复原 IP 地址 题目描述 难度&#xff1a;中等 有效 IP 地址 正好由四个整数&#xff08;每个整数位于 0 到 255 之间组成&#xff0c;且不能含有前导 0&…

项目解决方案:市小区高清视频监控平台联网整合设计方案(上)

目 录 一、项目需求 1.1业务需求 1.2技术需求 1.3 环境要求 1.3.1 硬件要求 1.3.2 技术服务要求 二、系统设计方案 2.1 视频监控平台基础功能设计 2.2 视频资源及联网设备编码与管理设计 2.2.1 全省现有联网视频资源属性 2.2.2 视频资源编码具体格…

超值福利,全是独家特制版软件,功能超凡且完全免费

闲话休提&#xff0c;直接为您呈现四款神仙级别的软件。 1、我的ABC软件工具箱 这款小巧而强大的批量处理办公助手——我的ABC软件工具箱&#xff0c;不仅界面清爽、无弹窗广告&#xff0c;更重要的是&#xff0c;它完全免费&#xff01;这款工具箱将成为您高效办公的得力助手…

D8: Type com.huazhuokeji.footballpark.BuildConfig is defined multiple times:

D8: Type com.huazhuokeji.footballpark.BuildConfig is defined multiple times: 报错信息如下分析总结 报错信息如下 E:\unityProject\GVoice\Temp\gradleOut\launcher\build\intermediates\project_dex_archive\release\out\com\huazhuokeji\footballpark\BuildConfig.dex:…

获取鼠标点击图片时候的坐标,以及利用html 中的useMap 和area 实现图片固定位置的点击事件

一 编写原因 应项目要求&#xff0c;需要对图片的固定几个位置分别做一个点击事件&#xff0c;响应不同的操作&#xff0c;如下图&#xff0c;需要点击红色区域&#xff0c;弹出不同的提示框&#xff1a; 二 获取点击图片时候的坐标 1. 说明 实现这以上功能的前提是需要确定需…

Dataloader加载数据集

文章目录 回顾Epoch, Batch-Size, Iterations糖尿病 Dataset 构建数据集实现代码DataLoader使用 糖尿病分类预测代码torchvision.datasets练习 练习 回顾 上节课使用全部数据进行训练。 Epoch, Batch-Size, Iterations epoch:训练的总轮次&#xff0c;指所有的训练样本都进…

高分文献解读|乳酸通过与可溶性腺苷酸环化酶结合调控铁代谢

乳酸(LA)的过量产生可能发生在运动期间或者许多疾病中&#xff0c;例如癌症中。个人伴有高乳酸血症的患者常表现为贫血、血清铁减少以及一种铁代谢关键调控因子—铁调素&#xff08;hepcidin&#xff09;升高。然而&#xff0c;目前尚不清楚乳酸是否以及如何调节铁调素的表达。…
最新文章