图形数据库的实战应用:如何在 Neo4j 中有效管理复杂关系

关系数据库管理系统( RDBMS ) 代表了最先进的技术,这在一定程度上要归功于其由周边技术、工具和广泛的专业技能组成的完善的生态系统。

在这个涵盖信息技术(IT) 和运营技术(OT) 的技术革命时代,人们普遍认识到性能方面出现了重大挑战,特别是在NoSQL 解决方案优于传统方法的特定用例中。事实上,市场提供了许多解释和利用各种不同数据模型的NoSQL DBMS解决方案:

  • 键值存储(例如,最简单的存储,其中对持久数据的访问必须是即时的,并且通过像哈希映射或字典这样的键进行检索);

  • 面向文档(例如,在无服务器解决方案和 lambda 函数架构中广泛采用,其中客户端需要直接从数据库获取结构良好的 DTO);

  • 面向图的(例如,对于知识管理、语义网或社交网络有用);

  • 面向列(例如,在查询驱动的建模方法中提供高度优化的“即用型”数据投影);

  • 时间序列(例如,用于处理物联网场景中的传感器和样本数据);

  • 多模型存储(例如,组合不同类型的数据模型以实现混合功能目的)。

“与那些完全不使用数据的人相比,使用不充分的数据时出现错误要少得多。” 

一个较少被研究的问题是依赖于关系解决方案的软件架构能够灵活地适应软件领域和功能需求快速而频繁的变化。类似敏捷的软件开发方法加剧了这一挑战,这些方法旨在满足客户处理由其业务市场主导的不断出现的需求。

特别是,RDBMS 就其本质而言,当软件需求随着时间的推移而变化时,可能会受到影响,通过引入新的关联表(也替换预先存在的外键)并在 SQL 查询中生成新的 JOIN 子句,对数据库表格模式产生快速影响,从而导致更复杂且更难维护的解决方案。

根据我们的企业经验,我们已经成功实施并试验了基于Neo4j 图形数据库的面向图形的 DBMS 解决方案,以便在具有不同用户和角色的数字社交社区的典型操作环境中减轻需求变更的架构后果。

在这篇文章中,我们:

  • 举例说明面向图形的 DBMS 如何更能满足功能需求;

  • 讨论在经典的N层(分层)架构中采用面向图的DBMS的可行性,提出一些克服主要困难的方法;

  • 强调在各种环境和用例中采用它们的优点和缺点以及威胁。

Neo4j 图形数据库

面向图的数据模型背后的思想是采用原生方法来处理实体(即节点)及其背后的关系(即边),以便通过导航实体之间的关系来查询知识库(即知识 图)。

Neo4j 图形数据库适用 于面向属性图,其中节点和边都拥有不同类型的属性属性。

我们选择它作为 DBMS,主要是为了:

  • 它的“本机”实现是通过数字图元模型具体建模的,其运行时实例由节点(包含具有域属性的实体)和边(表示互连概念之间的可导航关系)组成。这样,关系的遍历时间为O(1);

  • Cypher查询语言被采用为图形中持久知识的非常强大且直观的查询系统。

此外,Neo4j 图形数据库还提供用于对象图形映射(OGM) 的Java 库,可帮助开发人员实现映射、持久化和管理模型实体、节点和关系的自动化过程。实际上,OGM 对于面向图形的 DBMS 的解释与对象关系映射( ORM )模式对于关系持久层的作用相同。

与为 RDBMS 设计的 ORM 模式相比,OGM 模式用于简化数据访问对象( DAO )的实现。它的主要功能是在源代码中正确配置和注释的持久域模型实体中启用半自动细化。

相对于被广泛认为是领先的 ORM 技术的Java Persistence API ( JPA )/Hibernate,Neo4j的 OGM 库以独特的方式运行:

写操作

  • OGM 在托管实体的所有关系中传播持久性更改(从托管对象开始分析整个对象关系树);

  • JPA从托管实体开始逐表执行更新,并基于级联配置处理关系。

读操作

  • OGM通过查询检索一整棵具有固定深度的“关系树”,从指定节点开始,充当“树的根”;

  • JPA允许配置EAGER和LAZY加载方法之间的关系。

示例性案例研究的解决方案优势

为了举例说明我们分析的意义,我们引入一个简单的操作场景:图 1.1 中的 UML 类图描述了一个与实体 Auth(授权的缩写)具有 1 对 N 关系的 User 实体,该实体定义了应用程序内的权限和授权。这种领域模型可以通过类似于表 1.1 和表 1.2 的架构在关系型数据库管理系统(RDBMS)中支持,或者在面向图形的数据库管理系统中,如图 1.2 中的知识图所示。

图 1.1:领域模型的 UML 类图。

USERS TABLE
idfirstNamelastName
.........

表 1.1:在 RDBMS 架构中为 User 实体映射的表格。

AUTHS TABLE

idnameleveluser_fk
............

表 1.2:在 RDBMS 架构中为 Auth 实体映射的表格。

图1.2:与图1.1 的领域模型相关的知识图 。

现在,想象一下,在应用程序的生产生命周期期间出现了一个新的需求:出于管理原因,客户需要将授权限定在特定时间段内(即有效期的开始和结束日期),如图 2.1 所示,将 User 和 Auth 之间的关系转变为 N 对 N。这种领域模型可以通过类似于表 2.1 的架构在关系型数据库管理系统(RDBMS)中支持,或者在面向图形的数据库管理系统中,如图 2.2 中的知识图所示。

图 2.1:在定义新要求后的领域模型 UML 类图。

USERS TABLE

idfirstNamelastName
.........

表 2.1:在 RDBMS 架构中为 User 实体映射的表格。

USERS_AUTHS TABLE

user_fkauth_fkfromuntil
............

表 2.2:在 RDBMS 架构中用于存储 User 和 Auth 实体之间关联的表格。

AUTHS TABLE

idnamelevel
.........

表 2.3:在 RDBMS 架构中为 Auth 实体映射的表格。

图 2.2:与图 2.1 领域模型相关的知识图。

在架构层面上的优势已经很明显:实际上,面向图形的方法没有改变架构,只是在边缘(建模关系)上定义了两个新属性,而 RDBMS 方法则创建了新的关联表 users_auths,替代了 auths 表中引用用户表的外键。

进一步深入分析,我们可以尝试分析 SQL 查询和用 Cypher 查询语言语法编写的查询在这两种方法下的区别:我们想要识别名为“Paul”的用户,他们拥有名为“admin”的 Auth,并且级别大于或等于 3。

一方面,在 SQL 中,所需的查询(分别是第一个查询用于从表 1.1 和表 1.2 检索数据,第二个查询用于表 2.1、表 2.2 和表 2.3)是:

SELECT users.*FROM usersINNER JOIN auths ON users.id = auths.user_fkWHERE users.firstName = 'Paul' AND auths.name = 'admin' AND auths.level >= 3
SELECT users.*FROM usersINNER JOIN users_auths ON users.id = users_auths.user_fkINNER JOIN auths ON auths.id = users_auths.auth_fkWHERE users.firstName = 'Paul' AND auths.name = 'admin' AND auths.level >= 3

另一方面,在Cypher 查询语言中,所需的查询(对于这两种情况) 是:

MATCH (u:User)-[:HAS_AUTH]->(auth:Auth)WHERE u.firstName = 'Paul' AND auth.name = 'admin' AND auth.level >= 3RETURN u

虽然 SQL 查询需要多一个 JOIN 子句,但值得注意的是,在这种特定情况下,不仅用 Cypher 查询语言编写的查询没有额外的子句或 MATCH 路径的变化,而且它也保持不变。后端的“查询系统”上没有必要进行任何更改!

结论 

楔形工程作为国际项目中的技术合作伙伴,设计了一个协作社交平台,作为一个解耦的 Web 应用程序,在 3 层架构中由以下部分组成:

  1. 后端模块,一个分层的 RESTful 架构,利用 JakartaEE 框架; 

  2. 知识图,由 Neo4j 图形数据库提供的 NoSQL; 

  3. 前端模块,一个基于 HTML、CSS 和 JavaScript 的单页应用程序,利用 Angular 框架。 

我们面临的最具挑战性的设计选择是使用原生利用 Cypher 查询语言的驱动程序还是利用 OGM 库简化 DAO 实现:我们发现使用 Cypher 查询语言编写的自定义查询构建整个应用程序既不可行也不可扩展,而 OGM 在处理涉及大量涉及引用外部实体的关系的大型数据层次结构时可能不够高效。

我们最终选择了一种自定义方法,利用 OGM 作为映射节点和边缘的参考解决方案,以 ORM 类型的视角,并支持特定 DAO 的实现,因此通过无法表现良好的自定义查询方法优化了时间上的优化。

总之,我们可以说采用的软件架构很好地响应了知识图模式的变化,并完全满足了客户需求,同时减轻了楔形工程开发团队的努力。

然而,在采用这种架构之前,必须考虑一些威胁:

  • SQL 比 Cypher 查询语言更为常见 → 因此,更容易找到(并因此纳入开发团队)能够维护 RDBMS 而不是 Neo4j 图形数据库的代码的专家; 

  • ​Neo4j 的本地生产系统要求很高(即对于基于服务器的环境,至少推荐 8 GB)→ 这种解决方案可能不适合资源有限的场景和低成本实施; 

  • 在我们的最大努力下,我们没有找到任何“随时可以使用且易于使用”的开源编辑器来浏览 Neo4j 图形数据库的数据结构(Neo4j 的官方数据浏览器不允许通过 GUI 进行数据修改,除非自定义 MERGE/CREATE 查询),就像 RDBMS 有很多一样 → 这可能是由于特定的数据模型本身导致的,使得实现数据的表格视图变得困难。

作者:Cosimo Giani

更多技术干货请关注公号【云原生数据库

squids.cn,云数据库RDS,迁移工具DBMotion,云备份DBTwin等数据库生态工具。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/178865.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Elasticsearch:将最大内积引入 Lucene

作者:Benjamin Trent 目前,Lucene 限制 dot_product (点积) 只能在标准化向量上使用。 归一化迫使所有向量幅度等于一。 虽然在许多情况下这是可以接受的,但它可能会导致某些数据集的相关性问题。 一个典型的例子是 Cohere 构建的嵌入&#x…

CSS特效016:天窗扬起合上的效果

CSS常用示例100专栏目录 本专栏记录的是经常使用的CSS示例与技巧,主要包含CSS布局,CSS特效,CSS花边信息三部分内容。其中CSS布局主要是列出一些常用的CSS布局信息点,CSS特效主要是一些动画示例,CSS花边是描述了一些CSS…

计算3个点的6种分布在平面上的占比

假设平面的尺寸是6*6,用11的方式构造2,在用21的方式构造3 2 2 2 1 2 2 2 2 2 1 2 2 2 2 2 1 2 2 3 3 3 x 3 3 2 2 2 1 2 2 2 2 2 1 2 2 在平面上有一个点x,11的操作吧平面分成了3部分2a1,2a…

OCR是什么意思,有哪些好用的OCR识别软件?

1. 什么是OCR? OCR(Optical Character Recognition)是一种光学字符识别技术,它可以将印刷体文字转换为可编辑的电子文本。OCR技术通过扫描和分析图像中的文字,并将其转化为计算机可识别的文本格式,从而…

DataFunSummit:2023年OLAP引擎架构峰会-核心PPT资料下载

一、峰会简介 OLAP技术是当前大数据领域的热门方向,该领域在各个行业都有广泛的使用场景,对OLAP引擎的功能有丰富多样的需求。同时,在性能、稳定性和成本方面,也有诸多挑战。目前,OLAP技术没有形成统一的事实标准&…

使用SpringBoot集成MyBatis对管理员的查询操作

增删改查中的查询操作,对所有的普通管理员进行查询操作。 效果展示: 不仅可以在打开页面时进行对管理员的自动查询操作,还可以在输入框进行查询。 首先是前端向后端发送POST请求,后端接收到请求,如果是有参数传到后端…

Py之wikipedia-api:wikipedia-api的简介、安装、使用方法之详细攻略

Py之wikipedia-api:wikipedia-api的简介、安装、使用方法之详细攻略 目录 wikipedia-api的简介 wikipedia-api的安装 wikipedia-api的使用方法 1、 创建 Wikipedia并进行查询 wikipedia-api的简介 Wikipedia-API是一个易于使用的Python封装,用于访…

传统企业如何实现数字化转型?如何加快企业数字化转型?

科技的发展给社会带来了各种变革,技术日新月异,很多传统的东西都被大众抛之脑后,在这个以技术和数据运营为导向的数字化时代,传统企业想要保持足够的核心竞争力,就必须跟上时代的步伐,进行企业数字化转型&a…

使用PySpark 结合Apache SystemDS 进行信号处理分析 (离散傅立叶变换)的简单例子

文章大纲 简介 :什么是 SystemDS ?环境搭建与数据 准备数据预处理模型训练 与 结果评估参考文献简介 :什么是 SystemDS ? SystemDS is an open source ML system for the end-to-end data science lifecycle from data integration, cleaning, and feature engineering, ov…

语音识别入门——常用软件及python运用

工具以及使用到的库 ffmpegsoxaudacitypydubscipylibrosapyAudioAnalysisplotly 本文分为两个部分: P1:如何使用ffmpeg和sox处理音频文件 P2:如何编程处理音频文件并执行基本处理 P1 处理语音数据——命令行方式 格式转换 ffmpeg -i video…

HarmonyOS ArkTS Video组件的使用(七)

概述 在手机、平板或是智慧屏这些终端设备上,媒体功能可以算作是我们最常用的场景之一。无论是实现音频的播放、录制、采集,还是视频的播放、切换、循环,亦或是相机的预览、拍照等功能,媒体组件都是必不可少的。以视频功能为例&a…

java--飞翔的小鸟

游戏玩法:通过鼠标点击使小鸟上下移动穿过柱子并完成得分,小鸟碰到柱子或掉落到地面上都会结束游戏。 游戏内图片 Brid类: package bird;import org.omg.CORBA.IMP_LIMIT;import javax.imageio.ImageIO; import java.awt.image.BufferedIma…

时序预测 | MATLAB实现基于BiLSTM-AdaBoost双向长短期记忆网络结合AdaBoost时间序列预测

时序预测 | MATLAB实现基于BiLSTM-AdaBoost双向长短期记忆网络结合AdaBoost时间序列预测 目录 时序预测 | MATLAB实现基于BiLSTM-AdaBoost双向长短期记忆网络结合AdaBoost时间序列预测预测效果基本介绍模型描述程序设计参考资料 预测效果 基本介绍 1.Matlab实现BiLSTM-Adaboost…

【用unity实现100个游戏之16】Unity中程序化生成的2D地牢5(附项目源码,完结)

文章目录 最终效果前言生成墙壁优化方法一、使用rule tile方法二、使用代码生成墙壁补充最终效果后续参考源码完结最终效果 前言 本期是本项目最后一期,主要是进行墙壁的生成优化和补充一下剩下了的其他内容 生成墙壁优化 方法一、使用rule tile 我这里大概给个rule tile参…

前缀和——DP35 【模板】二维前缀和

文章目录 🍎1. 题目🍒2. 算法原理🍅3. 代码实现 🍎1. 题目 题目链接:【模板】二维前缀和_牛客题霸_牛客网 (nowcoder.com) 描述 给你一个 n 行 m 列的矩阵 A ,下标从1开始。 接下来有 q 次查询&#xff0…

Can‘t open the append-only file: Permission denied

redis rdb aof-CSDN博客 Cant open the append-only file: Permission denied E:\Document_Redis_Windows\redis-2.4.5-win32-win64\64bit E:\Document_Redis_Windows\redis-2.4.5-win32-win64\64bit\redis.conf 还是不行,就要修改权限了,windows【完全控…

Nginx配置文件中的关键字是什么?详细解释来了

点击上方蓝字关注我 Nginx 是一款高性能的 Web 服务器软件,同时也是一款反向代理服务器软件。Nginx 的配置文件通常是 /etc/nginx/nginx.conf,以下是一个典型的配置文件,并对其中的关键字进行详细解释。 1. 配置文件 perlCopy codeuser ngin…

【论文阅读笔记】Emu Edit: Precise Image Editing via Recognition and Generation Tasks

【论文阅读笔记】Emu Edit: Precise Image Editing via Recognition and Generation Tasks 论文阅读笔记论文信息摘要背景方法结果额外 关键发现作者动机相关工作1. 使用输入和编辑图像的对齐和详细描述来执行特定的编辑2. 另一类图像编辑模型采用输入掩码作为附加输入 。3. 为…

RK3588平台开发系列讲解(嵌入式AI篇)RKNPU详解

文章目录 一、CPU、GPU、FPGA和NPU介绍二、CPU、GPU、FPGA和NPU区别三、NPU 应用四、RKNPU沉淀、分享、成长,让自己和他人都能有所收获!😄 📢 本篇将给大家介绍什么是RKNPU。 一、CPU、GPU、FPGA和NPU介绍 二、CPU、GPU、FPGA和NPU区别 若考虑成本、功耗、计算能力以及体…

[SIGGRAPH-23] 3D Gaussian Splatting for Real-Time Radiance Field Rendering

pdf | proj | code 本文提出一种新的3D数据表达形式3D Gaussians。每个Gaussian由以下参数组成:中心点位置、协方差矩阵、可见性、颜色。通过世界坐标系到相机坐标系,再到图像坐标系的仿射关系,可将3D Gaussian映射到相机坐标系,通…
最新文章