VMware vSAN OSA存储策略 - 基于虚拟机的分布式对象存储

简介

博客:https://songxwn.com/

存储策略 (Storage Policy) 是管理员定义的一组规则,这组规则定义了数据对象在 vSAN 存储上是如何保存的,存储策略定义了数据存储的可靠性、访问性能等特性。vSAN 提供了基于存储策略的存储管理 SPBM (Storage Policy-Based Management),管理员创建多个存储策略,利用 SPBM 来对 vSAN 存储进行灵活地管理,SPBM 是 vSAN 的一个重要特色。

本文简单介绍了vSAN 的OSA架构,从vSphere 5.5版本开始到7.0,只支持OSA,8.0以后除了支持OSA外,还支持ESA(Express Storage Architecture)。

OSA为传统架构,支持SSD+HDD的混合组,或者容量SSD+高速SSD的全闪存组。有容量和性能存储分层。

ESA为全新闪存架构,要求使用4块以上的NVME SSD,512G内存、25G网络。无存储分层。

起源

据说啊OSA架构是借鉴了路坦力(Nutanix)的设计,大概是2013年,SSD的价格还很贵,这个设计就是利用SSD的高性能,作为读写缓存,提升超融合存储的性能,算是个划时代的产品。VMware的vSAN借鉴了这个思路,当年路坦力的产品依附在VMware平台上,而VMware几乎是抄袭了路坦力,把路坦力气的嘚嘚的,最后导致路坦力和VMware翻脸。

vSAN 基于虚拟机为对象的超融合分布式存储

Distributed RAID:

vSAN将数据按一定的规则(Storage Policy)分布到集群各个物理主机上,确保数据可以在发生主机或存储设备故障的时候可以恢复,类似于磁盘整理上的RAID技术,可以理解成分布式的RAID

Objects:

vSAN是一个对象存储,虚拟机是由多个对象组成,如虚拟机磁盘(VMDK),存储虚拟机配置的VM home namespace,namespace这种对象,可以理解成目录,vSAN的性能数据,ISO文件,内容库这些都是以namesapce的类型存储的;当虚拟开机的时候,VM swap object会被创建;当故障发生的时候,vSAN会创建叫“durablility componet”的对象,以存储新写入的数据。

每个虚拟机都可以应用一个存储策略,这代表每台虚拟机冗余方法都可以不一样。而数据分布也是每台都是不同,分布在不同容量硬盘上。

Component

为了Object可以在故障的时候恢复,所以vSAN将Object切成更小的块(chunk),一个object由多个componet构成,可以理解为下图

重要的存储策略概念

对象磁盘条带数 (Number of disk stripes per object)

把虚机对象分成多个条带 (stripe) 分布存储在多个硬盘上,这样有助于提高数据读取的性能。在下图的例子中,所示的虚机被分为两个条带 a 和 b 进行存储;因为同时又采用了 Raid-1,所以虚机对象又被保存了两个副本,一个副本在服务器 ESX01 的磁盘组中,另一个副本存放在位于服务器 ESX02 和 ESX03 上的磁盘组中。(其实就相当于 RAID 10

对象条带数实际上就是 Raid-0 的概念,只不过我们在定义 Raid-0 的配置时,更多使用的是条带宽度 (stripe width) 的概念,条带宽度是指每一块条带块的大小,条带数量取决于组成 Raid-0 阵列的磁盘数量。vSAN 中对象条带数缺省为1 (建议不要改动这个值),最大值为12。把这个值设置成大于1能够提高系统性能,但是会引起更多的资源消耗。

vSAN-RAID1+0

读缓存预留 (Flash read cache reservation %)

无论是机械硬盘和 SSD 组成的混合架构,还是由高速NVME SSD 和普通SAS/SATA SSD 组成的全闪存架构,vSAN 都会把两种设备中性能更高的那种设备用作读写缓存(全闪只会用于写缓存),从而来提高整个系统的性能。这个参数指定了为虚机对象保留的缓存 SSD 空间占比 (相对于虚机大小),缺省为0% ;建议一般情况下不要改动这个值,仅当特定情况下需要提高性能时才改动。

vSAN OSA 混合硬盘组里面的缓存盘划分写缓冲区(30%)和读缓存区(70%)。

vSAN OSA 全闪存硬盘里面的缓存盘只用于写缓存,最高利用容量为 600G / 1.6TB。(vSAN8 可扩展到1.6TB)

vSAN OSA 缓存和容量硬盘比应该是 1/10。

对象空间预留 (Object space reservation %)

vSphere 在创建虚机时虚拟硬盘有三种格式可以选择:

  • Thick Provision Lazy Zeroed(厚置延迟置零):一开始就分配足额空间给虚拟硬盘,但是等真正写入数据时才初始化(写 0);

  • Thick Provision Eager Zeroed(厚置快速置零):一开始就分配足额空间给虚拟硬盘,并且完全初始化(写 0),性能最优;

  • Thin Provision(精简置备):根据虚拟硬盘的实际使用来分配空间,但在性能上要比上面两种差一些。

一般为了节省存储空间的话,会使用精简置备。

对象空间预留参数定义了创建虚机对象时,如果虚机采用的是 Thin Provision 方式的话,必须为虚机保留的存储空间比例 (相对于虚机的大小)。

可以忍受的故障数 FTT (Failure to Tolerate)

FTT (Failure to Tolerate) 是定义数据保护等级的一个重要参数,FTT = 1 意味着可以忍受一个节点的故障。跟 FTT 紧密相关的另一个参数是数据保护方法 FTM (Failure Tolerance Method),FTM 也定义了数据布局的方式,vSAN 中的 FTM 主要有 Raid-1、Raid-5 和 Raid-6 这几种。

Raid-1 就是镜像 (Mirroring),在另一台服务器的磁盘组上保存数据的副本,当其中一台服务器发生故障时,也可以保证数据不丢失。下图展示了 Raid-1 的工作原理,同一个数据对象存在两个副本分别存放在两台服务器上,这种情况下对应 FTT = 1。

Raid-5 跟传统的 Raid 5 磁盘阵列类的概念类似,只不过阵列不是由同一台服务器上磁盘组成,而是由多台服务器上的磁盘组成,通过增加奇偶校验块来提高数据的容错能力。Raid-5 最少要求4个服务器节点,可以实现 FTT = 1 的容错要求。跟 Raid-1 相比,Raid-5 可以至少节省 30% 的存储空间。(在OSA架构下,性能会有一定下降。)

Raid-6 的工作原理跟 Raid-5 类似,只不过采用了双份的奇偶校验块,从而使数据的容错能力进一步提高。Raid-6 最少要求6个服务器节点,可以实现 FTT = 2 的容错要求。跟 Raid-1 相比,Raid-6 可以至少节省 50% 的存储空间。(在OSA架构下,性能会有一定下降。)

vSAN 中的 Raid-5/6 也称之为纠删码 (Erasure Coding),我们可以把它理解成一种跨服务器的 Raid 阵列实现。

在ESA架构中 Raid-5/6 的性能被优化到和RAID1 接近。

IOPS (Input / Output Per Second) 限制

IOPS 是衡量存储性能的一个重要指标,vSAN 通过为虚机指定 IOPS 限制值,来控制虚机可以获得的存储访问 QoS (Quality of Service) 服务质量等级。通过这个值的设定可以限制某些非关键应用虚机对于 vSAN 性能的占用,从而保证关键应用虚机的存储访问性能。

校验和 (checksum) 验证

校验和 (checksum) 是在数据处理和数据通信领域中,用于校验数据正确性的一种方法:把数据的各个位数累加起来,在处理数据结束之后根据这个数值判断是否接收到的数据是否正确,如果数值匹配那么说明数据被正确地处理了。校验和通常是以十六进制为数制表示的形式来进行计算,如十六进制串: 0102030405060708 的校验和是 24 (十六进制,十进制累加结果为36)。

vSAN 在写入数据时同时也写入该数据的校验和,作为日后比对的依据。打开该功能时,vSAN 在后台执行磁盘扫描 (Disk Scrubbing),如果通过校验和验证发现了错误,则重建数据,能够自动检测和解决静态磁盘错误 (silent disk errors)。

强制调配 (Force Provisioning)

当存储策略中设定的规则不能满足时,vSAN 也可以强制为虚机分配存储空间,保证在一些极端条件下 (如存储空间不够) 也能够为虚机分配空间,让系统能够正常地运行下去。

存储策略的定义和使用

定义存储策略

存储策略必须在虚机创建之前建立,这样才可以在虚机创建时选择使用;当然 vSAN 有缺省的存储策略,如果没什么特殊需求的话,就可以使用缺省的策略。下图示意了虚机存储策略是如何被创建的,创建之后就可以在 web client 管理控制台中看到 vSAN 集群中现有的存储策略。

使用存储策略

接下来就可以在创建虚机的时候指定它所使用的存储策略了,或是修改现有虚机的存储策略。下图示意了修改一个虚机存储策略的过程,管理员修改了虚机的存储策略后,vSAN 会根据新的策略来调整虚机数据的存储布局,以符合新的存储策略的要求。

检查存储策略的合规性 (Compliant)

管理员也可以去检查虚机对象的存储是否符合存储策略的规定,合规 (Compliant) 的意思就是 vSAN 存储满足了存储策略定义的要求。在存储空间资源短缺的情况下,也会产生不合规的情况,例如要求采用镜像来保存虚机对象,如果其他服务器上没有足够空间的话,结果只保存了一份虚机对象副本。如果出现不合规情况的话,就意味着数据对象没有得到应有的安全保护,也有可能是存储策略设置得不合理,管理员就要立即采取行动,找出造成违规的原因。

vSAN规划注意

  • 至少单台物理服务器256G 内存以上。

  • 每台服务器CPU是同型号,最少是同代。建议近三年发布的。

  • 要求有单独的接入交换机(方便网络接入)。

  • 要求集群数量最少三台,推荐为四台以上。

  • vSAN 集群网络之间延迟要求小于1毫秒,最好独立VLAN。

  • 要求有单独两块硬盘做RAID1 作为系统盘,独立于vSAN。

  • vSAN 至少要求一个SSD+一个HDD,推荐为两块SDD 作为缓存层,两块HDD作为容量层,作为两个硬盘组。

  • 缓存硬盘和容量硬盘的总容量比应该为1:10

  • vSAN网络要求10G起步,推荐使用25G*2

  • 缓存盘和容量盘要求直通或RAID0,推荐用SAS卡接入,有一定队列深度要求。

  • 集群中所有vSAN主机相互访问延迟不应该大于1MS.

  • 网卡要求四个10G网卡,其中两个作为管理、虚拟机迁移、vSAN网络。其他两个为业务网卡。

  • 单个阵列卡,RAID和直通模式不能混用,否则vSAN会有问题。vSAN告警

  • vSAN 规定每个磁盘组最少需要一块SSD作为缓存+一块HDD/SSD作为容量层,最多一块+7块HDD/SSD作为容量层。每台主机不能多于 5 个磁盘组。(vSAN会占用内存、 HA也会预留内存)

  • vSAN缓存盘,30%作为写缓存 70%作为读缓存。每个磁盘组仅可以有一个缓存盘。

  • vSAN OSA 混合硬盘组,缓存层和容量层的大小比应该最小为 1:10

  • vSAN OSA 全闪存硬盘组,缓存盘最大利用率为600G。可增加使用到1.6TB

  • vSAN ESA 架构,需要每台至少有512G内存,四个NVME SSD,两个25G网卡。

  • vSAN可以部署RDMA 增加性能,但需要网卡+交换机支持。

硬件兼容性查询:https://www.vmware.com/resources/compatibility/search.php

延伸阅读

将 VMware vSphere / vSAN 软件与 Intel 的最新硬件平台技术相结合,可以为用户交付最佳的超融合架构平台,帮助用户简化数据中心管理,降低采购和运维成本,轻松应对企业在数字化转型中面对的各种挑战。(AMD目前的服务器CPU性价比更高。)

  • VMware vSAN 是最佳的存储方案平台,具有管理简便、高性能、低成本、易扩展的特点,在 vSAN 平台上可以支持任何类型的应用。

  • Intel 至强处理器提供最强计算能力,基于傲腾 (Optane) 和 3D NAND 技术的固态盘是理想的高速缓存,以太网融合网卡提供稳定的网络带宽和低网络延迟。(傲腾 产品线已经被放弃了。)

参考文档

https://blogs.vmware.com/china/2018/12/29/vsan-%E5%AD%98%E5%82%A8%E7%AD%96%E7%95%A5%E6%BC%94%E7%A4%BA/

https://communities.vmware.com/t5/VMware-vSAN-Discussions/cache-size-in-vSAN-6-2/td-p/2225513

https://zhuanlan.zhihu.com/p/686508940

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/496215.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

upload-labs-master靶场训练笔记

2004.2.17 level-1 &#xff08;前端验证&#xff09; 新建一个写有下面一句话木马的php文件&#xff0c;然后把后缀改为png <?php eval($_POST["abc"]); ?> 用bp抓包后更改文件后缀为php 再用蚁剑等工具链接即可拿下shell level-2 &#xff08;后端…

js改变图片曝光度(高亮度)

方法一&#xff1a; 原理&#xff1a; 使用canvas进行滤镜操作&#xff0c;通过改变图片数据每个像素点的RGB值来提高图片亮度。 缺点 当前项目使用的是svg&#xff0c;而不是canvas 调整出来的效果不是很好&#xff0c;图片不是高亮&#xff0c;而是有些发白 效果 代码 …

量子通信达新高度!两大诺奖技术联手,铸就前所未有的高效纠缠光子源

滑铁卢大学量子计算研究所&#xff08;IQC&#xff09;的科学家们成功地融合了两项诺贝尔奖级别的研究成果&#xff0c;从而在量子通信领域取得了重大进展。他们现在能够通过量子点技术高效生成几乎完美的纠缠光子对&#xff0c;这一突破性成果已在《通信物理学》&#xff08;C…

实例:NX二次开发求取封闭曲线的面积(多个封闭曲线)

一、概述 最近在NX二次开发群里有人推了一篇关于写求取封闭曲线面积的文章。针对小白的我决定试着做一做&#xff0c;期间遇到了很多问题&#xff0c;全部用NXOpenC通过录制代码进行修改&#xff0c;最后发现老是有问题&#xff0c;后来通过ufun转化解决了问题&#xff0c;个人…

如何使用在项目中使用echarts

一、使用echarts的好处和作用 ECharts 是一个强大的数据可视化库&#xff0c;主要用于在网页上创建丰富多彩的交互式图表和地图。一些 ECharts 的好处和作用包括&#xff1a; 好处&#xff1a; 丰富的图表类型&#xff1a;ECharts 提供了各种常见的图表类型&#xff0c;如折线…

python的一些知识点

在C C Java中&#xff0c;基本数据类型变量&#xff08;将常量数据存储在变量空间当中&#xff09; int a 3; int b 4; 在C C中&#xff0c;指针变量&#xff08;存储的是变量的物理内存地址&#xff09; int a 3; int* b; b &a; int** c; c &b; printf("%d&…

jira安装与配置

1. 环境准备 环境要求 1) JDK1.8以上环境配置 2) Mysql数据库5.7.13 3) Jira版本7及破解包 1.1 JDK1.8安装配置 1) 首先下载 JDK1.8&#xff0c; - 网址&#xff1a;https://www.oracle.com/cn/java/technologies/javase/javase-jdk8-downloads.html - windows64 版&am…

Vue3气泡卡片(Popover)

效果如下图&#xff1a;在线预览 APIs 参数说明类型默认值必传title卡片标题string | slot‘’falsecontent卡片内容string | slot‘’falsemaxWidth卡片内容最大宽度string | number‘auto’falsetrigger卡片触发方式‘hover’ | ‘click’‘hover’falseoverlayStyle卡片样式…

开源AI引擎:利用影像处理与目标检测技术对违章建筑排查

一、项目案例介绍 随着城市化进程的加快&#xff0c;城市规划和管理工作面临着前所未有的挑战&#xff0c;违章建筑的排查与处理成为了城市管理中的一项重要任务。传统的违章建筑排查方法依赖于人力巡查&#xff0c;效率低下且难以全面覆盖。为了解决这一问题&#xff0c;现代…

C++资产设备管理系统

一、引言 1.1 项目设计背景及意义 1.1.1理论研究基础 &#xff08;1&#xff09;C在C的基础上增加了面向对象的机制。 &#xff08;2&#xff09;充分利用面向对象机制中的多态性实现函数的设计。 1.1.2 技术层面的支持 运用系统为C面向对象程序设计提供的各种设计方法和V…

DAZ Studio中常用的快捷键组合

CtrlAlt左键: 旋转视图CtrlAlt右键: 平移视图CtrlF: 在Mac上对应AppleF,聚焦选中的物体Alt方向键: 平移视图CtrlP: 返回透视视图W/A/S/D: 上/下/左/右视图ShiftF11: 在Mac上可能需要添加Option键,全屏模式F3: 启用X射线视见效果Ctrl1到0: 切换各种渲染式样CtrlL: 切换场景灯光 …

Midjourney辞典AIGC中英双语图文辞典+Midjourney提示关键词

完整内容下载&#xff1a;https://download.csdn.net/download/u010564801/89042077 完整内容下载&#xff1a;https://download.csdn.net/download/u010564801/89042077 完整内容下载&#xff1a;https://download.csdn.net/download/u010564801/89042077

基于Java在线考试系统系统设计与实现(源码+部署文档)

博主介绍&#xff1a; ✌至今服务客户已经1000、专注于Java技术领域、项目定制、技术答疑、开发工具、毕业项目实战 ✌ &#x1f345; 文末获取源码联系 &#x1f345; &#x1f447;&#x1f3fb; 精彩专栏 推荐订阅 &#x1f447;&#x1f3fb; 不然下次找不到 Java项目精品实…

element表格 加滚动,监听底部实现分页加载

表格要实现滚动很简单&#xff0c;给他加一个高度即可 height"300" 然后是监听事件 mounted() {this.lazyLoading();}, methods:{lazyLoading(){let dom document.querySelector(".el-table__body-wrapper");dom.addEventListener("scroll", (…

适合工业应用,MAX42408AFOA、MAX42408AFOB、MAX42410AFOA采用小解决方案尺寸的高功率DC/DC转换器

产品简介 MAX42408/MAX42410均为高度集成的同步降压转换器&#xff0c;具有内部高侧和低侧开关。这些IC均可在4.5V至36V的输入电压范围内提供高达8A/10A的电流。电压质量可以通过PGOOD信号来监测。MAX42408/MAX42410可以在压差模式下以99%的占空比运行&#xff0c;非常适合工业…

创业最大的机会是什么?2024普通人的机会!2024创业新风口!2024轻资产创业!2024年做什么行业赚钱有前景?

开封王婆的爆火就是商机的展现&#xff01;她就是敏锐的发现了婚恋市场上的空白点&#xff0c;看到了年轻人对真实、自由恋爱关系的渴望&#xff0c;以及对情感生活自主性和独立性的追求。并且除了人力几乎没有没有任何成本。而且&#xff0c;这种创业模式几乎只需要人力投入&a…

纯前端网页播放20路海康威视、大华RTSP视频流,调用双显卡GPU加速

关于网页播放摄像头RTSP视频流&#xff0c;网上有很多免费开源方案&#xff0c;大多数是通过把在服务器端RTSP转码成HLS或者RTMP等前端可以播放的视频流&#xff0c;然后推到前端播放&#xff0c;但是大多数延迟非常高&#xff08;比如&#xff1a;HLS延迟达到十几秒&#xff0…

Springboot实现qq邮件的发送

一、打开必要的邮件设置 首先登录qq邮箱官网登录之后&#xff0c;在设置中将传输协议给打开&#xff0c;我们需要用这个秘钥作为发件人的邮箱授权。 这里开启之后&#xff0c;记住这个秘钥。 二、代码编写 首先我们将作为发送邮件的账户信息写入配置文件。 spring:mail:hos…

#include<初见C语言之指针(5)>

目录 一、sizeof和strlen的对比 1. sizeof 2.strlen 二、数组和指针题解析 1. ⼀维数组 1.1数组名理解 2.字符数组 3. ⼆维数组 三、指针运算题解析 总结 一、sizeof和strlen的对比 1. sizeof 我们前面介绍过sizeof是单目操作符 sizeof括号中有表达式&#xff0c;不…

力扣19 链表 删除倒数N结点

目录 问题&#xff1a; 1.链表的组成结构 2.如何改变倒数第N个结点 2.1 求链表长度 2.2 找到倒数第N个结点前一个结点 2.3 让倒数N前一个改变即可 3.源代码示范 问题&#xff1a; 1.链表的组成结构 单向链表 由value next 组成 &#xff0c;value包括此结点的各基础属…