【存储基础学习笔记】

目录

    • 第一章:存储基础知识
    • 第二章:存储的基本概念
      • 2.1存储是什么?
      • 2.2存储的应用场景
      • 2.3存储的硬件结构
      • 2.4存储的软件架构
      • 2.5存储设备的性能参数和计算方法
    • 第三章:存储阵列关键技术
      • 3.1硬盘介绍
      • 3.2RAID技术
      • 3.3RAID2.0技术
    • 第四章:存储网络技术
      • 4.1存储网络概述
      • 4.2存储网络协议
      • 4.3存储网络形态
    • 第五章:服务器如何使用存储
      • 5.1服务器概述
      • 5.2服务器如何使用存储
      • 5.3主机多路径技术

第一章:存储基础知识

40~70年代,主机+硬盘;

70~80年代,DAS出现,无法共享;

SAN出现,支持数据块的数据传输和数据共享等;

应用软件访问存储介质,需要通过文件系统;

NAS出现,支持数据访问和共享服务,并支持多种协议,如NFS、CIFS、FTP等;

集群NAS出现,海量数据存储;

SAN+NAS===》统一存储;

第二章:存储的基本概念

2.1存储是什么?

存储硬件(磁盘阵列、存储控制器、磁盘柜、磁带库等)、存储软件(管理软件、快照、复制、多路径等)、存储网络(HBA卡、光纤交换机和线缆等)、存储解决方案(集中存储、归档、备份、容灾等)

存储是企业数据的家,,数据产生、数据处理、数据管理(根据数据访问的频率区分)等

2.2存储的应用场景

数据集中管理、数据备份、数据容灾等

2.3存储的硬件结构

存储阵列是由很多硬盘、控制器、扩展框等组成,数据以条带化(striping)的方式存储,以保证可靠性和更好的空间利用率;

存储阵列系统方式1(盘控分离):控制框+硬盘扩展框,特点:成本较高,扩展性好,适用于中高端;

存储阵列系统方式2(盘控一体):控制器模块+硬盘框,特点:成本较低,扩展性差,适用于中低端;

双控制器架构,写入数据在双控CACHE中各存一份,避免单控故障导致数据丢失;每个控制板的后端分别接入物理硬盘的环路,业务负载均衡,提升系统整体性能;

2.4存储的软件架构

架构分类:存储单元端软件、文件引擎软件、应用服务器端软件和管理客户端软件等。

功能分类

  • 管理类:配置、管理、维护和监控等
  • 数据保护类:快照、克隆、LUN拷贝、远程复制等
  • 可靠性提升类:提高应用服务器和存储设备之间的数据传输可靠性,如多路径UltraPath等
  • 效率提升类:如QoS、Motion等;

2.5存储设备的性能参数和计算方法

性能指标

  • IOPS(Input/Output Operations Per Second),即存储每秒能处理的IO个数,用于衡量存储的快速响应能力;(小IO)
  • 带宽(吞吐量),表示存储每秒能处理的数据总量;带宽=IOPS*平均IO;(大IO)
  • 时延,处理IO所消耗的时间,用于衡量存储设备处理的速度,时延分为主机侧时延和存储侧时延,主机侧时延包含存储侧时延,也是用户关注的时延;

性能评估

  • IOPS:IO的顺序和随机特性、CACHE命中率、磁盘单盘IOPS等;对于存储系统的最大IOPS,最主要的瓶颈是CPU的处理能力;
  • 带宽:需要考虑的是IO的大小,磁盘单盘带宽、存储硬件带宽等,对于存储系统的最大带宽,最主要的瓶颈是前后端通道带宽和镜像带宽;

第三章:存储阵列关键技术

3.1硬盘介绍

硬盘分类

  • 介质:机械硬盘(HDD)和固态硬盘(SSD)
  • 盘径:主流的有2.5寸和3.5寸
  • 接口:IDE、SATA、SCSI、SAS、FC等
  • 功能:桌面级和企业级,主要区别是容量大小,性能高低,以及可靠性方面;

主流硬盘

  • SATA HDD:转速7200、串行、MTBF约120万小时,年故障率(AFR,Acceptable Failure Rate)约2%;
  • SAS HDD:转速10000或15000、串行、MTBF约160万小时,年故障率(AFR)约小于2%;
  • NL-SAS,:指标与SATA类似;
  • SSD:不涉及转速、串行、MTBF约200万小时,年故障率(AFR)约2%;

硬盘关键指标

  • 硬盘容量,单位MB或GB;
  • 转速,RPM(Rotation Per Minute), 一般硬盘5400或7200,SCSI接口硬盘可达10000~15000;
  • 平均访问时间,平均寻道时间+平均等待时间;
  • 数据传输率,单位MB/s;
  • IOPS,关键指标;
  • 数据吞吐量

3.2RAID技术

RAID,Redundant Array of Independent Disks,即独立磁盘冗余阵列,RAID技术将多个单独的物理硬盘以不同的方式组合成一个逻辑硬盘,从而提高了硬盘的读写性能和数据安全性。

RAID级别

  • RAID 0,数据条带化,无校验;
  • RAID 1,数据镜像,无校验;
  • RAID 3,数据条带化读写,校验信息存放在专用硬盘;
  • RAID 5,数据条带化,校验信息分布式存放;
  • RAID 6,数据条带化,分布式校验并提供两级冗余;

RAID组合

  • RAID 01,先RAID 0 后RAID 1,同时提供数据条带化和镜像;

  • RAID10,先RAID 1 后RAID 0;

  • RAID 50,先RAID 5 后RAID 0,有效提升RAID 5 性能;

RAID基本概念

  • 分块:将一个磁盘分区分成多个大小相等、地址相邻的数据块;
  • 条带:同一磁盘阵列中的多个驱动器上的相同“位置”(编号)的分块组成一个条带;
  • 热备:HotSpare,当RAID组中某个硬盘故障时,在不干扰当前RAID系统正常使用的情况下,用RAID系统中的另外一个正常的备用盘自动顶替故障硬盘,以保障RAID系统的可靠性,,热备分为全局共享式和专用独占式;
  • 重构,新盘数据的恢复,通过其他数据盘和校验盘XOR的方式重新获得,一般重构时间较长(小时级别),有一定的可靠性风险;
  • LUN,Logic Unit Number,在RAID基础上,按照指定容量创建一个或多个逻辑卷,类似个人PC的电脑分区;

RAID原理

  • RAID 0 没有容错设计,数据以条带形式均匀存储在各个硬盘中,多个数据盘可以同时工作,效率较高;——无法接受坏一块盘
  • RAID 1,数据同时一致写到主硬盘和镜像硬盘,可靠性高,磁盘利用率低,成本较高;——可以接受坏一块盘
  • RAID 3,有一个专用校验盘,通过XOR的方式恢复数据,,如果任意数据盘发生变化,校验盘都要不断工作,成为性能瓶颈;——可以接受坏一块盘
  • RAID 5,与RAID 3类似,但是去掉了专用的校验盘,数据块和对应的校验信息分布式保存在不同的硬盘上,,RAID 5是最常用的RAID方式;——可以接受坏一块盘
  • RAID 6,是RAID 5的扩展,采用奇偶校验方式(横向校验盘和斜向校验盘),需要N+2个磁盘构成阵列,用于数据可靠性和可用性要求极高的应用场景;——可以接受坏两块盘
  • RAID组合,RAID10和RAID50,RAID10的第一级是RAID 1第二级是RAID 0,RAID10也是应用较为广泛的RAID级别,,RAID50的第一级是RAID 5,第二级是RAID 0;

RAID级别比较
在这里插入图片描述

RAID典型应用场景
在这里插入图片描述

3.3RAID2.0技术

产生背景:市场需要安全可信的RAID技术、市场需要更具弹性高效的存储规划方式

某厂RAID 2.0技术,就是由原来的固定管理模式升级为两层虚拟化管理模式,即在原本传统的数据块级虚拟化(融合磁盘)基础上再做LUN虚拟化(融合卷),以实现存储资源的高效管理;

某厂RAID 2.0技术原理:

硬盘—>Chunk(64MB)—>CKG( Chunk Group)—>Extent(512KB~64MB)—>Volume(多个extent组成Volume)—>LUN(主机可见)

某厂RAID 2.0技术特点:

  • 特点1:低故障率,因为数据在存储池中自动均衡分布自动负载均衡,避免了硬盘的冷热(忙闲度)不均,从而降低了存储系统整体的年故障率(AFR);
  • 特点2:快速精简重构,改善双盘失效率;(1T容量为例,重构时长仅为1/20)

第四章:存储网络技术

4.1存储网络概述

单磁盘具有诸多问题,如:容量小、可靠性差,空间利用率低,数据分散等;

DAS通过RAID技术、JBOD和存储控制器等技术解决了原本单磁盘的容量小、可靠性差、硬盘成为系统性能瓶颈等问题;

SAN和NAS通过文件系统和RAID技术,在DAS的基础上,解决了空间利用率低和数据分散无法共享的问题;

注意:①SAN存储的文件系统在应用服务器上;②NAS存储的文件系统在磁盘阵列上。

统一存储——NAS和SAN的融合,既支持基于文件的NAS存储,也支持基于块的SAN存储,这样可以同时支持多种传输协议,模块化的架构、灵活配置、轻松扩容,低TCO等;

4.2存储网络协议

  • SCSI协议:Small Computer System Interface,用于主机与外部设备之间的连接,SCSI-3是所有存储协议的基础。优点:与主机无关、多设备并行、高带宽。缺点:允许链接的设备数量少,链接距离十分有限;
  • FC协议:Fiber Channel,光纤通道,用于服务器与共享存储设备的连接,存储控制器和驱动器之间的内部连接,是一种高性能的串行连接标准,传输速率有4Gbps和8Gbps等,传输介质可以是铜缆或者光纤,传输距离较远,成本较高;
  • iSCSI协议:Internet Small Computer System Interface,或者SCSI over IP,提供高速、低价、长距离的存储解决方案,iSCSI将SCSI命令封装到TCP/IP的数据包中,使得I/O数据可以通过IP网络传输;
  • SAS协议:Serial Attached SCSI,SCSI总线协议的串行标准,即串行连接SCSI;具备高扩展性,兼容SATA,传输速率最高可达3Gbps、6Gbps和12Gbps等,支持全双工模式;

存储网络协议对比
在这里插入图片描述

4.3存储网络形态

  • DAS,Direct Attached Storage,产生于70年代,满足数据量增多的需求,通常采用SCSI方式直接连接,速率较低(20MB/s、40MB/s、80MB/s),提供快照和备份等功能;
  • NAS,Network Attached Storage,产生于90年代初,满足大量数据共享和交换的需求,文件系统位于后端存储设备,后端NAS存储通过CIFS协议(Windows系统)和NFS协议(Linux系统)共享给前端主机,支持对同一目录或文件进行并发读写,速率(1Gbps或10Gbps);
  • FC-SAN,Fiber Channel Storage Area Network,产生于90年代中后期,主要解决DAS扩展性差的问题,可以同时连接百台服务器,需要专用的FC交换机通过FC光纤连接,速率(2Gbps或4Gbps),提供快照和容灾等数据保护功能;
  • IP-SAN,IP Storage Area Network,产生于2001年,主要解决FC-SAN价格高管理复杂等问题,且只需要以太网交换机通过网线连接,速率(1Gbps或10Gbps),也提供快照和容灾等数据保护功能;

存储网络形态比较
在这里插入图片描述

注意:SAN和NAS并不是竞争的关系,更是互补的关系,越来越多的数据中心采用NAS+SAN的方式实现数据整合、高性能访问和数据共享等,即通过SAN实现海量的面向数据块的数据传输,通过NAS提供文件级的数据访问和共享服务。

第五章:服务器如何使用存储

5.1服务器概述

与个人PC相比,构成基本一致(多了RAID卡等附加硬件设备),特点是稳定性、可靠性、安全性、管理运维等方面较好,服务器包括塔式服务器、机架服务器和刀片服务器等;

主机操作系统

  • Windows:Windows 2008等
  • Linux操作系统:Redhat和Suse等发行版
  • VMware ESX:云市场入口
  • AIX小型机系统
  • Solars系统
  • HP-UNIX系统

5.2服务器如何使用存储

通过建立启动器和目标器的连接

启动器:应用服务器;

目标器:存储系统;

主机接口(卡)模块类型:iSCSI、FC、FCoE、TOE等;

线缆类型:网线或光纤;

iSCSI网络:通过“端口+IP地址”识别;

FC网络:通过“端口+WWN号”识别;

使用方式:

硬盘—>硬盘域(性能层-cache和容量层)—>存储池(数据区和热备区)—>LUN组(注意:LUN是应用服务器能够识别的最小存储逻辑单元)—>映射视图(主机组和LUN组之间的映射视图)—>主机组(主机与应用服务器之间建立逻辑关系)—>应用服务器(将逻辑硬盘视为本地硬盘一样进行读写操作)

5.3主机多路径技术

未安装多路径软件时,会给主机看到两道物理LUN的错觉,到时数据混乱;按照多路径软件后,主机只能看到一个物理LUN,而且支持线缆和控制器等中间路径的故障切换和恢复,具体见下图。
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/395234.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Postgresql 怎么实现在局域网中访问

安装PostgreSQL后,默认情况下只能在本机进行连接访问,如果需要在其他主机上访问PostgreSQL数据库服务器,需要进行配置。 安装连接PostgresSQL数据库可以参考博文:安装连接PostgresSQL数据库教程 一. 整体步骤 主要包括下面几个步…

mmap映射文件使用示例

mmap 零拷贝技术可以应用于很多场景,其中一个典型的应用场景是网络文件传输。 假设我们需要将一个大文件传输到远程服务器上。在传统的方式下,我们可能需要将文件内容读入内存,然后再将数据从内存复制到网络协议栈中,最终发送到远…

Ubuntu系统搭建HadSky论坛并结合内网穿透实现无公网ip远程访问

💝💝💝欢迎来到我的博客,很高兴能够在这里和您见面!希望您在这里可以感受到一份轻松愉快的氛围,不仅可以获得有趣的内容和知识,也可以畅所欲言、分享您的想法和见解。 推荐:kwan 的首页,持续学…

x86下使用硬件实现的任务切换(TSS表)---使用代码讲解

实现任务切换(使用TSS) 视频讲解可以看这一个课程 • The current program, task, or procedure executes a JMP or CALL instruction to a TSS descriptor in the GDT. • The current program, task, or procedure executes a JMP or CALL instruction to a task-gate descri…

冒泡排序及其优化

冒泡排序 int[] arr {1,3,2,9,4,7,2,8};//比较多少轮(n个数字比较n-1次)for(int i0,n arr.length;i<n-1;i) {//每轮比较多少次(n-1-i次)for(int j 0;j<n-1-i;j) {//两两比较if(arr[j] > arr[j1]) { //比较结果为升序排列&#xff0c;如果想要降序排列结果将 >…

计算机网络——18无连接传输UDP

无连接传输UDP UDP “尽力而为的”服务&#xff0c;报文段可能 丢失送到应用进程的报文段乱序 无连接 UDP发送端和接收端之间没有握手每个UDP报文段都被独立的处理 UDP被用于 流媒体DNSSNMP 在UDP上实现可靠传输 在应用层增加可靠性应用特定的差错格式 UDP&#xff1a;用户…

小工具 - 浮点计算器

文章目录 小工具 - 浮点计算器概述笔记FloatCalcDlg.cppFloatCalcDlg.hrcEND 小工具 - 浮点计算器 概述 在学习CE, 在调试过程中, 经常要看内存中浮点对应的4字节内存到底对应的是啥具体的浮点值. e.g. 0x42860000 > 67.00 转换逻辑挺简单的 float CFloatCalcDlg::uint32…

克服数字化三重担忧,从构建身份基础设施开始

随着数字化转型和云迁移的逐步推进&#xff0c;IT 架构逐渐复杂化&#xff0c;基础设施和运营&#xff08;I&O&#xff09;领域已出现了许多创新和新兴技术&#xff0c;例如云计算、边缘计算、云原生、容器技术和智能运维&#xff08;AIOps&#xff09;。这些创新和新技术不…

TCP流量控制+拥塞控制

流量控制&#xff1a; 目标&#xff1a;流量控制主要解决的是发送方和接收方之间处理能力的不匹配问题。它的目的是确保发送方不会发送数据过快&#xff0c;以至于接收方无法及时接收并处理这些数据&#xff0c;从而避免数据包在网络中堆积和丢失。实现方式&#xff1a;在TCP协…

挑战杯 基于GRU的 电影评论情感分析 - python 深度学习 情感分类

文章目录 1 前言1.1 项目介绍 2 情感分类介绍3 数据集4 实现4.1 数据预处理4.2 构建网络4.3 训练模型4.4 模型评估4.5 模型预测 5 最后 1 前言 &#x1f525; 优质竞赛项目系列&#xff0c;今天要分享的是 基于GRU的 电影评论情感分析 该项目较为新颖&#xff0c;适合作为竞…

Vue3快速上手(八) toRefs和toRef的用法

顾名思义&#xff0c;toRef 就是将其转换为ref的一种实现。详细请看&#xff1a; 一、toRef 1.1 示例 <script langts setup name"toRefsAndtoRef"> // 引入reactive,toRef import { reactive, toRef } from vue // reactive包裹的数据即为响应式对象 let p…

UE蓝图 Cast节点和源码

系列文章目录 UE蓝图 Cast节点和源码 文章目录 系列文章目录Cast节点功能一、Cast节点用法二、Cast节点使用场景三、Cast节点实现步骤四、Cast节点源码 Cast节点功能 在Unreal Engine&#xff08;UE&#xff09;中&#xff0c;Cast节点是一种蓝图系统中的节点&#xff0c;用于…

如何高效利用FMEA,FMEA实施流程有哪些——SunFMEA软件系统

FMEA作为是一种预防性的质量工具&#xff0c;用于识别、评估和解决潜在的设计和过程故障模式。通过FMEA的实施&#xff0c;可以在产品或过程的开发阶段发现并解决潜在问题&#xff0c;从而减少产品或过程的故障风险。如何高效利用FMEA呢&#xff0c;接下来SunFMEA软件和大家一起…

kali虚拟机桥接模式快速设置

第一步&#xff1a;配置 IP、掩码、网关 vim /etc/network/interfaces第二步&#xff1a;配置 DNS&#xff1a; vi /etc/resolv.conf第三步&#xff1a;重启网卡 service networking restart如果还不行建议重启一下虚拟机

CCF-A类MobiCom历年高引论文集免费放送!

MobiCom 高引论文集 MobiCom(International Conference On Mobile Computing And Networking )会议是无线网络和移动计算领域的重要盛会&#xff0c;对推动该领域发展起着积极的推动作用&#xff01;贴心的会议之眼已经免费为大家带来30篇高质量的MobiCom被广泛引用论文&#x…

Sora 和之前 Runway 在架构上的区别

问&#xff1a;Sora 和之前 Runway 那些在架构上有啥区别呢&#xff1f; 答&#xff1a;简单来说 Runway 是基于扩散模型&#xff08;Diffusion Model&#xff09;的&#xff0c;而 Sora 是基于 Diffusion Transformer。 Runway、Stable Diffusion 是基于扩散模型&#xff08…

JavaScript中延迟加载的方式有哪些

在web前端开发中&#xff0c;性能优化一直是一个非常重要的话题。当我们开发一个页面时&#xff0c;为了提高用户的体验和页面加载速度&#xff0c;我们往往需要采用一些延迟加载的技术。JavaScript中延迟加载的方式有很多种&#xff0c;下面我将为大家详细介绍几种常用的方式。…

Fisher-Yates乱序算法

乱序算法 public class Test07 {public static void main(String[] args) {//乱序算法int[] arr {1,2,3,4,5,6,7,8};//逆序遍历 且这个随机的下标不能使要交换的元素的本身for(int i arr.length-1;i>0;i--){//产生一个随机的下标与当前元素进行交换int index (int)(Math…

Python Flask Web + PyQt 前后端分离的项目—学习成绩可视化分析系统

简介 使用工具&#xff1a; Python&#xff0c;PyQt &#xff0c;Flask &#xff0c;MySQL 注&#xff1a;制作重点在网页端&#xff0c;因此网页端的功能更全 WEB界面展示: 系统登录分为管理员&#xff0c;老师&#xff0c;学生3部分 管理员统一管理所有的账号信息以及登录…

Java实现一个栈

目录 概念与结构 实现一个栈 创建一个栈类 实现栈的基本操作 测试栈类 概念与结构 概念与结构 栈&#xff1a;一种特殊的线性表&#xff0c;其只允许在固定的一端进行插入和删除元素操作。进行数据插入和删除操作的一端称为栈顶&#xff0c;另一端称为栈底。栈中的数据元…