RAID技术的基本概念
RAID,独立冗余磁盘结构,也称磁盘阵列
RAID:
- 条带化:读写性能
- 磁盘组合:容量
- 镜像,奇偶校验:数据安全性
RAID技术实现方式
硬件RAID
- 优点:不占用主机资源,性能高,且操作系统盘也可以安装在RAID虚拟磁盘上,能够进行相应的冗余保护
- 缺点:成本高
软件RAID
- 优点:成本低,配置灵活,方便管理
- 缺点:占用主机CPU资源和内存空间,且需启动操作系统后才能正常运行
RAID关键技术
数据组织方式
条带单元
指磁盘中单个或多个连续的扇区的集合,是单块磁盘上进行一次数据读写的最小单元。
条带
是同一磁盘阵列中多个磁盘驱动器上相同“位置”(或者说是相同编号)的条带单元的集合,条带单元是组成条带的元素。
条带化的数据组织方式,实现了多块磁盘并发/并行存取数据,提高了数据存取效率
并发:
指多个物理磁盘一对一同时响应多个I/O请求
并行:
指多个物理磁盘同时响应一个I/O请求
数据保护方式
方法一:镜像方式
方法二:奇偶校验方式
奇偶校验采用异或(计算符号+)算法-相同为假,相异为真。
RAID级别与分类标准
RAID技术将多个单独的物理硬盘以不同的方式组合成一个逻辑盘,提高了硬盘的读写性能和数据安全性,根据不同的组合方式可以分为不同的RAID级别。
RAID0数据组织方式
RAID0:一种简单的,无数据校验的数据条带化技术
安全性:不提供冗余策略
性能:数据以条带性能均匀分布于各个硬盘,支持并发/行读写。
RAID0数据保护方式
RAID0不提供数据冗余保护,阵列中的任何一个硬盘失效都将导致整个RAID组的数据丢失。
RAID0应用场景与优缺点
- 优缺点(注:阵列磁盘成员数为N)
- RAID0适合于读写性能要求较高但安全性要求不高的应用,如,存储高清电影,图形工作站等
RAID1数据组织方式
RAID1:又称镜像,通过磁盘镜像实现数据冗余的技术。
- 安全性:全冗余组合模式(镜像备份)
- 性能:不支持并发/行写,支持并发/行读。
RAID1数据写入
RAID1在数据写入时,如上图,首先将磁盘0写入完成之后,再给磁盘1写入一份相同的数据,因此RAID1不支持并发/行的写
RAID1数据读取
虽然写的时候要一个一个的写入,但是在读取的时候可以两块磁盘同时读取,参照上图,如果要读取D0,那么可以从磁盘0里读取,也可从磁盘1中读取,或者要同时读取D1和D2,那么可以让磁盘0读取D1出去,让磁盘1读取D2出去,共同分担。所以RAID1支持并发/行读
RAID1数据保护方式
RAID1的数据盘与镜像盘具有相同的内容,当数据盘出现故障时,可以使用镜像盘恢复数据。
RAID1应用场景与优缺点
- 优缺点(注:阵列磁盘成员数为N):
RAID1适用于随机性较大,安全性要求高的应用,如服务器,数据库存储等。
RAID3数据组织方式
RAID3:基于奇偶校验冗余保护与校验盘的条带化阵列
- 安全性:专用校验盘存放冗余数据
- 性能:不支持并发写
数据写取:
RAID3不支持并发的写入,因为在写入数据A0时,会写入校验盘P1这个校验值,但是此时有数据B2要下发,而磁盘3会等P1写完成之后才进行P2校验值的写入,所以不支持并发的写入,在读取的时候也是类似的,RAID3是支持并行和并发的读I/O的,在读取A0时可以读取A1和A2,如果正在读取数据块A那么又要读取数据块B,那么是可以同时读取的
RAID3数据保护方式
RAID3通过对剩余数据盘上的数据块和校验盘上的校验数据作异或处理,重构出故障盘上原有的数据。重构时间是很慢的,一两T的硬盘需要重构十几个小时。
RAID3应用场景与优缺点
- 优缺点(注:阵列磁盘成员数为N)
RAID3适用于连续数据的存放,安全性要求高的应用,如视频剪辑,大型数据库等等。
RAID5数据组织方式
- 安全性:奇偶校验冗余保护
- 性能:支持并/行读写,可通过减少“写惩罚”提高性能
RAID5数据数据读写
RAID5和RAID3最大的区别就是RAID5没有数据校验盘,它将校验数据分布式存放在各个磁盘里面,如图,当写入D0时,会在磁盘0和磁盘1同时写入,磁盘2也会写入D0的数据校验P0,同时写入D2时,这个数据校验可能出现在其它磁盘上。都是支持并行的读和写的。
RAID5数据保护方式
RAID5可以通过对其它成员磁盘上的用户数据和校验数据进行异或运算,重构出故障盘上原有的数据。
RAID5适用于随机数据存储,安全性要求高的应用,如邮件服务器,文件服务器等等。
RAID6 P+Q工作原理
RAID6 P+Q :P和Q表示2个彼此独立的校验数据,。相当于在RAID5的基础上,又多了一种校验数据的方式
RAID6 P+Q磁盘阵列对数据的读写方式和RAID5是一样的。
RAID6的数据保护
这个很好理解,因为有两个校验的值,如果一个硬盘坏了,随便选择一个校验公式无论是P或者Q都能将数据恢复出来,这个和RAID5类似,但是如果两个硬盘坏了,那么就需要用到P和Q两种校验公式来恢复数据。
RAID6 DP工作原理
RAID6 DP:P和DP这是两个校验数据,分别用横向校验方式和斜向校验方式来算的,就需要两个校验盘,P校验方法采用横向,DP方法采用斜向
RAID6 DP磁盘阵列对数据的读写方式和RAID3是一样的。因为这里有一个P校验盘和DP校验盘。
RAID6 DP数据保护
- 阵列中只有一个磁盘数据失效时,根据P或者DP校验公式都可以恢复,与RAID3同理
- 阵列中同时有两个数据盘失效时,则需要根据两个校验公式实现数据的恢复
RAID6应用场景与优缺点
注意,RAID6适用于安全性要求非常高的应用
RAID01数据组织方式
RAID01:组内做RAID0,组间做RAID1,实质是对条带化后的虚拟磁盘实现镜像。
安全性:镜像冗余保护
性能:支持并发/行读写
先做RAID0再做RAID1
RAID10数据组织方式
RAID10:组内先做RAID1,组间再做RAID0,实质是对镜像后的虚拟磁盘实现条带化
安全性:镜像冗余保护
性能:支持并发/行读写
先做RAID1再做RAID0
RAID1+0比RAID0+1的安全性要高。因为RAID01的错误率为4n²<1,而RAID10的错误率为2n²<1
所以实际上RAID10用的较多
RAID10支持数据的并发读写
RAID10数据保护方式
镜像保护
RAID10应用场景与优缺点
RAID10适用于数据量大,安全性要求高的应用,如银行,金融等等
RAID50数据组织方式
先做RAID5再做RAID0
RAID50支持并行的读写。
RAID50数据保护方式
六盘的RAID50组中,位于不同的RAID5组的两个磁盘同时损坏,整个逻辑磁盘任能恢复数据。
RAID50应用场景与优缺点
优缺点(注:阵列磁盘成员数为N,RAID5组数为M)
RAID50适用于随机数据存储,安全性要求较高,并发能力要求高的应用,如邮件服务器。www服务器