作者介绍:简历上没有一个精通的运维工程师。希望大家多多关注作者,下面的思维导图也是预计更新的内容和当前进度(不定时更新)。
RAID
在一般的品牌服务器里面基本上都有一个叫阵列卡的硬件,硬盘先连接到阵列卡上面,然后阵列卡再连接到主板上,大概就是下面这样的。
根据需要对磁盘做阵列以后,暴露给主板或者说操作系统,如果是4块盘,做了RAID5以后,组合成一个盘,对于操作系统而言,看到的就是只有一个盘,但是如果我们从IPMI可以看到4个物理盘组成了一个逻辑盘。并且一般情况下,这些磁盘都是可以在服务器上直接热插拔的。即便有的硬盘坏了,也可以直接拔下来,然后重新换上一个新的硬盘,RAID卡会自动识别并正常加入到RAID中,这个时候操作系统是无法感知到这一切的。
数据需要经过操作系统通过阵列卡,再到磁盘,这个中间是有一个时间差值的,对于阵列卡部分型号是会带一个独立的电池的,也就是对于操作系统而言,数据已经落盘了,但是这个落盘,还在阵列卡里面,还没有写到真正的磁盘里面,如果这个时候系统断电或者崩溃,由于有电池存在,这个数据会存储在阵列卡里面,等待系统恢复的时候在写入到磁盘里面,从而可以提高可靠性。
当然如果是自己DIY的服务器或者是没有阵列卡的设备上,要体验或者要使用RAID功能也是没问题,因为Linux是可以从软件层面来实现。当然在测试环境,我们没有真正的硬件,是无法模拟出来的阵列的情况,所以就通过Linux软件来模拟阵列情况(虽然在实际运维中,可能不会用到,但是把他当成知识扩展以及理解阵列还是可以的)。
#这台服务器,准备了2块多余的磁盘,sdb和sdc,我们使用他来模拟一个RAID1.
[root@localhost ~]# lsblk
NAME MAJ:MIN RM SIZE RO TYPE MOUNTPOINT
sda 8:0 0 20G 0 disk
├─sda1 8:1 0 1G 0 part /boot
└─sda2 8:2 0 19G 0 part
├─centos-root 253:0 0 17G 0 lvm /
└─centos-swap 253:1 0 2G 0 lvm
sdb 8:16 0 20G 0 disk
sdc 8:32 0 20G 0 disk
sr0 11:0 1 973M 0 rom
1.软件安装
yum -y install mdadm
2.创建阵列
mdadm --create /dev/md0 --level=1 --raid-devices=2 /dev/sdb /dev/sdc --metadata=0.90# /dev/md0 是设备的名字,可根据需要自己定义
# --level=1 是阵列的级别
# --metadata=0.90 主要是兼容性问题
3.查看阵列
#可以看到2个磁盘组成了一个阵列磁盘
[root@localhost ~]# lsblk
NAME MAJ:MIN RM SIZE RO TYPE MOUNTPOINT
sda 8:0 0 20G 0 disk
├─sda1 8:1 0 1G 0 part /boot
└─sda2 8:2 0 19G 0 part
├─centos-root 253:0 0 17G 0 lvm /
└─centos-swap 253:1 0 2G 0 lvm
sdb 8:16 0 20G 0 disk
└─md0 9:0 0 20G 0 raid1
sdc 8:32 0 20G 0 disk
└─md0 9:0 0 20G 0 raid1
[root@localhost ~]# ll /dev/md0
brw-rw---- 1 root disk 9, 0 7月 19 22:19 /dev/md0
这个时候我们就有了个20g由阵列提供的磁盘空间,下面的操作就和前面磁盘操作部分一样(创建分区,格式化,挂载等),当然这里只演示了一个简单的RAID阵列,具体更多功能可以自己探索。
4.创建分区
[root@localhost ~]# fdisk /dev/md0
欢迎使用 fdisk (util-linux 2.23.2)。
更改将停留在内存中,直到您决定将更改写入磁盘。
使用写入命令前请三思。
Device does not contain a recognized partition table
使用磁盘标识符 0x92791e84 创建新的 DOS 磁盘标签。
命令(输入 m 获取帮助):
命令(输入 m 获取帮助):m
命令操作
a toggle a bootable flag
b edit bsd disklabel
c toggle the dos compatibility flag
d delete a partition
g create a new empty GPT partition table
G create an IRIX (SGI) partition table
l list known partition types
m print this menu
n add a new partition
o create a new empty DOS partition table
p print the partition table
q quit without saving changes
s create a new empty Sun disklabel
t change a partition's system id
u change display/entry units
v verify the partition table
w write table to disk and exit
x extra functionality (experts only)
命令(输入 m 获取帮助):n
Partition type:
p primary (0 primary, 0 extended, 4 free)
e extended
Select (default p):
Using default response p
分区号 (1-4,默认 1):
起始 扇区 (2048-41942911,默认为 2048):
将使用默认值 2048
Last 扇区, +扇区 or +size{K,M,G} (2048-41942911,默认为 41942911):
将使用默认值 41942911
分区 1 已设置为 Linux 类型,大小设为 20 GiB
命令(输入 m 获取帮助):w
The partition table has been altered!
Calling ioctl() to re-read partition table.
正在同步磁盘。
5.格式化
#分区名字可以通过lsblk或者直接看/dev里面的设备名字来获取
[root@localhost ~]# mkfs.ext4 /dev/md0p1
mke2fs 1.42.9 (28-Dec-2013)
文件系统标签=
OS type: Linux
块大小=4096 (log=2)
分块大小=4096 (log=2)
Stride=0 blocks, Stripe width=0 blocks
1310720 inodes, 5242608 blocks
262130 blocks (5.00%) reserved for the super user
第一个数据块=0
Maximum filesystem blocks=2153775104
160 block groups
32768 blocks per group, 32768 fragments per group
8192 inodes per group
Superblock backups stored on blocks:
32768, 98304, 163840, 229376, 294912, 819200, 884736, 1605632, 2654208,
4096000
Allocating group tables: 完成
正在写入inode表: 完成
Creating journal (32768 blocks): 完成
Writing superblocks and filesystem accounting information: 完成
6.挂载
[root@localhost ~]# mkdir /mnt/raid
[root@localhost ~]# mount /dev/md0p1 /mnt/raid
[root@localhost ~]# df -h
文件系统 容量 已用 可用 已用% 挂载点
devtmpfs 475M 0 475M 0% /dev
tmpfs 487M 0 487M 0% /dev/shm
tmpfs 487M 7.7M 479M 2% /run
tmpfs 487M 0 487M 0% /sys/fs/cgroup
/dev/mapper/centos-root 17G 2.1G 15G 12% /
/dev/sda1 1014M 138M 877M 14% /boot
tmpfs 98M 0 98M 0% /run/user/0
/dev/md0p1 20G 45M 19G 1% /mnt/raid
7.检查下RAID的状态
#两个磁盘组成的RAID是正常的
[root@localhost ~]# mdadm --detail /dev/md0
/dev/md0:
Version : 0.90
Creation Time : Fri Jul 19 22:19:27 2024
Raid Level : raid1
Array Size : 20971456 (20.00 GiB 21.47 GB)
Used Dev Size : 20971456 (20.00 GiB 21.47 GB)
Raid Devices : 2
Total Devices : 2
Preferred Minor : 0
Persistence : Superblock is persistent
Update Time : Fri Jul 19 22:28:19 2024
State : clean
Active Devices : 2
Working Devices : 2
Failed Devices : 0
Spare Devices : 0
Consistency Policy : resync
UUID : 0794079f:4ce9add0:bfe78010:bc810f04 (local to host localhost.localdomain)
Events : 0.18
Number Major Minor RaidDevice State
0 8 16 0 active sync /dev/sdb
1 8 32 1 active sync /dev/sdc
8.模拟下磁盘故障,掉盘
root@localhost ~]# mdadm --detail /dev/md0
/dev/md0:
Version : 0.90
Creation Time : Fri Jul 19 22:19:27 2024
Raid Level : raid1
Array Size : 20971456 (20.00 GiB 21.47 GB)
Used Dev Size : 20971456 (20.00 GiB 21.47 GB)
Raid Devices : 2
Total Devices : 1
Preferred Minor : 0
Persistence : Superblock is persistent
Update Time : Fri Jul 19 22:31:55 2024
State : clean, degraded
Active Devices : 1
Working Devices : 1
Failed Devices : 0
Spare Devices : 0
Consistency Policy : resync
UUID : 0794079f:4ce9add0:bfe78010:bc810f04 (local to host localhost.localdomain)
Events : 0.18
Number Major Minor RaidDevice State
- 0 0 0 removed
1 8 16 1 active sync /dev/sdb
## 可以看到,已经有块盘离线了
## 下面我们继续挂载,然后向里面写数据,都是ok的,体现了raid的1高可用性。
[root@localhost ~]# mount /dev/md0p1 /mnt/raid
[root@localhost ~]# cd /mnt/raid
[root@localhost raid]# touch abcd
[root@localhost raid]# ll
总用量 16
-rw-r--r-- 1 root root 0 7月 19 22:34 abcd
drwx------ 2 root root 16384 7月 19 22:24 lost+found
[root@localhost raid]#
因为是raid1 是允许故障一个盘的。
总结
-
了解阵列原理及实现方式,在实际运维中还是很有用处的。
-
软件阵列如果坏了,还是比较难修的,作为理解阵列倒是没啥问题的。
关注微信公众号《运维小路》获取更多内容。