一、什么是FC SAN ?
存储区域网络(Storage Area Network,SAN)采用网状通道(Fibre Channel ,简称FC,区别与Fiber Channel光纤通道)技术,通过FC交换机连接存储阵列和服务器主机,建立专用于数据存储的区域网络。
SAN(Storage Area Network,存储局域网络)的诞生,使存储空间得到更加充分的利用以及安装和管理更加有效。SAN是一种将存储设备、连接设备和接口集成在一个高速网络中的技术。SAN本身就是一个存储网络,承担了数据存储任务,SAN网络与LAN业务网络相隔离,存储数据流不会占用业务网络带宽。
在SAN网络中,所有的数据传输在高速、高带宽的网络中进行,SAN存储实现的是直接对物理硬件的块级存储访问,提高了存储的性能和升级能力。
FC SAN常用架构
二、SAN日常维护介绍
(1)SAN登录方式
1、串口线登陆
1)交换机自带一个串口线。将串口盖拿掉,将串口线连接上去
2)连接串口线到笔记本的串口。
3)打开“超级终端”,配置如下:每秒位数 9600;数据位8;其他默认
4)当超级终端停止报告信息,按“Enter” 显示login信息,login
5)默认用户:admin,默认密码:password。
2、网络连接登陆
用telnet工具通过IP地址登陆。iP地址默认为10.77.77.77。默认用户:admin,默认密码:password
3、Web方式登录
使用浏览器登录http://10.77.77.77,主机需安装java控件。默认用户:admin,默认密码:password
(2)SAN交换机状态灯的指示
一般情况,SAN交换机的端口状态灯有如下情况:
不亮:未检测到信号,需要检查SFP和线缆
绿灯长亮:端口连接正常,但没有数据传输
绿灯慢闪(1秒亮,1秒灭):端口连接,但是连接设备不兼容或端口设置错误
绿灯快闪(1/4秒亮,1/4秒灭):内部环回,用于故障检测
绿灯闪(无规律):连接正常,有数据正在传输
黄灯长亮:端口接收到信号,但未上线(正常状态)
黄灯慢闪(1秒亮,1秒灭):端口或交换机被禁用(disablePort或disableSwitch)
黄灯快闪(1/4秒亮,1/4秒灭):端口故障
(3)日常健康状态检查和日志信息收集
1、检查交换机的外部告警灯
2、检查交换机的内部报错日志
1)Uptime
显示交换机工作时间
检查该交换机当前时钟,目前有几个用户登录到这台交换机,以及它已经正常工作了多长时间等信息。
switch:admin> uptime
07:00:15 up 1143 days, 19:11, 1 user, load average: 0.00, 0.01, 0.04
2)Ipaddrshow
显示交换机IP地址信息
switch:admin> ipaddrshow
3)Licenseshow
显示当前交换机所添加的license信息
4)Switchshow
检查交换机信息及端口状态
switch:admin> switchshow
5)Switchstatusshow
显示交换机运行状态
重点检查如果交换机状态为healthy,则表示交换机当前运行正常,如果有不是healthy的状态出现,则需要根据具体问题使用相关命令继续检查。
6)Firmwareshow
显示微码版本信息
检查交换机当前微码是否符合微码评估要求,是否存在Bug,是否需要升级
firmwareshow:
Appl Primary/Secondary Versions
------------------------------------------
FOS v6.2.1b v6.2.1b
7)Fanshow
显示风扇运行状态
重点检查当前交换机散热风扇状态是否为OK
fanshow:
Fan 1 is Ok, speed is 2045 RPM
Fan 2 is Ok, speed is 2020 RPM
Fan 3 is Ok, speed is 2020 RPM
8)Tempshow
显示交换机当前温度信息
检查当前交换机的温度传感器是否为OK状态
tempshow:
Sensor Slot State Centigrade Fahrenheit
ID
=====================================================
1 1 Absent
2 2 Absent
3 3 Ok 29 84
4 4 Ok 28 82
5 5 Ok 29 84
6 6 Ok 30 86
7 7 Ok 29 84
8 8 Absent
9 9 Absent
10 10 Absent
各部分温度正常(20-50度)(Absent表示插槽为空)。
9)Psshow
显示电源运行状态:
电源状态都是OK则表明电源运行正常,absent表示没有插电源。
psshow:
Power Supply #1 is OK
DELTA DPS1001AB-1EM 23020000603 01 FL2L9018699
Power Supply #2 is OK
DELTA DPS1001AB-1EM 23020000603 01 FL2L9018658
Power Supply #3 is absent
Power Supply #4 is absent
10)Slotshow
显示板卡运行状态
如果板卡状态为ENABLE,则表示此槽位板卡正常
如果板卡状态为VACANT,板卡类型为UNKNOWN,则需要根据具体配置情况检查该槽位是否真的没有插卡,如确实没有插卡,则此状态正常。
slotshow:
Slot Blade Type ID Status
---------------------------------
1 UNKNOWN VACANT
2 UNKNOWN VACANT
3 SW BLADE 36 ENABLED
4 SW BLADE 36 ENABLED
5 CP BLADE 16 ENABLED
6 CP BLADE 16 ENABLED
7 SW BLADE 36 ENABLED
8 UNKNOWN VACANT
9 UNKNOWN VACANT
10 UNKNOWN VACANT
11)Hashow
显示CP板卡HA状态
重点检查active CP板卡和standby CP板卡状态是否为health
检查HA状态是否为enabled和synchronized
switch:admin> hashow
Local CP (Slot 6, CP1): Active, Warm Recovered
Remote CP (Slot 5, CP0): Standby, Healthy
HA enabled, Heartbeat Up, HA State synchronized
12)Errdump
显示错误日志
重点检查错误日志中是否存在ERROR或者WARNING信息
errdump:
Fabric OS: v6.2.1b
2011/06/21-16:36:25, [PORT-1010], 1383, FID 128, WARNING, SW1, Port (ID: 3) QOS is disabled
13)Fabricshow
显示fabric信息
重点检查Fabric信息与实际Fabric中交换机数量是否一致,以及确认交换机是否级联
14)Cfgshow
显示交换机配置信息
检查交换机zoning信息是否符合配置要求
15)Porterrshow
显示交换机端口错误统计
重点关注Crc_Err和Enc_Out报错信息
注意:对于Loss of Sync; Loss of Signal; Enc_Out Error这些报错,客户每次重启主机或存储,重新插拔光纤线,禁用或启用端口等动作都会产生此类报错。当端口进行速率协商时,Enc_Out Errors也会产生。如果设备速率已知,则可以通过portcfgspeed命令来固定端口速率,以便跟踪这个报错是否为端口速率协商所致。根据经验统计,如果Enc_Out报错单独产生很可能是光纤线问题,如果Enc_Out和Crc_Err一起产生则很大的可能是GBIC/SFP问题导致。
16)Portperfshow
可以查看各端口实时流量。
17)Sfpshow
可以查看各端口sfp模块的信息。
18)Supportshow
收集交换机的配置信息,以供分析。
(4)SAN交换机配置备份
实施安装完光纤交换机后、更改光纤交换机配置、在SAN中添加或者更换交换机时、在升级光纤交换机微码之前,都应该对每台光纤交换机配置文件进行备份。配置文件备份的作用主要有以下几个方面:灾难恢复、故障诊断及恢复、恢复一台无效配置的交换机、修改或者扩展SAN、恢复意外删除的许可、恢复或者重配分区配。首先登陆到光纤交换机,如前所述,使用串口登陆或者网络管理口登陆均可用命令“configupload”完成配置文件备份任务,检查配置文件正确可用后请妥善保管。
(5)SAN交换机的开关机
1、直接按SAN交换机面板上的开关键
2、开关机顺序:
开机顺序:存储----->SAN交换机----->主机
关机顺序:主机----->SAN交换机----->存储