《 Stratus ftServerWindows 现场人员快速诊断维护手册 》

《 Stratus ftServerWindows 现场人员快速诊断维护手册 》

  

                                                    目 录

一、状态查看... 2

1、现场机器物理状态灯查询... 2

2、运行状态检查... 7

3VTM带外管理检查... 11

二、异常情况报告... 12

1Site ID 获取... 12

2Windows系统... 12

3Redhat Linux 系统... 14

4VMware 系统... 14

三、附:Stratus ftServer容错机硬件说明... 16

1ftServer前视图... 16

2ftServer后视图... 16

四、附:运行状态及原因说明... 17

 

 

 

 

 

 

 

 

 

一、状态查看

1、现场机器物理状态灯查询

(1)   系统提示灯

 

            电源灯:  绿灯常亮 = 已加电。

绿灯熄灭 = 未加电。

            故障灯:  熄灭 = 系统工作正常(或者未加电)

黄色常亮 / 黄色闪烁 = 请求服务。(请立即联系客服工程师)

          容错状态灯:  绿灯常亮 = 系统双工容错状态。

绿灯闪烁 = 系统正尝试使CPU-I/O模块进入全双工状态。

熄灭 = 系统单工运行,非容错状态(请立即联系服务工程师)

            系统识别指示灯   蓝灯常亮 =系统ID 识别命令正运行。

蓝灯闪烁 = 远程管理系统ID 识别命令正运行。

 熄灭 = 没有系统ID 识别命令正运行。

 

2)刀片运行指示灯状态

上层:

下层:

 

说明:

 电源灯: 绿灯常亮 = DC电源工作正常。

              绿灯闪烁 = AC供电,DC电源没有,系统处于待机状态(电源按钮没有按下)

  Safe to Pull:     绿灯常亮 = 可以安全拔出该模块。

                        绿灯闪烁 = 不能拔出该模块!!! (请立即联系 客服工程师)

        绿灯常亮 = 此模块中的I/O单元是主控,提供输入、输出功能。

       熄灭 = 此模块中的I/O单元处于备份控制状态。

 

(3) 细分指示灯

指示灯熄灭  =  工作正常

指示灯亮起  =  请求服务 (请立即联系 客服工程师)

指示灯说明,请参考《Stratus ftServer 容错机日常操作手册》

(4)       内部磁盘指示灯

 

²  磁盘状态灯位置

 

             

工作运行状态(双工,单工,故障)

       磁盘读写状态

 

²  磁盘状态灯描述

  指示灯熄灭: 全双工或空闲, 可以安全移除。

  绿灯闪烁: 正常读写操作。可以移动该磁盘。

  黄灯、或黄绿灯交替 闪烁不可移动该磁盘!!(请立即联系客服工程师)

  固定红色, 该磁盘有故障, 请求服务。

更多说明,请参考《Stratus ftServer 容错机日常操作手册》

 

 

(5)   网卡指示灯

 

u  VTM端口

  )。

左上角活动状态指示灯     绿灯常量 = 物理连接正常,无数据传输。

                       绿灯闪烁 = 物理连接正常,有数据传输。

                        熄灭 = 没有物理连接, 检查网线(或联系客服工程师)

右上角连接速率指示灯    绿灯常量 = 端口速度100Mbps

 绿灯闪烁 = 端口速度1Gbps

  熄灭 = 端口速度10Mbps

u  以太网端口

 ( )

(左上角)活动状态指示灯     绿灯常量 = 物理连接正常,无数据传输。

                           绿灯闪烁 = 物理连接正常,有数据传输。

                            熄灭 = 没有物理连接, 检查网线(或联系客服工程师)

(右上角)连接速率指示灯     绿灯常量 = 1GB端口,连接速率为100Mbps

10GB端口,连接速率为10Gbps

 黄灯常量 = 1G端口, 连接速率为1Gbps

    10GB端口,连接速率为1Gbps

 熄灭 = 1GB端口,连接速率为10Mbps

10GB端口,连接速率为100bps

 

 

(6)   HBA

指示灯说明:

   没有加电

   加电, firmware 没有初始化。

   同时闪烁:加电,firmware 初始化,没有建立连接或连接中断;

               顺序闪烁: 检测到firmware故障。(请立即联系客服工程师)

   8GB Link;空闲。

    8GB Link;数据在传输。

    4GB Link;空闲。

    4GB Link;数据在传输。

    2GB Link;空闲。

   2GB Link;数据在传输。

 

 

2、运行状态检查

点击运行桌面的 图标。并展开该图形窗口。分别检查CPUIO,逻辑磁盘的工作状态

 

a)    CPU 的运行图标和状态

查看双工图标和状态描述(Duplex

 

b)  IO Enclosures的运行图标和状态

对于有如下告警 图标。需要分别点击对应的选项卡,查看具体原因。

对于有如下 错误提示的图标。要重点检查原因和问题(例如光纤卡、以太网,内部磁盘等)。

 

l  光纤端口未连接提示

 

 

l  正常连接以太网端口

 

l  未连接网线以太网端口

 

l  正常工作的内部磁盘RDR 状态(磁盘镜像Duplex状态)

 

l   单工运行的内部磁盘RDR 状态Simplex

需要检查磁盘故障,并联系客服。

 

 

 

 

3VTM带外管理检查

登录到每台机器的VTM带外管理界面

http://带外管理IP address

  Login: ADMIN

  Password: ADMIN

 

正常情况下VTM 显示:

(上图红色圆圈的文字说明了系统的运行状态,如果发现显示信息不对,说明系统状态存在告警,并请通过Windows 桌面上的ftSys Management Tools 查看具体告警的位置和设备,并请立即联系客服

二、异常情况报告

如果“状态查看”中有异常情况出现, 请立即联系客服工程师,并请按照如下说明进行采集容错机信息(Site ID)及日志文件

 

1Site ID 获取

Site ID 位于机身后部右下角的标贴上,见下图:

 

2Windows系统

对于机器中出现Simplex状态或错误标志 必须及时检查,尽快报告并进行修复或更换

 

l  运行目录文件获取日志信息

C:\Program Files\ftSys\CustomerService\Support Tools\ftDataCollector

 

选中 , 然后按

 

 

l  日志文件存放的路劲和文件名

 

运行结束。按

 

 

l  然后将上面目录下的压缩目录文件保存并传送给客服。

 

 

3Redhat Linux 系统

执行:

#/opt/ft/sbin/buggrabber.pl

 

收集的数据会保存在以下目录中。

/home/BugPool/

 

4VMware 系统

log in管理机器(ftsysmgt,缺省用户名/口令:root/ftServer)执行:

#/opt/ft/sbin/buggrabber.pl

 

收集的数据会保存在以下目录中。

/tmp/BugPool/

 

 

三、附:Stratus ftServer容错机硬件说明

1ftServer前视图

1  CPU 单元 0, I/O 单元 10                    7  服务器前面板指示灯

2  CPU 单元 1, I/O 单元 11                    8  USB 接口

3  机器识别 ID 按钮                     9  服务器前面板集成单元

4  模块运行状态指示灯                  10  电源按钮

5  NMI (dump) 按钮                              11  内部磁盘驱动器插槽 (16)

6  DVD 驱动器                                               12  固定及拉出模块把手 (4)

 

2ftServer后视图

1  USB 接口 (3)                                                  8  电源指示灯 (2)

2  Modem 调制解调器                                     9  集成以太网接口(100M/1000M) (4)

                                           10 集成以太网接口(1000M/10G)  (4)

3  PCI 适配器 slot 3 (Pie).                  11  CPU-I/O 模块蓝色系统 ID LED (2)

4  PCI 适配器  slot 4 (Pie).                 12  VTM 接口 (2)

5  PCI 适配器 slot 1 (Pie)                      13  系统背板

6  PCI 适配器 slot 2 (Pie)                      14  串行口 (2)

7        CPU-I/O 模块电源接口 (2)              15  VGA (监视器) 接口

四、附: 运行状态及原因说明

附件1: 设备运行状态说明

Code

 运行状态值

说明

1

UNKNOWN

部件的状态可能无法确定。

2

EMPTY

设备插槽中无设备或设备未加电。

3

REMOVED

设备在插槽中,但电源未打开并且该设备停止服务。

4

SHOT

部件设备有故障,系统逻辑将其推出服务,该部件设备与其它系统设备电子隔离。

5

BROKEN

部件设备有故障,会在故障原因表中说明。这是最终状态,用户必须采取行动,将其脱离BROKEN状态,如BringUpBringDownRemove该设备。

6

DUMPING

CPU单元正在恢复系统崩溃信息。

7

DIAGNOSTICS

设备正在检查之中。

8

DIAGNOSITCS_PASSED

设备检查通过。

9

INITIALIZING

软件准备将设备带入到Online状态。

11

FIRMWARE_UPDATE

正在修改主板的固件。

12

FIRMWARE_UPDATE_COMPLETE

主板部件修改完成。

14

OFFLINE

设备单元被停止运行。

15

STOPPED

设备驱动停止,部件不在运行。

19

ONLINE

设备单元可以使用。

20

SIMPLEX

单工。

设备单元在线,但没有配对部件。移除该部件系统不安全,但可以移除配对的部件。

21

DUPLEX

 

双工。

设备单元在线,配对部件以锁步、镜像、或故障恢复方式工作。该部件或配对的部件可以被安全移除。

 

 

附件2:设备运行原因说明

Code

 运行状态值

说明

1

UNKNOWN

原因未知。

2

NONE

没有原因。

3

BELOW_MTBF

当前的MTBF是少于对该设备的MTBF设置。

4

DIAGNOSTICS_FAILED

部件设备检测失败。

5

HARDWARE_INCOMPATIBLE

部件设备与在线的设备不兼容。

6

HOLDING_DUMP

启动失效,Dump进行中。

9

MEDIA_DISCONNECT

连接线被拔出,设备单工状态。

10

FIRMWARE_BURN_FAIL

模块主板的BIOSfirmware固件修改失败。

11

FIRMWARE_FILE_NOT_FOUND

输入个Firmware文件路径不对或文件不存在。

12

FIRMWARE_FILE_ERROR

磁盘上的firmware影像文件有错。

13

FIRMWARE_PROM_ERROR

不能完成firmware的擦写。

14

AUTOBURN_DISABLED

新的模块的BIOSfirmware与在线模块的不匹配。

16

PRIMARY

对双工设备,该设备在配对中为主设备。

17

SECONDARY

对双工设备,该设备在配对中为从设备

 

    • Related Articles

    • Stratus Ztc 资料

      Stratus Ztc 资料
    • Stratus everRun安装文档V2.0

      Stratus everRun安装文档V2.0
    • Stratus容错everRun SplitSite中文资料

      Stratus容错everRun SplitSite中文资料
    • Stratus everRun常规操作文档

      Stratus everRun常规操作文档,everRun的日常操作,一部分配合日常维护文档。
    • Stratus ftServer - 2810-4810-6810 容错硬件服务器资料

      Stratus   ftServer 集成了硬件、软件和服务,是一种 操作简单的平台,可使您的应用程序保持正常运行, 而不会出现停机或数据丢失。 ® 在当今的业务环境中,时间非常重要。如果超出了您 的恢复时间和恢复点目标,可能会产生广泛的经济、 安全和法律后果。在某些情况下,无论从故障中恢复 的速度有多快,都不是理想的解决办法。企业需要故 障预防 – 而不是故障恢复。 在这些分布式位置,不仅需要关键应用程序具有持续 可用性,而且支持这些服务的基础设施必须由非技术 ...