51CTO下载-SUN日常预防性维护手册v1.1(1)(3)
时间:2025-07-09
时间:2025-07-09
预防性维护(巡检)是相对于被动式的维修服务,预防性维护提供对客户的计算环境主动的预防性的检查。通过预见及预防系统可能发生的硬件故障或严重的性能瓶颈等,可以很大程度地提高计算环境的可用性。
巡检时遇到故障如何处理?
如果是属于硬件或者操作系统方面的故障,请准备好设备PN、SN,联系华胜天成8008100583热线或者当地工程师电话报修。
以下对维护中的具体内容逐条进行解释:
第一部分:系统硬件运行状况检查 1、系统外观检查
查看主机、阵列面板上是否有repair指示灯呈黄色,如有需进一步确认或
者拨打800热线报修。
退出命令方式:ctrl + c 键,可以退出该命令操作。 2、系统硬件配置
CPU频率:
例,以root 用户登陆主机:
#/usr/platform/sun4u/sbin/prtdiag –v|more 显示如下: System clock frequency: 84 MHZ 显示CPU的时钟速度为84 MHz CPU数量:
例,以root 用户登陆主机:
#/usr/platform/sun4u/sbin/prtdiag –v|more 显示如下:
===================== CPUs ==================================== E$ CPU CPU Temperature CPU Freq Size Impl. Mask Die Ambient --- -------- ---------- ------ ---- -------- --------
0 502 MHz 256KB US-IIe 1.4 72 C 44 C 2
显示系统中CPU的数量为1颗
硬盘容量:
以root 用户登陆主机: #iostat –E 显示如下:
sd8 Soft Errors: 0 Hard Errors: 0 Transport Errors: 0 Vendor: FUJITSU Product: MAN3184M SUN18G Revision: 1804 Serial No: 0230Z58654
RPM: 7200 Heads: 19 Size: 18.11GB <18110967808 bytes>
显示硬盘sd8大小为18G,若Hard Errors不为0,则需要观察该盘。 硬盘数量:
以root 用户登陆主机: #format
Searching for disks...done
AVAILABLE DISK SELECTIONS:
0. c0t0d0 <SUN18G cyl 7506 alt 2 hd 19 sec 248> /pci@1f,4000/scsi@3/sd@0,0
1. c0t1d0 <SUN18G cyl 7506 alt 2 hd 19 sec 248> /pci@1f,4000/scsi@3/sd@1,0
2. c1t9d0 <SUN18G cyl 7506 alt 2 hd 19 sec 248> /pci@1f,4000/pci@2/SUNW,isptwo@4/sd@9,0 3. c1t10d0 <SUN18G cyl 7506 alt 2 hd 19 sec 248> /pci@1f,4000/pci@2/SUNW,isptwo@4/sd@a,0
4. c2t9d0 <SUN36G cyl 24620 alt 2 hd 27 sec 107> /pci@1f,4000/pci@4/SUNW,isptwo@4/sd@9,0 5. c2t10d0 <SUN18G cyl 7506 alt 2 hd 19 sec 248> /pci@1f,4000/pci@4/SUNW,isptwo@4/sd@a,0 共5块硬盘,若出现unknown关键字,则表示硬盘有故障。
内存容量
例,以root 用户登陆主机:
#/usr/platform/sun4u/sbin/prtdiag –v|more 显示如下: =============== Memory Configuration ====================== Segment Table:
---------------------------------------------------------- Base Address Size Interleave Factor Contains ----------------------------------------------------------- 0x0 256MB 1 Label DIMM0 0x20000000 256MB 1 Label DIMM1显示系统内存大小为2*256M 4、系统硬件运行状况
以root 用户登陆主机:
#psrinfo 显示如下:
0 on-line since 10/24/04 11:45:53 表示1个cpu,若不显示为on-line,则cpu故障 以root 用户登陆主机:
#vmstat 2 5(间隔2秒显示5次统计数据)
procs memory page disk faults cpu
r b w swap free re mf pi po fr de sr dd f0 s0 -- in sy cs us sy id
0 0 0 741272 201352 63 14 0 2 2 0 0 1 0 0 0 4294967241 100 247 5 17 78
0 0 0 733232 242800 0 3 0 0 0 0 0 0 0 0 0 306 26 59 0 0 100
0 0 0 733232 242800 0 0 0 0 0 0 0 0 0 0 0 302 76 54 0 0 100
0 0 0 733232 242800 0 0 0 0 0 0 0 0 0 0 0 304 20 52 0 0 100
0 0 0 733232 242800 0 0 0 0 0 0 0 0 0 0 0 304 16 54 0 0 100显示信息解释如下:
r 指每秒钟增加到运行队列中的线程数
b 指每秒钟因等待资源或I/O而被添加到等待队列中的线程数 us 指CPU处在用户模式销的时间百分比,即用户使用的CPU时间 sy 指CPU处在系统模式下的时间百分比,即系统内核使用的CPU时间 id 指CPU空闲的时间百分比,即运行队列是空的 如果id一直是0,则说明CPU一直处于繁忙状态
运行队列的大小是评估CPU性能的关键因素。当运行队列增大,用户的
响应时间就会加大;如果r的值不为零,则说明CPU还有更多的工作要执行
如果us+sy小于90%,单用户系统并不关注CPU的限制。如果在多用户
系统上us+sy超过了80%,进程可能把时间花在运行队列中等待获得CPU资源上,因此响应时间和吞吐量就变得很小
如果在多用户系统上us+sy接近100%,说明可能是CPU的限制
以root 用户登陆主机
#/usr/platform/sun4u/sbin/prtdiag –v|more
=================== Memory Configuration ============================ Segment Table:
-------------------------------------------------------------------- Base Address Size Interleave Factor Contains
-------------------------------------------------------------------- 0x0 256MB 1 Label DIMM0 0x20000000 256MB 1 Label DIMM1 若不能看到size大小,则表示内存故障
所有分区的使用空间容量如果大于90%,说明磁盘空间即将不够,需要进行
无效文件清理。 #df -k 显示如下
上一篇:雷公山银球茶
下一篇:春苗网知识竞赛、绘画比赛