您现在的位置: 捷凌网安 >> 认证考试 >> Linux认证 >> 正文
Linux系统“死机”时怎么办?

作者:佚名 责任编辑:左决 点击数: 更新时间:2008-2-21 6:31:02

如果问题能够再现,那么问题已经解决 80% 了。对于操作系统核心而言,如果有问题的再现方法,那么可以说是已经解决 99% 了。经常遇到的问题是系统可以正常运行一段时间,然后死机。如果不好再现问题,那么只有根据死机现场遗留的东西来进行分析了。

如果系统没有死干净,比如磁盘中断和文件系统是好的,那么也许能有日志信息保留在文件中,不过这样的好运气我是从来没有遇到过的。如果键盘中断还能响应 (按下Num Lock,可以看见键盘小灯亮灭),那么运气就算是足够好了,这时可以祭出 sysrq 大法,同时按下 Alt-Sysrq-T 获得进程系统堆栈信息,按下 Alt-Sysrq-M 获得内存分配信息,按下 Alt-Sysrq-W 获得当前寄存器信息。

linux/Documentation/sysrq.txt。另外,最好关闭终端的自动 blank 功能,这样系统死的时候至少能从屏幕上看到一些信息。设置方法是:

# echo 1 > /proc/sys/kernel/sysrq

# setterm -blank

这两个设置最好加到系统启动脚本中 (比如 /etc/rc.d/rc.local),保证每次启动都能得到运行。

如果很不幸,键盘也死悄悄了,(更为不幸的是,这种情况很常见),那么也不是只有等死一个办法,这时可以用串口终端 (serial console)将系统信息发送

到另一台系统上,这样可以通过对这些信息分析来定位问题。设置方法如下:

准备工作

1. 一台被监视的服务器,一台进行监视工作的PC。

2. 一根串口直连线。

配置

1. 在服务器上,加入一个新的 grub 项目,增加核心参数 "console=ttyS0 console=tty1",如:

kernel /boot/vmlinuz-2.4.21-9.30AXsmp ro root=LABEL=/1 console=ttyS0

console=tty1

2. 在服务器上,修改 /etc/sysconfig/syslog,加入 klogd 选项 "-c 7",保证更多内核信息得到输出。如:

KLOGD_OPTIONS="-x -c 7"

3. 重新启动服务

4. 用串口直连线连接两台机器,测试:

1) 在PC上运行 "cat /dev/ttyS0",在服务器上运行 "echo hi > /dev/ttyS0",看在 PC 上是否有 "hi" 输出。

2) 在PC上运行 "cat /dev/ttyS0",在服务器上运行 "echo w > /proc/sysrq-trigger",看 PC 上是否有相应内核信息输出。

3) 在PC上运行 "cat /dev/ttyS0",在服务器上运行 "modprobe loop",看 PC 上是否有相应内核信息输出。

5. 如果测试通过,那么在 PC 上运行:cat /dev/ttyS0 | tee /tmp/result

另外,也可以用 Windows 超级终端获得串口信息。

that's IT.

此外,一些核心支持 LKCD, netdump 等调试功能,也可以一试。

剩下的,就只有靠经验和运气了,一般造成 Linux 系统死机的原因有:

系统硬件问题 (SCSI 卡,主板,RAID 卡,网卡,硬盘...)

外围硬件问题 (终端切换器,网络...)

软件问题

驱动 bug (去找更新的驱动试试)

核心系统 bug (去 LKML 上看看,或换个核心试试)

系统设置

最后,google一把。有时候你可以直接输入 "Linux 系统死机怎么办?"

PE6650 经常死机",看有没有人遇到过和你同样的问题。即使没有找到,也是一个有助于分析问题的信息,至少说明你的系统可能有和其他人不同之处。

调查 Linux 系统死机问题,这既是科学又是艺术,牵扯到众多的硬件软件知识和经验,是一个不断学习的过程。

  • 上一篇文章:

  • 下一篇文章: 没有了
  •  
    最进更新
    推荐文章新生代JAVA程序员的思想03-14
    普通文章java程序员面试必备的32个要03-14
    普通文章学习Acegi-认证(authenticat03-14
    普通文章SCJP 310-035考试心得03-14
    普通文章Java认证权威问答精华集03-14
    普通文章SCJP考试题310-02503-14
    推荐文章国内Java培训机构品牌化之路03-14
    普通文章Java认证SCJP考试四折优惠03-14
    普通文章SUN SCJP考试优惠活动03-14
    推荐文章2007年8月最新版CCNA注册方法03-07
     
    推荐文章
    推荐文章新生代JAVA程序员的思想03-14
    推荐文章国内Java培训机构品牌化之路03-14
    推荐文章2007年8月最新版CCNA注册方法03-07
    推荐文章MCSE认证考试全程心得02-28
    推荐文章SCSECA认证新增Solaris10安全02-21
    推荐文章认证介绍-2004年考Linux必备02-21
    推荐文章高手攻关心得:RHCE实战详细经02-21
    推荐文章中国Linux培训炙手可热 人才02-21
    推荐文章2003年4月三级PC技术试题分析02-19
    推荐文章Oracle数据库简介02-19
     
    热点文章 
    普通文章java程序员面试必备的32个要03-14
    普通文章学习Acegi-认证(authenticat03-14
    普通文章Java认证权威问答精华集03-14
    推荐文章国内Java培训机构品牌化之路03-14
    普通文章Java认证SCJP考试四折优惠03-14
    普通文章CCNA认证英文词汇中文解析--03-07
    普通文章微软开展2007“一次不过,免02-28
    普通文章微软Windows Server 2008认证02-28
    推荐文章MCSE认证考试全程心得02-28
    普通文章强档贡献:MCSE 2003最新学习02-28

    | 设为首页 | 加入收藏 | 联系站长 | 广告服务 | 友情链接 | 版权申明 | 网站地图 |

    在线交流 捷凌网安主群:51649627
    Copyright 2007-2008 © 捷凌网安. All rights reserved.
    备案序号:蜀ICP备08001812号