中石油

服务器无故重启

1. 系统兼容性问题,HP DL580G4服务器操作系统兼容性不包含Windows2008R2,但由于之前能正常使用,所以没有再去关注这一点。

http://h18000.www1.hp.com/products/quickspecs/archives_Division/12473_div_v1/12473_div.HTML

https://h10057.www1.hp.com/ecomcat/hpcatalog/specs/provisioner/05/410058-B21.htm

2. 尝试升级了服务器硬件微码,但只正常了一天(平时每两个小时重启一次)。

3. 服务器硬件的稳定性,系统死机时,我们发现其中一块硬盘亮黄灯(表明硬盘有问题),开机自检界面也显示硬盘有故障,需要修复或更换,系统能正常启动,硬盘保持亮黄灯状态。 但当我们因排查数据库问题而重启几次服务器之后,又发现该硬盘恢复了正常(亮绿灯)。

4. 使用HP自带的启动光盘对服务器硬件进行整体自检,发现在检测到主板时便死机了。由于怀疑是内存问题导致, 所以我们又使用了单独的内存检测工具对服务器内存进行测试,经过6个小时的检测,内存没有报错。

5. 我们尝试恢复数据库,首先使用chkdsk修复了N个文件不连续的错误,重启之后手动执行SQL语句对问题数据库进行检查和重建, 一些数据库无法进入单用户模式,而且出现不可修复的错误,数据库仍然无法正常开启,因此即使能正常恢复也会丢失大量数据。

  消息 7987,级别 16,状态 1,第 2 行
  系统表预检查: 对象 ID 3 具有不匹配的链链接。(1:264)->next = (1:316),但 (1:316)->prev = (1:3637)。由于不可修复的错误,CHECK 语句已终止。
  wlan_db的 DBCC 结果。
  CHECKDB 在数据库 'wlan_db' 中发现 0 个分配错误和 0 个一致性错误。
  消息 7987,级别 16,状态 1,第 3 行
  系统表预检查: 对象 ID 3 具有不匹配的链链接。(1:264)->next = (1:316),但 (1:316)->prev = (1:3637)。由于不可修复的错误,CHECK 语句已终止。
  wlan_db的 DBCC 结果。
  CHECKDB 在数据库 'wlan_db' 中发现 0 个分配错误和 0 个一致性错误。

结论为:

  1. 可以肯定的是服务器硬件工作不稳定,不排除主板的原因。
  2. 数据库由于没有备份,而当前的数据又大量损坏,已经很难恢复或将花费大量时间,即使能恢复也会不完整。

https://technet.microsoft.com/zh-cn/library/ms365257%28v=SQL.110%29.aspx?f=255&MSPPError=-2147217396

首頁/2015-11-25 (last edited 2016-03-07 01:25:16 by localhost)