DISK 장애순간 서버 리부팅

   조회 830   추천 0    

HP DL380G10입니다.

OS용으로 2.5" SSD 2개를 Mirror로 사용하는데 1개가 장애가 발생했습니다.

Raid Controller는 P816i-a 입니다.  SSD는 SATA입니다.

그런데 바로 그 순간에 서버가 리부팅을 했습니다.

혹시 원인이 뭔지 아시는분 계실까요?

ILO Log는 HDD 장애 말고는 깨끗합니다.

짧은글 일수록 신중하게.
박문형 03-04
남아 있는 SSD 1개도 분리해서 확인하면 불안할 수 있습니다..(배드섹터 등)

우선 리빌딩이 성공해야 할텐데요..
     
epowergate 03-04
HP Proactive Carepack 들어간 장비인데 엔지니어들이 하늘만 처다보고 있다고 합니다.
박문형 03-04
에구 고생 많으십니다..

아마도 대기업 운영 총괄 정도가 째려 보고 있을 듯한데...
     
epowergate 03-04
네 그렇습니다.
더 무서운건 그 대기업의 고객도 있습니다.
ZSNET5 03-04
로그를 봐야 알지 아무도 모릅니다.
ILO 로그에 없다면 OS쪽 로그를 봐야지요.(거기도 별 내용이 없을것 같다는데 한표..)
     
epowergate 03-04
HP의 TAM (Technical Account Manager)가 불려같는데 헛소리 했다가 빼도박도 못하는 상황입니다.
장애 발생하면 무조건 원인분석 보고서 작성해야 하는데 적당히 뭉개려다가 벌받고 있습니다.
납품할때 서버당 대략 250만원씩 주고 이런저런 carepak 다 집어넣었는데 벌벌떨고 있습니다.
곧 미국에서 엔지니어들 줄줄이 불려오게 생겼습니다.
대략 90대 정도 납품했는데 90 * 250만원 = 2억 조금 않되는 비용 지불했었습니다.
이번에 그 가치 하는지 보겠습니다.
덕택에 저는 좀 편합니다.

교훈:  고객앞에서 말조심하자
박문형 03-04
거기 고객은 실무가 박사급은 넘어갈 터이니 조심해야죠..(실제 박사들도 포진되어 있을 것이고)

우선 레이드 카드와 서버의 로그 받아서 로그분석이 1차라고 생각됩니다..

제가 생각되는 페턴은

이런 현상 첨봤다!!! 라는 식으로 끌고 가던지

레이드 카드와 백플레인 그리고 SSD 펌웨어를 주기적으로 업해야 하는데 그것을 안해서 이런 사단이 났다 라는 식으로 끌고 갈 듯합니다..


어쨌던 빨랑 리빌딩이라도 되서 정상이 되야 할텐데 SSD 1개로 버티기야 하겠습니다만 이것도 한계가 있을 듯하니...

무난하게 잘 해결되기를 기원합니다...
과암 03-04
ADU 떠가지 안았나요?
ADU 로그에는 뭔가 있을겁니다
hpe ISS 엔지니어 얼굴 몇몇이 흘러가네요 ^^
누굴까요? ^^
김황중 03-04
일예의 케이스로
정상인 디스크가 남아있어도
기존 장애난 디스크로 인한 레이드카트 락킹 현상이
원인이 아닐까 합니다

물론 벤더 서버가 이러면 않되지만
다수의 정상디스크와 같이물린
장애난 디스크 1개가 레이드를 락킹 시키면 않되지만
예전부터 아주 가끔 간헐 적으로 종종 생기고 있었지만
새로운 제네레이션이 나와도 이 현상은 종종 발견 되었습니다

참고로 iILO 로그만 보지마시고
IML. AHS. OS LOG를 동시에 보면서
시간 타임으로 조합해 보시면 답 나올듯 싶네요

참고로 아무리 본사 엘리베이션 해봐야
OS LOG와 비교 분석은 않해주더군요...^^;;


PS. 사람은 거짓말을 하지만
하드웨어는 거짓말 않합니다
구리구리 07-08
DELL 2950에서 2.5인치 디스크 갈다가.. 리빌드 안돼고 OS행걸리면서 날려 먹은적 있습니다.
뭐 갈다가 덤탱이는 제가 썼지만... 아.. 역시... 케어팩 높이니까 좋군요...
저도 비슷한 상황이 있었는데.... 고객은 내가 지원이 안좋다고(내장비도 아닌데..)  영업 부르고 영업은 나(기술지원)한테 뭐라 그러고 싸움은 영업이랑 내가 하고.
아... 밥숟갈이 너무 무겁네요...




QnA
제목Page 150/4505
2014-05   2827252   정은준1
2014-04   2527965   회원K
03-25   904   twopaik
03-25   803   멜타돗
03-25   856  
03-25   920   NickPunk
03-25   733   NickPunk
03-25   907   NickPunk
03-25   888   뚜뚜김대원
03-25   771   하종범
03-25   834   Win31
03-25   724   팬도라
03-25   1001   refreshair
03-25   784   이용훈
03-24   867   김건우
03-24   682   전진
03-24   703   전진
03-24   864   봉래
03-24   837   전진
03-24   931   앙드레준
03-24   1010   isaiah
03-24   809   서버하거파