[VMWare] ESXi PSOD가 또 발생했습니다.

B4TT3RY   
   조회 1437   추천 0    

 

라이젠 3600 + B450M 보드 + 삼성 PC4-21300 16기가 x 2 설치되어 있습니다

오버클럭 안되어있구요 로그 상에 나오는 Win10 이라는 VM에는 브라우저 탭 두개만 열려있는 상황이였습니다

원인을 알 수 있을까요..?


maronet 01-19
PSOD는 거의 대부분 하드웨어, 디바이스 드라이버+펌웨어 오류로 발생합니다.
메모리 검사부터 빡쎄게(전체영역, 몇시간 정도) 한번 해보시는거 추천드립니다.
     
B4TT3RY 01-19
혹시 어떤 방식으로 체크해야 할까요?
이전에 테스트 했던 방식인 memtest86+ USB 부팅으로 체크해도 되나요?
          
maronet 01-19
네 그거로 제일 시간 오래걸리는 방식으로, 몇시간 걸어 놓아보세요.
               
B4TT3RY 01-19
넵! 일과시간동안엔 써야하니 새벽에 걸어놔봐야겠네요..
                    
박문형 01-19
가능하시면 몇 일 걸어보세요..

저는 메모리 점검할 때 1주일까지 논스탑으로 돌려본 적이 있습니다..

이렇게 오래 돌리는 면 에러 나는 메모리 걸러내거나 시스템의 안정도를 어느 정도 짐작할 수 있습니다..
                         
B4TT3RY 01-20
아하.. 아얘 날을 잡아야되겠네요 참고해보겠습니다 감사합니다!
dateno1 01-19
혹시 삼벯제 NVMe 쓰신다면 WD제로 바꾸어보세요

삼벯제 컨트롤러는 Windows를 제외한 모든 OS랑 안 친해요 (애초에 저장장치로 인식된것만 해도 다행이고, 모델에 따라 운 나쁘면 인식조차 안 함)
     
B4TT3RY 01-19
그냥 개인 홈서버라 돈을 더 들이긴 그래서... Hyper-V로 넘어가는건 어떨까요?
          
maronet 01-19
기본 하드웨어 문제는 소프트웨어로 해결 안됩니다.
epowergate 01-19
VMWARE HCL이 아니기 때문에 뭐 그런가 보다 하고 사용하셔야 합니다.
     
B4TT3RY 01-19
ㅜㅜ 그런가보군요..
          
maronet 01-19
그래도 x86 구조는 동일하기 때문에 비공식적으로 기본 호환성은 깔고갑니다.
저 조합이 기본호환에 문제가 있다면, 구글검색에서 쓰지말란 말 나왔을겁니다.
               
epowergate 01-19
workstation도 아니고 ESXi입니다.
그냥 볼것도 없이 사용하면 않되는 겁니다.
문제가 발생하면 그냥 발생하는구나 하는 거지 원인 찾고 어쩌구 할 필요 없는거구요
                    
maronet 01-19
홈랩 상황을 프러덕션 시각에서 보실건 아닌 것 같습니다.
Parabellum 01-19
바이오스 업데이트+램 오버클럭 해제는 해보셨나요.
     
B4TT3RY 01-20
베타 제외하고 최신 바이오스이며 오버클럭 일체 안들어가있습니다!
모어쿨 01-19
전에도 제가 말씀드렸지만 CPU불량일것 같고 CPU불량이 아니라면

ESXi 에서 설정한 CPU Scheduling 이 문제가 되는겁니다.
개인용 ESXi 수준에서 VM별로 CPU 스케쥴링을 따로 설정할 필요성이 없으면 단순히 할당 코어/소켓 수만 지정하시고 나머지는 기본값을 변경하지 마십시요
NUMA 설정같은것을 VM단위로 별도로 사용하시려면 vmware에서 인증한 서버하드웨어를 사용하시는게 좋습니다.
     
B4TT3RY 01-20
항상 코어/소켓 만 설정하고 다른건 건들지 않았습니다.. CPU 불량이라기엔 메인으로 잘 쓰던거라 그냥 안맞나보다 하려고 합니다
maronet 01-19
KB도 한번 참고해서 보세요. 왜 하드웨어 테스트를 해야하는지 아실 수 있을 겁니다.

https://kb.vmware.com/s/article/2071752
     
B4TT3RY 01-20
감사합니다!
송주환 01-19
1. 하드웨어 이슈일 가능성이 높습니다. AMD CPU를 사용중이니 더욱 그렇구요.
2. 해당 에러 코드는 커뮤니티에서 도움을 줄 만한 것이 거의 없습니다. 근본적인 원인 파악을 위해서는 VMware에 서포트 티켓을 발행해야 하는데, HCL에 없는 하드웨어기 때문에 아마도 지원이 거절될 것입니다.
3. 같은 질문을 계속 올리시는데, 지금까지 달린 댓글들에서 workaround를 시도해 볼 수 있을 것입니다. 모든 시도가 실패했다면 이번 기회에 인텔 계열 시스템으로 변경하시는 것을 권장합니다. 제온 CPU면 더 좋고, 벤더 시스템이면 더더욱 좋습니다.
     
B4TT3RY 01-20
지금까지 다 다른 상황에서 난 오류였으며 현재까지는 계속 실패하고 있는 상황입니다... 의견 감사합니다!
B4TT3RY 01-20
현재 오류가 자주 뜨는 VM의 설정 하나가 의심되어 수정해두고 지켜볼 예정입니다!
     
maronet 01-20
vm 설정과는 99% 관계 없습니다. psod 트러블슈팅은 기본적으로 하드웨어 관련 요소부터 점검하는게 가이드입니다. vm 손대는 것은 거꾸로 하시는 겁니다.
cpu는 다르나 1700+b450+64g+nvme 구성으로 전 잘 썼었습니다.
          
B4TT3RY 01-20
하드웨어와 관련이 있다고 생각했던 문제라 3~4일 정도는 지켜보려구요

r8168 드라이버를 설치해놓고 사용중인데 Win10 이라는 VM 하나만 네트워크가 E1000e로 에뮬레이팅 되고있어서 절전이라거나 관련 부분으로 PSOD가 터지는게 아닌가 하고 의견 주신분이 있어서요

다른 윈도우 VM이나 리눅스 VM은 전부 vmxnet3을 사용중이길래 한번 수정해놔봤어요

며칠만 지켜보고 안되면 하드웨어 교체라도 해보던가 해야죠 ㅜㅜ
               
maronet 01-20
ESXi의 드라이버 수준에서 문제가 발생한 것이라면, PSOD 화면 메시지에 저렇게 게스트머신 이름이 아니라 커널 관련 내용이 찍혀 나옵니다.




제목Page 4/113
2015-12   59713   백메가
2014-05   3444496   정은준1
01-19   1438   B4TT3RY
01-11   2501   하하캔디
01-11   1345   B4TT3RY
01-08   1232   아름다음파파
01-05   1362   B4TT3RY
01-05   1255   bumworld
01-04   1137   bumworld
01-04   862   winner712
01-02   1200   moriss
2021-12   1253   K007
2021-12   1250   osthek83
2021-12   1831   samsss
2021-12   1484   정의석
2021-12   1888   범이님
2021-12   1537   정의석
2021-12   1534   spider00
2021-12   2203   발포비타민
2021-12   1485   v천소유v
2021-12   2024   범이님
2021-12   1764   스피드758