안녕Ȣ16;세요. 고수님 문1032; 사항1060; 1080;Ǻ12; 글 올립니다.160;
1. 1109;비명 : DELL Poweredge XE8545
2. OS : Ubuntu 22.04.5 LTS (GNU/Linux 6.8.0-48-generic x86_64)
3. GPU : 4X A100 80GB SXM4 GPU
4. 드라1060;브 버1204; : 565.57.01 / CUDA Version : 12.7
현1116; 1109;비 사용1473;1064; GPU1032; 1204;/141;1008; 275W/196; 사용1473;1060;고 160;1204;/141; 리0120;트lj16; 최1200; 100W( TDP)에서 최대 275W (TDP)책1221;.104;Ǻ12; 1080;습니다.(4개 모.160; ᇼ1;1068;함)
해NJ17; GPU 확1064; 결과 최대 사용 가능한 1204;/141;1008; 500W(TDP)1064;데 Ǻ12;떻,172; 해야1648; 해NJ17; 1204;/141;1012; 사용할수 1080;lj16;1648;요?
160;
nvidia-smi --query-gpu=name,power.draw,power.limit --format=csv 명/161;Ǻ12; 1077;/141; 후160;
sudo nvidia-smi -pl 300W/196; 새 1204;/141; 값1012; 넣었습니다. (테스트/196; 값1012; 1077;/141;함)
1204;/141; 리0120;트가 .104;Ǻ12; 1080;Ǻ12;
Provided power limit 300.00W is not a valid power limit which should be between 100.00W and 275.W for GPU
00000000:01.00.0 Terminatin early due to privious errors. 라lj16; 메시1648;가 뜹니다.160;
1204;/141; 리0120;트를 풀수 1080;lj16; 명/161;Ǻ12;가 1080;lj16;1648;요?
아니면 드라1060;브 버1204; ǐ12;문에 1204;/141;(TDP)가 1228;한.104;Ǻ12; 1080;lj16;1648;요?
최대치 500W 까1648;lj16; 사용할 수 1080;lj16;1648; 고수님께 문1032; 드립니다.160;
추 신 : 만약 1204;/141; 리0120;트를 풀고 400W~500W를 사용한다면 GPU 0156;열에 문1228;가 생길수 1080;lj16;1648;도 같1060; 문1032; 드립니다.160;
추가1201;1004;/196; 델 ᇼ1;영상1012; 찾아 보니 IDRAC9에서160;
Power Cap Policy 1221;책1060; 1200;7148; 서버에서lj16; 나오1648; 않lj16;데160;
0148;1060;오스 버1204; ǐ12;문에 그런,163;1064;1648;요?
현1116; 사용1473;1064; 서버1032; 0148;1060;오스 버1204;1008; 2.11.3 1077;니다. 160;
현1116; 1200;7148; 서버 상태 1077;니다.160;
ᇼ1;영상 버1204;에lj16;160;
해NJ17; 내용과 같1060; 나오lj16;데 6156;웨Ǻ12; 문1228;1064;1648; 1312;Ǻ16; ǥ12;ᓠ1; 드립나다.160;
Á¦°¡ »ý°¢Çϱ⿡´Â
ÆÄ¿ö´Â 2400W x 4 ¶ó¼ ÃÖ´ë ½ºÆÑÀÌ´Ù.. (ÀÎÅͳÝÀ¸·Î ÇØ´ç ¸ðµ¨ ¸®ºä±ÛÀº º» °á°ú)
Nvidia ¿¡¼ ³ª¿Â ½ºÆÑ¿¡¼´Â TDP´Â ÇØ´ç ¸ðµ¨ÀÌ 400W ÀÎÁö¶ó °¢ GPU´ç 400W ÀÌ»ó Àü±â¸¦ °ø±ÞÇØ ÁÙ ¼ö ÀÖ¾î¾ß ÇÑ´Ù..
TDP´Â ÃÖ´ë Àü·Â »ç¿ë·®ÀÌ ¾Æ´Ï´Ù.. ½ÇÁ¦·Î CPUµç GPUµç TDP ÃÖ´ë »óÅ·Πµ¹¸®°Ô µÇ¸é ½ÇÁ¦ Àü·Â »ç¿ë·®Àº ´õ Å©´Ù..
½Ã½ºÅÛÀº DELL ÀÌ°í ¾Æ¸¶µµ GPUµµ DELL ÆÄÃ÷·Î ºÁ¾ß Çϴµ¥ (´Ù¸¥µ¥¼ ³¹°³·Î ±¸Çؿͼ Â¥Áý±â ÇÑ´Ù¸é ¾îÂîµÉÁö ¸ð¸£Áö¸¸ ¾Æ¸¶ ±â¼úÁö¿øµµ °ÅºÎµÉÁöµµ)
¸ð¶ó¸ð¶óÇØµµ Á¦Á¶»ç°¡ ÇØ´ç ¼¹ö´Â ÀçÀÏ Àß ¾Ë±â¿¡ Á¦Á¶»çÀÇ ±â¼úÁö¿øÀÌ ÀçÀÏ È®½ÇÇÏ´Ù¶ó°í »ý°¢ÇÕ´Ï´Ù..
¾Æ¸¶µµ Æß¿þ¾î ±¸¼ºÀ̳ª ¼ÂÆÃ ¾Æ´Ï¸é ¸î°¡Áö Àü¿ëÆÄÃ÷°¡ ¾ø´Â ±×·± ¹®Á¦ÀÏ È®·üÀÌ Å®´Ï´Ù..
Æß¿þ¾î¿Í ¹ÙÀÌ¿À½º´Â ÃÖ½ÅÀÌ ÁÁ´Ù°í´Â ÇÏÁö¸¸ ÃÖ½ÅÀ̶ó°í ²À ¹ö±×°¡ ¾ø´Ù¶ó°í´Â ´ÜÁ¤ÇÏÁö ¸øÇÏ¸ç º¸Åë ¾ÈÁ¤ÈµÈ ÀçÀÏ ¸¹ÀÌ »ç¿ëµÇ´Â ¹öÁ¯ÀÌ Àֱ⿡
±×°ÍÀÌ ¾î¶² ¹öÁ¯ÀÎÁö ±â¼úÁö¿øÂÊ¿¡ È®ÀÎÇØº¸½Ã±â ¹Ù¶ø´Ï´Ù..
ÆÄ¿ö ¸ðµâ Çϳª°¡ 2400W À̱⿡ Àç´ë·Î Å×½ºÆ® µÇ·Á¸é ´ë·« º®¿¡¼ ³ª¿À´Â µ¶¸³ÀûÀÎ Äܼ¾Æ® 2°³ ±¸¸Û Áß¿¡ Çϳª¾¿¸¸ ²Å¾Æ¼ ÃÑ Äܼ¾Æ® ´ÜÀÚ 4°³°¡ ÇÊ¿äÇÕ´Ï´Ù..
Áï Å×½ºÆ® ȯ°æÀÌ Àú ¼¹ö¸¦ È®½ÇÇÏ°Ô µ¹¸®Áö ¸øÇϴ ȯ°æÀÏ ¼öµµ ÀÖ½À´Ï´Ù..
ÇöÀç ÆÄ¿öÀÇ ¼¹ö »óÅ ȸéÀº 2400 x2 + 2400 x 2 »óÅÂ(2+2)·Î 4800W·Î ¼ÂÆÃµÇ¾î ÀÖ´Â °ÍÀ¸·Î º¸¿©Áö¸ç
¸¸ÀÏ ´Ù¸¥ ¼ÂÆÃÀÌ ÀÖ´Ù¸é 2400 x3 + 2400 »óÅÂ(3+1)·Î ÃÑ 7200W ·Î ¼ÂÆÃÀÌ °¡´ÉÇÒÁö ¸ð¸£°Ú½À´Ï´Ù..
ÀÏ´Ü SXM4 ¸¦ °³Á¶ÇÑ Ä«µå´Â OEM À̶ó°í ÆÇ¸Å¸¦ Çϰíµé Àִµ¥ NVIDIA ¿¡¼ °ø½ÄÀûÀ¸·Î ¸¸µéÁö ¾ÊÀº ¸ðµ¨ ÀÔ´Ï´Ù.
SXM4 ¹æ½ÄÀÇ Ä«µå¸¦ ´Ù ¶â¾î¼ PCIe ·Î Áß±¹¿¡¼ ÀÓÀÇ °³Á¶µÈ ¸ðµ¨À̶ó°í º¸¸é µË´Ï´Ù.
±×·³À¸·Î °³Á¶ ÇÒ ¶§ ¾î¶»°Ô Çß´ÂÁö¿¡ µû¶ó µ¿ÀÛÀÌ ´Ù¸£°Ôµµ µÉ ¼öµµ ÀÖ½À´Ï´Ù.
¿À¸®Áö³¯ A100 80G SXM4 ´Â ÃÖ´ë 400W Àü·ÂÀ» »ç¿ëÇϸç, ¿À¸®Áö³¯ A100 80G PCIe ´Â ÃÖ´ë 300W Àü·ÂÀ» »ç¿ëÇÕ´Ï´Ù.
Ǫ´Â°Ô ¾î·ÆÁö´Â ¾ÊÀºµ¥ Á¦Á¶»ç¿¡¼ ¿Ö Á¦ÇÑÀ» °É¾ú´ÂÁö »ý°¢ÇØ º¸¼¼¿ä