¿©±â´Â dual xeon E5-26xx V4 cpu ¾²½Ã´Â ºÐµé ¸¹ÀÌ °è½Ã°ÚÁö¿ä? Ȥ½Ã º¥Ä¡¸¶Å© ºñ±³°¡ °¡´ÉÇÒ±î¿ä?
안녕Ȣ16;세요. 1068;1452;1068; 1204;에 2cpu 가1077;한 초보 1077;니다.
그 ᇼ1;안 눈ᔚ1;만 Ȣ16;다가 (유1061;한 내용들 많1060; 0176;ǽ12;습니다. 감사합니다!), 솔1649;7176; 말씀드리면 1060;,172; 너무 Ƽ17;금해서 1656;문1012; 드리고1088; 가1077;했습니다.
1228;가 E5-26xx V4 시스템 1473;고에 대한 ,163;1012; 알고 나서.. 한번 써보고 dz10;1008; ,163;1012; 못참고 1312;립1012; 했lj16;데요.
- cpu: E5-2680v4 듀얼
- mainboard: Huananzhi X99-F8D Plus (실1228;론 C612 서버용 ᒤ1;셋)
(1473;국1228; 메1064;보드 사면 안.108;다고 많1060;들 말리시lj16;데도 샀다가 1060; 고생1012;;;)
- memory: Hynix HMA42GR7MFR4N-TF DDR4-2133(@2400)160;16GB x8 쿼드
듀얼 cpu 구성1064;데, 양1901; CPU가 각각1032; remote RAM 1217;근시 latency/bandwidth가 1060;상합니다.
성능 측1221;1008; PerformanceTest 11.0 버1204; > advanced > Memory... 에서 한,148;데요.
latency (random range) | 160;NUMA node 0160; | 160;NUMA node 1160; |
NUMA allocation node 0 | 55.58ns | 55.58ns |
NUMA allocation node 1 | 81.58ns | 80.88ns |
block write speed | 160;NUMA node 0160; | 160;NUMA node 1160; |
NUMA allocation node 0 | 3785MB/s | 3813MB/s |
NUMA allocation node 1 | 2119MB/s | 2069MB/s |
cpu0, cpu11060; 각각 다른 CPU에 붙1008; (remote) memory 1217;근할ǐ12;lj16; QPI 통과 delay가 생기lj16; ,148; 알,192;lj16;데,
보시다시피 NUMA node 0 (cpu0) 1901;Ȣ16;고 NUMA node 1 (cpu1) 1901;Ȣ16;고 서/196; 대칭1060; .104;lj16; 결과가 아니라, 무1312;,148; cpu1 1901; 메모리 1217;근할ǐ12;만 latency, bandwidth 모.160; 큰 폭1004;/196; 나빠1665;니다.
.160; 소Ȓ11;1032; cpu를 서/196; 교환해봐도, 메모리를 서/196; 교환해봐도 결과가 같습니다.
그래서 1200;lj16; 메1064;보드를 1032;심(소Ȓ11; 불량? PCB 1076;피Nj12;스 문1228;?)Ȣ16;고 Aliexpress 셀러를 1665;요Ȣ16;,172;;; 괴ǘ13;혔습니다. ^^;
1. 셀러측에서 처1020;에lj16; 듀얼 cpu를 사용Ȣ16;면 무1312;,148; 6140;포먼스가 떨Ǻ12;1652;다고 우기더니
(네, 보드에 cpu Ȣ16;나만 1109;착했1012; ǐ12;, 45ns --> .160; 개 다 1109;착 후 55ns/196; 1060;0120; 떨Ǻ12;1648;긴 했습니다.)
2. 1228;가 왜 한1901;(cpu1)만 더 떨Ǻ12;1648;lj12;냐? 했더니,
CPU 별 서/196; 다른 PCI-E 슬ǘ15;1060; 연결.104;서 그/111;다lj16; 1060;상한 소리를 Ȣ16;다가,
(CPU에 연결.108; PCI-E 디0148;1060;스가 IMC에도 영향1012; 1452;나요? 참고/196;, m.2lj16; 0번 CPU 고1221;, 그래픽카드lj16; 0/1번 Ǻ12;lj12;1901; cpu에 연결해도 문1228; ᇼ1;1068;합니다.)
3. 1228;가 그,163; ǐ12;문에 1200;/111;,172; 큰 메모리 1217;근 속도 차1060;가 DŽ16; 수가 1080;lj12;냐?했더니,
(아마도 셀러가 너무 귀찮고 1676;1613;나서) 1648;네 메1064;보드 디1088;1064; 한계라고 환불해1452;,192;ᇨ1;니다.
근데 사실 ᇼ1;1068; CPU1064; 시스템1032; passmark/cinebench መ1;1032; 1216;수를 ,160;색해서 비교해보면, 1228; 메1064;보드가 다른 X99/C612 메1064;보드/워크스테1060;션보다 1216;수가 많1060; 떨Ǻ12;1648;,144;나 Ȣ16;1648;lj16; 않,144;든요.
(ASUS, 슈6140;마1060;크/196;, HP, ... Dell만 다른 벤더보다 1328; 눈에 Ǖ16;,172; 1339;더군요.)
그러면 1200;런 비대칭 속도가 1221;상1064;,148;1648;? 그/111;다면 Ǻ12;1704;서 그런1648;? 여1204;7176; 설명1060; 고팠구요. 다른 xeon e5-26xx v4시스템에서도 1060;/111;,172; cpu0/cpu1 양1901; 메모리 1216;수가 비대칭1004;/196; 나오lj16;1648; Ƽ17;금Ȣ16;네요.
그래서 1060;번엔 다시 passmark에 물Ǻ12;보았습니다.
1200;lj16; 내심 "passmark가 advanced > memory test 1096;못Ȣ16;lj16;,144; 아니야?"라lj16; 1032;도도 1080;었lj16;데...
Ȣ16;1648;만 passmark 관리1088;가 테스트 결과가 확실7176; 1328; 1060;상해보1060;네? 한 ,163; 외에lj16;, 아무도 댓글1012; 달아1452;1648; 않네요. 12640;12640;160;아마도 1060;1232; 구닥다리 e5-26xx v4 듀얼 구성따위 놀아보lj16; 사람1060; 별/196; 없기 ǐ12;문1060;,192;1648;요.
앞서 퀘1060;사1316;에도 1656;문1012; 해봤1648;만, ( 2cpulj16; 1060;메1068; 1064;1613; 통과Ȣ16;기까1648; 시간1060; 1328; ,152;/160;네요 ^^;) 역시 NJ13;1060; 없었습니다.
Passmark1032; PerformanceTest 11.0 버1204; > advanced > Memory... 에서
cpu 0/1 -- mem 0/1 4가1648; ᅆ1;우에 대해서 latency랑 bandwidth 테스트 1328; ǥ12;ᓠ1;드/140;도 .112;까요?160;
테스트 0169;법1008; 아래 스샷 참1312;Ȣ16;셔도 .104;시고, 위1032; passmark 1901; 링크에도 설명1060; 1080;습니다. 오래 ,152;리1648; 않습니다.
1. Passmark PerformanceTest 11.0 설치 후 실행, 탑다운 메뉴1032; Advanced > Memory ...
2. latency test를 numa node 0 / 1 , numa allocation node를 0 / 1 , 총 4가1648; 1312;합에 대해 수행Ȣ16;여 Ȣ16;단 random range latency 비교.
3. block write에 대해서 마찬가1648;/196;, numa node 0 / 1 , numa allocation node를 0 / 1 , 총 4가1648; 1312;합에 대해 수행Ȣ16;여 새 창에 표시.104;lj16; bandwidth 비교.
ᕬ1;시 보유Ȣ16;고 계신 dual xeon e5-26xx v4 시스템도 mem0, mem11032; 성능1060; 크,172; 다른,148; 아닌1648; Ƽ17;금Ȣ16;1648; 않1004;세요? ^^;
1060;1232; 1652;1676;1652;1676; 더 1060;상 물Ǻ12;볼 곳도 없네요. 12640;12640;
ÀÔÃâ·Â ´ã´çµµ µÎ CPU Áß¿¡ ÇÑ CPU°¡ ¸ÕÀú ¹Þ¾ÆÁÙ °ÍÀ̸ç.
µÎ cpu ¸Þ¸ð¸® Á¢±Ù ¼Óµµ°¡ Â÷À̰¡ ³´Ù¿¡ º°·Î ³î¶øÁö´Â ¾Ê½À´Ï´Ù.
CPUÀÇ ¼øÂ÷´ë±â¿Í OS Ä¿³ÎÀÇ °£¼·Àº ¾î¿ ¼ö ¾ø´Â °Å ¾Æ´Ñ°¡¿ä ??
±×·¡¼ ¿äÁòÀº RDMA ¸¦ »ç¿ëÇÏÁÒ.
IP v6 ¸¦ ±â¹ÝÀ¸·Î DRMA¸¦ ±¸ÇöÇÏ¿©...... Á÷Á¢ ¾ï¼¼½º ÇÏ°í ½Í½À´Ï´Ù.
±× CPU ¿Í OSÄ¿³ÎÀÇ °£¼·À̳ª Delay ¾øÀÌ ´Ù¸¥ ¼¹öÀÇ ¸Þ¸ð¸®¿¡ Á¢±ÙÇÏ°í ½Í½À´Ï´Ù.
RDMA ¸¦ ÅëÇØ¼..
´Ù¸¥ °Íµéµµ Á÷¾÷ ¾ï¼¼½º ÇÏÀÚ´Â ¿òÁ÷ÀÓ.
RDMA over NVMe
RDMA over NFS
RDMA over GPU
±×¸®°í Áß±¹º¸µå¿¡ µÎ cpuÀÇ Á¢±Ù¼Óµµ Â÷À̰¡ ³´Ù..´Â Áú¹®Àº ¹«¸® ÀÔ´Ï´Ù.
¸ÞÀκ¸µå°¡ ½Ñ°Å.. ´ç¿¬È÷ ±â¼úÀûÀ¸·Î ºÎÁ·ÇÏÁÒ..
±×°Ô ¿Ïº¯Çϰí HPº¸µå³ª Dellº¸µå¿Í ºñ½ÁÇÏ´Ù¸é µ·À» ¸¹ÀÌ ¹Þ°ÚÁÒ..
¿¬»ê½Ã¿¡ Á¤È®ÇÏ°í ¿Ïº®ÇÑ µ¿ÀÛÀº IBMÀÌ Àß ÇÕ´Ï´Ù...
Lenovo ±â°èÂÊÀ» º¸¼¼¿ä..
Thinkstation P900,P910,P920
X3650 M5
¹Ý´ëÆí ½ÃÇ»¿¡ ÀÖ´Â PCIe´Â µô·¹ÀÌ ±Ø¾ÇÇÏ°Ô ´Ã¾îÁö°í, ½ÉÁö¾î´Â °°Àº ½ÃÇ»³»¿¡¼µµ Äھ µû¶ó ·¥ Á¢±Ù ¼ÓµµÂ÷ ³³´Ï´Ù
±×¸®°í ¸ÖƼµ¥½ºÅ·À̹ǷΠ´Ù¸¥ ¿äÀεµ ¹èÁ¦ Èûµì´Ï´Ù
º¸µå ºí·°´ÙÀ̾î±×·¥ º¸¸é ¾Ë ¼ö ÀÖ½À´Ï´Ù¸¸
ÀϹÝÀûÀÎ µà¾ó¸¶´õº¸µåÀÇ ±¸Á¶»ó ù¹øÂ° CPU¿¡ ºÎÇϰ¡ ´õ °É¸®±â¿¡ ù¹øÂ° CPUÀÇ ¿Âµµµµ ´õ ³ô°í ¸Þ¸ð¸® ¼Óµµµµ ´õ ³ô½À´Ï´Ù..
´Ü µÎ CPUÀÇ Â÷ÀÌ´Â ±×¸® Å©°Ô Â÷À̳ªÁö´Â ¾Ê½À´Ï´Ù.. (¾Æ¸¶ ¸¹¾Æ¾ß 10~15% Á¤µµ°¡ ¾Æ´Ò±î ÃßÃøÇØº¾´Ï´Ù)
E5-2600V3/V4 °¡ ³ª¿ÂÁö°¡ ²Ï ¿À·¡µÇ¾î ´ÜÁ¾µÈÁöµµ ²Ï µÇ¾î¼ Àç´ë·Î µÈ º¸µå ã±â°¡ ½±Áö ¾Ê½À´Ï´Ù¸¸
°³ÀÎÀûÀ¸·Î´Â Áß±¹ ³»¼ö¿ëº¸µå´Â º¸µå¶ó°í »ý°¢ÇÏÁöµµ ¾Ê°í »ç¿ëÇÏÁöµµ ¾Ê½À´Ï´Ù..
°³ÀÎÀûÀ¸·Î ÁÁ¾ÆÇÏ´Â º¸µå´Â ¹Ì±¹Çâ¹ß º¸µå (ÀÎÅÚ, ½´ÆÛ¸¶ÀÌÅ©·Î, TYAN) Á¤µµ ÀÔ´Ï´Ù..
Cpu mark ÃÑÁ¡Àº 30,800Á¡À¸·Î ASUS, ½´¸¶, HP Å×½ºÆ® °ªµé¿¡ µÚÃÄÁöÁö ¾Ê´Âµ¥, µü Àú Å×½ºÆ®¸¸ ÀÌ»óÇÏ°Ô ³ª¿Í¿ä. ¤Ì¤Ì
¿ä»õ´Â ¾Æ¹«·¡µµ ´ëÁ¶±ºÀ» ã±â´Â Èûµé°ÚÁÒ.
¶È°°Àº ÇÁ·Î±×·¥ µ¹·Á¼ °á°ú°ªÀÌ Áß±¹»ê º¸µå¿Í ºñ½ÁÇÏ´Ù¸é ¹®Á¦´Â ¾ø´Ù¶ó°í ÇÒ ¼ö ÀÖÁö¸¸
±×·¸Áö ¾Ê´Ù¸é Áß±¹»ê º¸µå´Â ¾îµò°¡ ¹®Á¦°¡ ÀÖ°ÚÁö¿ä..
±×·¯³ª ±×·± Å×½ºÆ®¸¦ µ·µé¿©¼ ÇÑ´Ù´Â °Íµµ ¿£µåÀ¯Á®¿¡°Ô´Â ½±Áö ¾Ê°í ³»°¡ º¸±â¿¡´Â ÀÌ·¡Àú·¡¼ ¹®Á¦´Ù¶ó°í
Áß±¹ º¸µå Á¦Á¶»ç¿¡ À̾߱â ÇØµµ ±× ¹®Á¦¸¦ ÇØ°áÇØÁÙÁö´Â ¸ð¸£´Â ¹®Á¦ÀÔ´Ï´Ù..
±×³ªÀú³ª ºÎÇϰ¡ °É¸° ÂÊÀÌ ¾Æ¸¶µµ Ŭ·°ÀÌ ³ô°Ô À¯ÁöµÇ°í ÀÖ¾î¼? ´õ ¹ÝÀÀÀÌ ºü¸¥°¡º¸±º¿ä. ¶Ç À¯¿ëÇÑ Á¤º¸¸¦ ¹è¿ö°¡³×¿ä. °¨»çÇÕ´Ï´Ù. ¤¾¤¾
Á¦°¡ ´ñ±Û¿¡ ÀûÀº ¼Óµµ°¡ ºü¸£´Ù´Â °ÍÀº ºÎÇϸ¦ 100% ÁÖ¾úÀ»¶§ ¸Þ¸ð¸® µ¿ÀÛµµ µ¿ÀÛÇÒ ¼ö ÀÖ´Â ÃÖ´ë·Î µ¿ÀÛÇÑ´Ù´Â Àǹ̷Î
º¸½Ã¸é µÉ °Í °°½À´Ï´Ù..
cpu´Â 2620 v4 ÀÔ´Ï´Ù.
PerformanceTest 11.0ÀÇ advanced memory test´Â NUMA node Å×½ºÆ®¸¦ Á¦´ë·Î ¼öÇàÇÏÁö ¸øÇÏ´Â °ÍÀ̾úÀ»±î¿ä?
ÇÑ´Þ ¹¬Àº üÁõÀÌ ³»·Á°¡´Â°Å °°½À´Ï´Ù. Á¤¸» °¨»çÇÕ´Ï´Ù!!
=======================================================================================================================================
Intel(R) Memory Latency Checker - v3.11
Measuring idle latencies for random access (in ns)...
Numa node
Numa node 0 1
0 91.8 125.6
1 128.6 90.4
Measuring Peak Injection Memory Bandwidths for the system
Bandwidths are in MB/sec (1 MB/sec = 1,000,000 Bytes/sec)
Using all the threads from each core if Hyper-threading is enabled
Using traffic with the following read-write ratios
ALL Reads : 126783.9
3:1 Reads-Writes : 122172.0
2:1 Reads-Writes : 121868.1
1:1 Reads-Writes : 114215.6
Stream-triad like: 107334.5
Measuring Memory Bandwidths between nodes within system
Bandwidths are in MB/sec (1 MB/sec = 1,000,000 Bytes/sec)
Using all the threads from each core if Hyper-threading is enabled
Using Read-only traffic type
Numa node
Numa node 0 1
0 64761.6 16684.5
1 16725.6 64444.8
Measuring Loaded Latencies for the system
Using all the threads from each core if Hyper-threading is enabled
Using Read-only traffic type
Inject Latency Bandwidth
Delay (ns) MB/sec
==========================
00000 210.29 128318.6
00002 210.81 128501.7
00008 211.57 128222.4
00015 211.70 128083.5
00050 199.87 127241.8
00100 183.51 125596.4
00200 121.22 92607.0
00300 110.09 63446.0
00400 104.28 48124.2
00500 100.70 38986.3
00700 97.13 28266.5
01000 97.98 19979.7
01300 93.68 15644.0
01700 92.60 12166.5
02500 91.72 8513.3
03500 91.03 6294.2
05000 91.36 4614.1
09000 91.05 2881.8
20000 90.88 1685.7
Measuring cache-to-cache transfer latency (in ns)...
Using small pages for allocating buffers
Local Socket L2->L2 HIT latency 39.7
Local Socket L2->L2 HITM latency 43.4
Remote Socket L2->L2 HITM latency (data address homed in writer socket)
Reader Numa Node
Writer Numa Node 0 1
0 - 97.9
1 98.5 -
Remote Socket L2->L2 HITM latency (data address homed in reader socket)
Reader Numa Node
Writer Numa Node 0 1
0 - 98.2
1 97.6 -
=======================================================================================================================================
Á¦ »ý°¢¿¡´Â performanceTest 11.0ÀÇ advanced > memory ... Å×½ºÆ®°¡ cache hit ¿µÇâÀ» ¹èÁ¦ÇÏÁö ¸øÇÑ°Ô ¾Æ´Ò±î? ½ÍÀºµ¥ ¸ð¸£ÁÒ. ¤¾¤¾
¿©ÇÏÆ° multi processor ½Ã½ºÅÛ¿¡¼ PerformanceTest °á°ú´Â Ʋ¸± ¼öµµ ÀÖ´Ù Á¤µµ·Î ÂüÁ¶ÇÏ½Ã¸é µÉ °Í °°½À´Ï´Ù.
UEFI ¸ðµå·Î µ¹¸®¸é ¸Þ¸ð¸® ¼Óµµ º¥Ä¡¸¶Å© Å×½ºÆ® Ç׸ñµµ ÀÖÀ» °ÍÀÔ´Ï´Ù..
±Ùµ¥ memtest86µµ numa node º° º°µµ·Î Å×½ºÆ® °á°ú°¡ ³ª¿À³ª¿ä?
º¸Åë ½Ã½ºÅÛ 1´ë Àüü¿¡ ´ëÇÑ °Í¿¡ ´ëÇØ ³ª¿É´Ï´Ù..
memtest86À» ±¸±Û¸µÇÏ¸é »ç¿ë ¹æ¹ýÀ̳ª µ¿ÀÛÇÏ´Â ¸¹Àº »çÁøµéÀ» º¼ ¼ö ÀÖÀ» °ÍÀÔ´Ï´Ù..