Intel, Sapphire Rapids 및 HPC 공식 출시
By 티파니 트레이더
2023년 1월 10일
여러 차례 지연된 끝에 Intel은 Ice Lake의 후속 제품인 코드명 Sapphire Rapids인 4세대 Intel Xeon Scalable 프로세서를 출시했습니다. Intel 7 노드(이전의 10nm)에서 제조되었으며 프로세서당 최대 60개의 Golden Cove 코어와 새로운 전용 가속기 코어를 갖춘 이 플랫폼은 이전 세대에 비해 1.53배의 평균 성능 향상과 2.9배의 와트당 평균 성능 효율성을 제공합니다. Intel에 따르면 새로운 가속기를 사용하여 대상 워크로드가 개선되었습니다.
오늘 글로벌 라이브 스트리밍 시계 파티로 개최된 이번 출시에는 이전에 각각 "Sapphire Rapids HBM" 및 "Ponte Vecchio"라고 불렸던 Max 시리즈 CPU 및 GPU도 포함되었습니다.
Sapphire Rapids 제품군에는 Max 시리즈를 포함하여 10개 세그먼트에 그룹화된 52개의 SKU(차트 참조)가 포함되어 있습니다. 11개는 2소켓 성능(8~56개 코어, 150~350와트)에 최적화되어 있고 7개는 2소켓 메인라인 성능( 12~36개 코어, 150~300와트), 10개의 대상 4소켓 및 8소켓(8~60개 코어, 195~350와트), 3개의 단일 소켓 최적화 부품(8~32개 코어, 125~250와트)이 있습니다. ). 클라우드, 네트워킹, 스토리지, 미디어 및 기타 워크로드에 최적화된 SKU도 있습니다.
"HPC 최적화" Xeon Max 시리즈 SKU의 라인업에는 32, 40, 48, 52 및 56 코어 버전이 포함됩니다. 이 2소켓 부품 5개 모두 최고 출력은 350와트이며 정가는 32코어 9462의 경우 7,995달러부터 56코어 9480의 경우 12,980달러입니다. 9480 Max 시리즈보다 더 비싼 두 SKU가 있습니다. 코어 8490H는 17,000달러, 48코어 8460H는 13,923달러입니다.
지난 달 오레곤주 힐스보로에서 열린 언론 행사에서 Intel 선임 연구원인 Ronak Singhal은 광범위한 SKU에 대해 다음과 같이 말했습니다. "고객들은 SKU가 너무 많다고 말할 것입니다. SKU 수를 줄일 수 있지만 추가할 수 있습니까? 정말 중요한 세 가지 SKU가 있습니까? 그래서 우리는 고객과 밀고 당기는 방식을 취하고 있습니다."
4세대 Intel Xeon Scalable 프로세서의 새로운 기능에는 PCIe 5.0, DDR5 메모리 및 CXL 1.1 지원이 포함됩니다.
56코어 8480+ 상단형 2소켓(비HBM) 부품(Ice Lake 제품보다 40% 더 많은 코어 포함)은 여러 벤치마크에서 세대 대비 성능 향상을 달성하여 1.5배의 성능 향상을 달성했습니다. Stream Triad의 개선, HPL의 경우 1.4배 개선, HPCG의 경우 1.6배 개선되었습니다. 12개 이상의 실제 애플리케이션(WRF, Black Scholes, Monte Carlo 및 OpenFoam 포함)에 대한 인텔 테스트에서는 비슷한 속도 향상이 나타났으며, 물리 워크로드인 CosmoFlow(2.6x)에서 가장 큰 이득을 얻었습니다.
Max 시리즈 CPU는 고대역폭 메모리가 통합된 최초의 x86 프로세서입니다. Intel에 따르면 메모리 제한 작업 부하에 대해 3.7배의 성능 향상을 제공하며 "배포된 경쟁 시스템"보다 68% 적은 에너지를 필요로 합니다. AlphaFold2 애플리케이션에서 Xeon Max CPU는 Intel 테스트에서 Ice Lake 프로세서보다 3배 빠른 속도를 보여주었습니다. HPC 벤치마크 관찰자들에게 주목할만한 Max 시리즈 프로세서는 DDR 전용 Sapphire Rapids와 비교하여 HPCG에서 거의 2.4배, Stream Triad에서 3.5배의 속도 향상을 달성합니다. Max 시리즈 CPU의 HBM은 고성능 Linpack 벤치마크에 대한 성능 향상을 제공하지 않았습니다.
오늘 출시된 Max 시리즈 "Ponte Vecchio" GPU에는 최대 128개의 Xe HPC 코어와 함께 47타일 패키지에 1000억 개가 넘는 트랜지스터가 포함되어 있습니다. 폼 팩터에 따라 최대 128GB HBM2e 메모리를 지원하고 최대 52 피크 FP64 테라플롭을 제공합니다. Intel이 실시한 벤치마킹에 따르면 Max 시리즈 GPU와 Max 시리즈 CPU 플랫폼(3:1 GPU:CPU 비율)을 결합하면 GPU가 없는 Ice Lake 플랫폼에 비해 LAMMPS 분자 역학 워크로드에 대해 12.9배 향상된 성능을 제공합니다. Max GPU(2-CPU 서버에 6개의 GPU 추가)를 추가하면 동일한 워크로드에 대해 Max 시리즈 CPU 전용 플랫폼에 비해 9.9배 향상됩니다. 호스트 CPU의 고대역폭 메모리는 DDR5만 사용할 때보다 1.55배의 성능 향상을 가능하게 했습니다. (지난달 오리건주 힐스보로에서 열린 시위 사진)