제온 파이

"오늘의AI위키"는 AI 기술로 일관성 있고 체계적인 최신 지식을 제공하는 혁신 플랫폼입니다.
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.

1. 개요

제온 파이는 인텔의 Many Integrated Core(MIC) 아키텍처를 기반으로 하는 프로세서 제품군이다. 래러비, 단일 칩 클라우드 컴퓨터, 테라플롭스 연구 칩 등 여러 연구 프로젝트를 거쳐 개발되었다. 첫 번째 제품인 Knights Ferry는 2010년에 출시되었으며, 이후 Knights Corner, Knights Landing, Knights Mill, Knights Hill 등의 제품이 출시되었다. 제온 파이는 x86 아키텍처를 기반으로 하며, 고성능 컴퓨팅, 특히 병렬 처리에 특화된 설계를 갖추고 있다. 딥 러닝 분야에도 활용되었으나, Knights Hill을 마지막으로 개발이 중단되었다. 경쟁 제품으로는 엔비디아 테슬라, AMD 라데온 프로 및 라데온 인스팅트 등이 있다.

제온 파이
Xeon Phi 개요

이미지 준비중입니다.

제온 파이 5100 (방열판 없음)
용도슈퍼컴퓨터
고성능 컴퓨팅
판매사인텔
설계 회사인텔
제조사인텔
기술 사양
출시 시작2010년
출시 종료2020년
최저 클럭 속도1.053
최고 클럭 속도1.7
코어 수32-72개
L1 캐시코어당 32KB
L2 캐시코어당 512KB
최소 트랜지스터 크기45 나노미터
최대 트랜지스터 크기14 나노미터 (트라이게이트)
아키텍처x86-16 (코프로세서 폼 팩터 제외)
IA-32
x86-64
확장 명령어 집합AVX
AVX2
AVX-512
소켓LGA 3647
PCI Express 3.0 x16
모델제온 파이 3100
제온 파이 5100
제온 파이 7100
제온 파이 7200
메모리 지원ECC 지원 DDR4, 최대 115.4 GB/s
메모리 용량최대 384GB 및 16GB
코어 코드명Knights Ferry
Knights Corner
Knights Landing
Knights Mill
Knights Hill
메모리 종류MCDRAM 400+ GB/s
마이크로아키텍처Larrabee
📚 더 읽어볼만한 페이지
  • X86 아키텍처 - 물리 주소 확장
    물리 주소 확장(PAE)은 x86 아키텍처에서 32비트 주소를 36비트 이상으로 확장하여 CPU가 4GB 초과 물리 메모리에 접근하도록 하는 기술로, 페이지 테이블 확장 및 추가 페이지 테이블을 통해 최대 64GB 메모리를 지원하며 AMD64 아키텍처에서 가상 주소 공간 확장에 사용되고 운영 체제, 칩셋, 마더보드의 지원이 필요하며 CPUID 플래그로 지원 여부를 확인한다.
  • X86 아키텍처 - X86 가상화
    X86 가상화는 x86 아키텍처 기반 시스템에서 가상 머신을 구현하는 기술로, 소프트웨어 기반 가상화와 하드웨어 지원 가상화로 나뉘며, CPU 제조사의 가상화 확장 기술을 활용하여 가상 머신의 성능을 향상시킨다.
  • 코프로세서 - 엔비디아 테슬라
    엔비디아 테슬라는 엔비디아가 개발한 고성능 GPU 제품군으로, CUDA를 활용한 병렬 컴퓨팅 환경을 제공하여 다양한 분야에서 고성능 컴퓨팅을 지원하며, 여러 마이크로아키텍처 기반 모델을 통해 발전해왔고, 메모리 및 통신 대역폭을 늘리는 혁신을 거듭해왔다.
  • 코프로세서 - AMD 인스팅트
    AMD 인스팅트는 고성능 컴퓨팅 및 인공지능 워크로드를 위해 AMD에서 개발한 데이터 센터용 GPU 가속기 제품군으로, ROCm 소프트웨어 스택을 통해 지원되며 다양한 소프트웨어 기능과 API를 제공한다.
  • 인텔 x86 마이크로프로세서 - 인텔 80386
    인텔 80386은 1985년 출시된 x86 아키텍처의 32비트 마이크로프로세서로, 온칩 메모리 관리 장치, 3단계 파이프라인, 세 가지 동작 모드를 제공하며, 개인용 컴퓨터와 임베디드 시스템에 널리 사용되었지만 현재는 생산 및 지원이 중단되었고, 32비트 명령어 집합은 현대 x86 아키텍처의 기반이 되었다.
  • 인텔 x86 마이크로프로세서 - 인텔 4004
    인텔 4004는 1971년 인텔에서 출시된 세계 최초의 상용 마이크로프로세서 중 하나이며, 4비트 아키텍처를 기반으로 계산기 라인에 탑재하기 위해 개발되었고, 컴퓨터 소형화와 개인용 컴퓨터 시대에 기여했다.

2. 역사

제온 파이 코프로세서 라인업. 왼쪽부터 나이츠 페리, 나이츠 코너, 나이츠 랜딩.
제온 파이 코프로세서 라인업. 왼쪽부터 나이츠 페리, 나이츠 코너, 나이츠 랜딩.

래러비 마이크로아키텍처(2006년부터 개발 시작)는 x86 아키텍처 기반 프로세서 디자인에 매우 넓은 (512비트) SIMD 유닛을 도입했으며, 캐시 일관성을 갖춘 멀티프로세서 시스템으로 확장되어 링 버스를 통해 메모리에 연결되었다.

인텔은 래러비 프로젝트 외에도 '단일 칩 클라우드 컴퓨터'(2009년 시제품 소개), '테라플롭스 연구 칩(2007년 시제품 공개) 등 다중 코어 프로세서 연구를 진행했다.

2010년, 인텔은 다중 통합 코어(MIC) 프로토타입 보드인 나이츠 페리(Knights Ferry)를 발표했다. 이는 래러비 프로젝트와 '단일 칩 클라우드 컴퓨터' 연구의 결과물이었다.

2012년, 인텔은 나이츠 코너(Knights Corner)를 출시하며 제온 파이 브랜드를 처음으로 선보였다. 나이츠 코너는 22nm 공정으로 제작되었으며, 50개 이상의 코어를 탑재했다.

2016년, 2세대 제온 파이인 나이츠 랜딩(Knights Landing)이 출시되었다. 나이츠 랜딩은 14nm 공정으로 제작되었으며, 최대 72개의 코어를 탑재하고, 온 패키지 메모리를 통합하여 메모리 대역폭을 크게 높였다.

2017년, 인텔은 딥 러닝에 특화된 나이츠 밀(Knights Mill)을 출시했다. 나이츠 밀은 나이츠 랜딩과 유사한 사양을 가지면서도, AVX-512 명령어 활용을 최적화하여 단정밀도 및 가변 정밀도 부동 소수점 성능을 향상시켰다.

인텔은 10nm 공정 기반의 나이츠 힐(Knights Hill)을 계획했으나, 2017년 개발을 취소했다.

👆
좌우로 밀어서 보기
코드명공정비고
나이츠 페리45 nm래러비 프로젝트에서 파생, PCI Express 카드 형태
나이츠 코너22 nmP54C에서 파생, 벡터 프로세싱 유닛, 제온 파이로 처음 발표된 장치
나이츠 랜딩14 nm실버몬트/에어몬트에서 파생, AVX-512
나이츠 밀14 nm나이츠 랜딩과 거의 동일, 딥 러닝에 최적화
나이츠 힐10 nm개발 취소됨

2.1. 나이츠 페리 (Knights Ferry)

--

나이츠 페리(Knights Ferry)는 2010년 5월 31일에 발표된 인텔의 다중 통합 코어(MIC) 프로토타입 보드로, 코드명 Aubrey Isle 프로세서를 탑재했다. 이 제품은 래러비 마이크로아키텍처 프로젝트와 단일 칩 클라우드 컴퓨터 등 인텔의 다른 연구 프로젝트에서 파생되었다.

나이츠 페리는 최대 1.2GHz로 동작하는 32개의 인오더(in-order) 코어(코어당 4개의 스레드), 2GB GDDR5 메모리, 8MB 캐시(코어당 256KB, L1 캐시 32KB)를 갖춘 PCIe 카드 형태로 제공되었다. 소비 전력은 약 300W이며, 45nm 공정으로 제작되었다. Aubrey Isle 코어에는 1,024비트 링 버스(512비트 양방향)가 프로세서를 주 메모리에 연결한다. 단일 보드 성능은 750GFLOPS를 초과했으며, 단정밀도 부동 소수점 명령만 지원한다.

CERN, 한국과학기술정보연구원(KISTI), 라이프니츠 슈퍼컴퓨팅 센터 등이 초기 개발에 참여했다. 프로토타입 보드 하드웨어 공급업체로는 IBM, SGI, HP, 델 등이 있었다.

2.2. 나이츠 코너 (Knights Corner)

Knights Corner영어 제품군은 22nm 공정으로 제작되었으며, 50개 이상의 코어를 가진 인텔의 트라이게이트 기술을 사용한 인텔의 첫 번째 멀티코어 상용 제품이다. 2012년 6월 18일, 함부르크 국제 슈퍼컴퓨팅 컨퍼런스에서 인텔은 자사의 Many Integrated Core 아키텍처를 기반으로 하는 모든 제품에 사용될 브랜드 이름이 제온 파이가 될 것이라고 발표했다.

인텔 제온 파이 코프로세서 코어의 중요한 구성 요소는 벡터 프로세싱 유닛(VPU)이다. VPU는 인텔 초기 Many Core 명령어(Intel IMCI)로 알려진 새로운 512비트 SIMD 명령어 집합을 특징으로 한다. VPU는 사이클당 16개의 단정밀도(SP) 또는 8개의 배정밀도(DP) 연산을 실행할 수 있으며, FMA 명령어를 통해 사이클당 32개의 SP 또는 16개의 DP 부동 소수점 연산을 실행할 수 있다. 정수 연산도 지원한다.

2012년 11월 12일, 인텔은 22nm 공정의 제온 파이 코프로세서 제품군인 제온 파이 3100과 제온 파이 5110P를 발표했다. 제온 파이 3100은 300W에서 240GB/s 메모리 대역폭으로 1테라플롭스 이상의 배정밀도 부동 소수점 명령을 처리할 수 있다. 제온 파이 5110P는 225W에서 320GB/s 메모리 대역폭으로 1.01테라플롭스의 배정밀도 부동 소수점 명령을 처리할 수 있다.

2013년 6월 17일, 톈허-2 슈퍼컴퓨터가 TOP500에 의해 세계에서 가장 빠른 컴퓨터로 발표되었다. 톈허-2는 인텔 아이비 브릿지 제온 및 제온 파이 프로세서를 사용하여 33.86페타플롭스를 달성했다.

2012년 11월 13일 발표된 제1세대 제온 파이는 22nm Tri-Gate 트랜지스터 제조 공정을 채택했다. 인텔 제온 프로세서 E5 패밀리와 조합하여 카드당 배정밀 부동 소수점 연산으로 1TFLOPS 이상의 이론 성능을 가진다. SIMD 명령은 512비트이며, 배정밀 부동 소수점수를 8개 동시에 처리할 수 있고, FMA를 지원하여 16 FLOPS/cycle이다.

👆
좌우로 밀어서 보기
Knights Corner영어
형식CPUTDP
(W)
내장 메모리
코어 수
(스레드 수)
클럭 (GHz)L2 캐시
(MB)
규격용량
(GB)
정격터보
7120A61 (244)1.241.3330.5300GDDR516
7120P
7120X
7120D270
SE10P1.1rowspan="7"3008
SE10X
5120D60 (240)1.0530245
5110P225
31S1P57 (228)1.128.5270
3120A3006
3120P

2.2.1. 디자인 및 프로그래밍

Knights Corner 코어는 오리지널 펜티엄에 사용된 P54C 설계를 수정하여 기반으로 한다. 인텔 MIC 아키텍처는 기존 병렬화 소프트웨어 도구를 사용할 수 있는 x86 호환 멀티프로세서 아키텍처를 만들어 x86 레거시를 활용한다. 프로그래밍 도구에는 OpenMP, OpenCL, Cilk/Cilk Plus 및 인텔의 Fortran, C++ 및 수학 라이브러리의 특수 버전이 포함된다.

Larrabee 프로젝트에서 상속된 설계 요소에는 x86 ISA, 코어당 4-way SMT, 512비트 SIMD 유닛, 32 KB L1 명령어 캐시, 32 KB L1 데이터 캐시, 일관성 있는 L2 캐시(코어당 512 KB) 및 프로세서와 메모리를 연결하는 초광대역 링 버스가 있다.

Knights Corner 512비트 SIMD 명령어는 AVX-512 확장과 많은 내장 함수를 공유한다. 명령어 집합 문서는 KNC라는 확장 이름으로 인텔에서 제공된다.

2.3. 나이츠 랜딩 (Knights Landing)

나이츠 랜딩은 인텔의 2세대 MIC 아키텍처 제품 코드명이다. 2013년 6월 17일, 인텔은 2세대 인텔 제온 파이 제품에 대한 세부 정보를 처음 공개했다. 인텔은 차세대 인텔 MIC 아키텍처 기반 제품이 코프로세서 또는 호스트 프로세서(CPU) 형태로 제공되며, 인텔의 14 nm 공정 기술을 사용하여 제조될 것이라고 밝혔다. 나이츠 랜딩 제품에는 메모리 대역폭을 크게 높이기 위해 온 패키지 메모리가 통합될 것이다.

인텔 제온 파이 나이츠 랜딩 엔지니어링 샘플
인텔 제온 파이 나이츠 랜딩 엔지니어링 샘플

동일한 프로세서, 디캡
동일한 프로세서, 디캡

다이 샷
다이 샷


나이츠 랜딩은 코어당 4개의 스레드를 가진 최대 72개의 에어몬트 (아톰) 코어를 포함하며, LGA 3647 소켓을 사용한다. 최대 384GB의 "원거리" DDR4 2133 RAM과 8–16GB의 적층형 "근거리" 3D MCDRAM (하이브리드 메모리 큐브의 한 버전)을 지원한다. 각 코어에는 두 개의 512비트 벡터 유닛이 있으며 AVX-512 SIMD 명령어를 지원한다. 특히 인텔 AVX-512 기본 명령어(AVX-512F), 인텔 AVX-512 충돌 감지 명령어(AVX-512CD), 인텔 AVX-512 지수 및 상호 명령어(AVX-512ER), 인텔 AVX-512 프리페치 명령어(AVX-512PF)를 지원한다. IMCI에 대한 지원은 AVX-512를 선호하여 제거되었다.

국립 에너지 연구 과학 컴퓨팅 센터는 최신 슈퍼컴퓨팅 시스템 "코리"의 2단계에서 나이츠 랜딩 제온 파이 코프로세서를 사용할 것이라고 발표했다.

2016년 6월 20일, 인텔은 나이츠 랜딩 아키텍처를 기반으로 하는 인텔 제온 파이 x200 제품군을 출시하여 기존의 시뮬레이션 워크로드뿐만 아니라 머신 러닝에도 적용할 수 있음을 강조했다. 출시 당시 발표된 모델 라인업에는 부팅 가능한 폼 팩터의 제온 파이만 포함되었지만, 표준 프로세서와 인텔 옴니-패스 아키텍처 패브릭이 통합된 프로세서의 두 가지 버전이 있었다. 후자는 모델 번호에 F 접미사가 붙어 있다. 통합된 패브릭은 개별 고성능 네트워크 카드보다 낮은 비용으로 더 나은 대기 시간을 제공할 것으로 예상된다.

2016년 11월 14일, TOP500의 48번째 목록에는 나이츠 랜딩을 사용하는 시스템이 상위 10위 안에 2개 포함되었다.

나이츠 랜딩의 PCIe 기반 코프로세서 변종은 일반 시장에 제공되지 않았으며 2017년 8월에 단종되었다. 여기에는 7220A, 7240P 및 7220P 코프로세서 카드가 포함되었다.

인텔은 2018년 여름에 나이츠 랜딩을 단종할 것이라고 발표했다.

2.4. 나이츠 밀 (Knights Mill)

인텔에서 개발한 코드명 나이츠 밀(Knights Mill)은 2017년 12월에 출시된 딥 러닝에 특화된 제온 파이 제품군이다. 나이츠 랜딩과 사양이 거의 동일하며, AVX-512 명령어 활용을 최적화하여 단정밀도 및 가변 정밀도 부동 소수점 성능을 향상시켰지만, 배정밀도 부동 소수점 성능은 감소했다.

;모델

👆
좌우로 밀어서 보기
제온 파이 X205 CPU 시리즈 모델
제온 파이
72x5 시리즈
sSpec
번호
코어
(스레드)
클럭 (MHz)L2
캐시
MCDRAM 메모리DDR4 메모리최대 DP
컴퓨팅
TDP
(W)
소켓출시일부품 번호
기본터보수량BW
제온 파이 7235SR3VF (A0)64 (256)1300140032 MB16 GB400+ GB/s384 GB102.4 GB/s250SVLCLGA36472017년 4분기HJ8068303823900
제온 파이 7255SR3VG (A0)68 (272)1100120034 MB115.2 GB/s215HJ8068303826300
제온 파이 7285SR3VE (A0)68 (272)1300140034 MB115.2 GB/s250HJ8068303823800
제온 파이 7295SR3VD (A0)72 (288)1500160036 MB115.2 GB/s320HJ8068303823700

2.5. 나이츠 힐 (Knights Hill)

나이츠 힐(Knights Hill)은 인텔의 10nm 공정 기반으로 개발될 예정이었던 3세대 제온 파이였다. 2017년에 개발이 취소되었다.

3. 경쟁 제품

* 엔비디아 테슬라(Nvidia Tesla)는 고성능 컴퓨팅(HPC) 시장의 직접적인 경쟁 제품이다.
* AMD 라데온 프로(AMD Radeon Pro) 및 AMD 라데온 인스팅트(AMD Radeon Instinct)는 HPC 시장의 직접적인 경쟁 제품이다.