NVLink는 엔비디아가 CPU와 GPU, GPU 간의 데이터 및 제어 코드 전송을 위해 개발한 점대점 연결 기술이다. NVLink는 세대별로 전송 속도가 향상되었으며, NVLink 1.0은 20GT/s, NVLink 2.0은 25GT/s, NVLink 3.0은 50GT/s, NVLink 4.0은 50GT/s, NVLink 5.0은 100 GT/s의 전송 속도를 제공한다. NVLink는 파스칼, 볼타, 튜링, 암페어, 호퍼, 블랙웰 아키텍처 기반 GPU 및 IBM Power9 프로세서에 적용되었으며, PCIe와 비교하여 높은 전송 속도와 대역폭을 제공한다. 2016년 엔비디아는 Tesla P100 제품에 NVLink를 구현한다고 발표했으며, 미국 에너지부는 NVLink 2를 활용하는 슈퍼컴퓨터를 구축하는 계약을 체결했다.
더 읽어볼만한 페이지
엔비디아 - ARM 홀딩스 ARM 홀딩스는 저전력 특성의 ARM 아키텍처 기반 반도체 설계 자산 IP를 라이선스하는 회사로, 모바일 기기부터 슈퍼컴퓨터까지 다양한 분야에 활용되며 소프트뱅크 그룹에 인수 후 나스닥에 상장되었다.
엔비디아 - 터보캐시 터보캐시는 GPU가 시스템 메모리를 비디오 메모리처럼 활용하여 그래픽 성능을 높이는 기술로, 엔비디아에서 저가형 비디오 카드 및 통합 그래픽의 성능 향상을 위해 개발되었다.
직렬 버스 - 인피니밴드 인피니밴드는 고성능 컴퓨팅 환경에서 서버, 스토리지, 네트워크 장치 간 고속 데이터 전송을 위한 직렬 통신 기술로, 슈퍼컴퓨터나 데이터 센터에서 주로 사용되지만 이더넷 기반 기술과의 경쟁 및 새로운 컴퓨팅 환경에 대한 적응이라는 과제를 안고 있다.
직렬 버스 - 하이퍼트랜스포트 하이퍼트랜스포트는 고성능 컴퓨터 시스템에서 CPU, 메모리, 칩셋 간의 연결을 고속으로 처리하기 위해 개발된 상호 연결 기술로, AMD CPU와 엔비디아 칩셋 등에 적용되어 시스템 효율성을 향상시키고 다양한 응용 분야에 활용되며 후속 기술의 기반이 되었다.
컴퓨터 버스 - NMEA 0183 NMEA 0183은 선박용 GPS, 자동식별장치(AIS) 등 항해 장비에서 데이터를 송수신하는 데 사용되는 ASCII 기반의 직렬 통신 프로토콜로, RS-422 전기 표준을 사용하며, 문장 형태의 데이터를 통해 정보를 전달하고, 물리 계층, 데이터 링크 계층, 애플리케이션 계층의 3가지 레이어로 구성되어 다양한 소프트웨어에서 지원된다.
컴퓨터 버스 - 인피니밴드 인피니밴드는 고성능 컴퓨팅 환경에서 서버, 스토리지, 네트워크 장치 간 고속 데이터 전송을 위한 직렬 통신 기술로, 슈퍼컴퓨터나 데이터 센터에서 주로 사용되지만 이더넷 기반 기술과의 경쟁 및 새로운 컴퓨팅 환경에 대한 적응이라는 과제를 안고 있다.
NVLink는 CPU와 GPU 간, 그리고 GPU 간의 프로세서 시스템에서 데이터 및 제어 코드 전송을 위해 엔비디아가 개발한 기술이다. NVLink는 차등 쌍을 기반으로 데이터를 전송하며, 각 세대별로 전송 속도가 향상되었다.
NVLink 1.0 및 2.0은 8개의 차등 쌍으로 "서브 링크"를 구성하고, 두 개의 서브 링크가 "링크"를 형성한다. NVLink 3.0부터는 4개의 차등 쌍으로 서브 링크를 구성하여 효율성을 높였다.[2][3][4][5] NVLink 2.0, 3.0 및 4.0은 모두 양방향 링크당 50GB/s의 속도를 가지며, 각각 6개, 12개 및 18개의 링크를 가지고 있다.
Blackwell영어 아키텍처 기반 B100, B200, GB200 GPU, 엔비디아 Grace CPU
각 세대의 NVLink는 고성능 컴퓨팅 분야에 주로 사용되고 있다.
2. 1. 1. NVLink 1.0
NVLink 1.0은 CPU와 GPU 간, 그리고 GPU 간의 프로세서 시스템에서 데이터 및 제어 코드 전송을 위해 엔비디아가 개발한 기술로, 차등 쌍당 20Gbit/s의 데이터 전송 속도를 가진 점대점 연결을 제공한다.[2]2016년4월 5일, 엔비디아는 Tesla P100 제품 등에서 사용되는 파스칼 아키텍처에 NVLink 1.0을 구현한다고 발표했다.
2. 1. 2. NVLink 2.0
NVLink 2.0은 차등 쌍당 25Gbit/s의 데이터 전송 속도를 가지는 점대점 연결이다.[2][3] 8개의 차등 쌍이 "서브 링크"를 형성하고, 각 방향에 대해 하나씩 두 개의 "서브 링크"가 "링크"를 형성한다. 서브 링크의 총 데이터 전송 속도는 25GB/s이고 링크의 총 데이터 전송 속도는 50GB/s이다. 각 V100 GPU는 최대 6개의 링크를 지원하여, 총 300GB/s의 양방향 대역폭을 지원한다.[2][3]
2014년, 미국 에너지부는 엔비디아와 IBM에 서밋과 시에라라는 두 대의 슈퍼컴퓨터를 구축하는 계약을 체결했다. 이 슈퍼컴퓨터들은 노드 상호 연결에 300GB/s 대역폭의 NVLink 2.0을 사용했으며, 시스템 인터커넥트에는 인피니밴드 기반의 것이 사용되었다. 이 시스템들은 볼타 마이크로아키텍처와 POWER9 패밀리 CPU를 조합하여 사용한다.
2. 1. 3. NVLink 3.0
NVLink 3.0은 차등 쌍당 데이터 전송 속도를 25Gbit/s에서 50Gbit/s로 증가시키면서 NVLink당 쌍 수를 8개에서 4개로 줄였다.[4]암페어 기반 A100 GPU는 12개의 링크를 통해 총 600GB/s의 대역폭을 지원한다.[4] NVLink 2.0과 3.0은 모두 양방향 링크당 50GB/s의 속도를 가지며, 각각 6개와 12개의 링크를 가지고 있다.
2. 1. 4. NVLink 4.0
NVLink 4.0은 호퍼 (마이크로아키텍처)영어에 적용되었으며, 18개의 링크를 통해 총 900GB/s의 대역폭을 제공한다.[5] 이는 NVLink 3.0과 동일하게 양방향 링크당 50GB/s의 속도를 가진다. 4세대 NVLink는 호퍼 아키텍처 기반 GPU (H100) 및 엔비디아 Grace CPU에 사용되며, 50GT/s (PAM4)의 전송 속도를 갖는다.
2. 1. 5. NVLink 5.0
NVLink 5.0은 Blackwell영어 아키텍처 기반 GPU (B100, B200, GB200) 및 엔비디아 Grace CPU에 사용되며, 100 GT/s (PAM4)의 전송 속도를 제공한다.
3. 성능
NVLink는 엔비디아가 개발한 고속 인터커넥트 기술로, PCIe와 비교했을 때 더 높은 대역폭을 제공한다. NVLink는 CPU와 GPU 간, 그리고 GPU 간의 데이터 및 제어 코드 전송을 위해 사용된다.
NVLink 1.0은 각 방향에 대해 8개의 차등 쌍으로 구성된 "서브 링크"를 사용하며, 두 개의 "서브 링크"가 "링크"를 형성하여 양방향 20GT/s의 속도를 제공한다. NVLink 2.0은 서브 링크당 데이터 전송 속도를 25GB/s, 링크당 50GB/s로 향상시켰으며, 각 V100 GPU는 최대 6개의 링크를 지원하여 총 300GB/s의 양방향 대역폭을 제공한다.[2][3]
NVLink 3.0은 차등 쌍당 데이터 전송 속도를 50Gbit/s로 높이고, NVLink당 쌍 수를 8개에서 4개로 줄였다. 암페어 기반 A100 GPU는 12개의 링크를 통해 총 600GB/s의 대역폭을 제공한다.[4] NVLink 4.0은 호퍼 아키텍처에서 18개의 링크를 통해 총 900GB/s의 대역폭을 제공한다.[5]
실제 NVLink의 성능은 여러 요인에 의해 영향을 받지만, IBM POWER8 CPU 시스템에서 P100 GPU로 향하는 NVLink 연결의 경우 약 35.3Gbit/s의 전송 속도를 보였다.[27]
NVLink 기능을 갖춘 하이엔드 게이밍 및 전문가용 그래픽 GPU 보드는 NVLink 그룹으로 연결하기 위한 추가 커넥터를 제공한다. 이를 위해 PCB 기반 상호 연결 플러그가 사용된다. 일반적으로 동일한 유형의 보드만 물리적 및 논리적 설계로 인해 함께 연결된다. 일부 설정에서는 최대 데이터 속도를 위해 두 개의 동일한 플러그를 사용해야 한다.[28][29]
현재 일반적인 플러그는 U자 모양이며, 각 끝에 미세한 그리드 엣지 커넥터가 있다. 플러그의 너비는 호스트 컴퓨터 메인보드에서 플러그인 카드를 얼마나 멀리 떨어뜨려야 하는지를 결정하며, 이는 플러그에 의해 결정된다(사용 가능한 플러그 너비는 보드 유형에 따라 3~5 슬롯).[28][29]
이 상호 연결은 2004년부터 구조적 설계와 외관 때문에 SLI로 불리기도 하지만, 최신 NVLink 기반 설계는 이전 설계와 비교하여 기본 수준에서 다른 기능과 상당히 다른 기술적 특성을 가지고 있다. 보고된 실제 장치는 다음과 같다:[30]
그래픽 카드 모델
브리지 종류
최대 대역폭
NVLink 버전 (추정)
비고
쿼드로 GP100
최대 2개
160GB[32]
NVLink 1.0 (20 GT/s, 2개 또는 4개의 링크)[31]
두 개의 카드가 최대 2개의 브리지 사용
쿼드로 GV100
최대 2개
200GB[28]
NVLink 2.0 (25 GT/s, 4개의 링크)
두 개의 카드가 최대 2개의 브리지 필요
TU104 기반 지포스 RTX 2080
단일 브리지 ("지포스 RTX NVLink-Bridge")[33]
TU102 기반 지포스 RTX 2080 Ti
단일 브리지 ("지포스 RTX NVLink-Bridge")[29]
TU104 기반 쿼드로 RTX 5000[34][35]
단일 브리지 ("NVLink")
50GB[36]
NVLink 2.0 (25 GT/s, 1개의 링크)
TU102 기반 쿼드로 RTX 6000[34][35]
단일 브리지 ("NVLink HB")
100GB[36]
NVLink 2.0 (25 GT/s, 2개의 링크)
TU102 기반 쿼드로 RTX 8000[34][37]
단일 브리지 ("NVLink HB")
100GB[36]
NVLink 2.0 (25 GT/s, 2개의 링크)
5. 서비스 소프트웨어 및 프로그래밍
테슬라, 쿼드로 및 그리드 제품군의 경우, NVML-API (Nvidia Management Library API)는 윈도우 및 리눅스 시스템에서 NVLink 상호 연결의 일부 측면을 프로그래밍 방식으로 제어할 수 있는 일련의 기능을 제공한다. 여기에는 구성 요소 평가 및 버전, 상태/오류 쿼리, 성능 모니터링 등이 포함된다.[38] 또한 NCCL 라이브러리 (Nvidia Collective Communications Library) 제공으로 개발자는 NVLink를 기반으로 인공 지능 및 유사한 계산 집약적 주제에 대한 강력한 구현을 실현할 수 있다.[39] Nvidia 제어판의 "3D 설정" » "SLI, Surround, PhysX 구성" 페이지와 CUDA 샘플 애플리케이션 "simpleP2P"는 이러한 API를 사용하여 NVLink 기능과 관련한 서비스를 구현한다. 리눅스 플랫폼에서 "nvidia-smi nvlink" 하위 명령을 사용하는 명령줄 애플리케이션은 유사한 고급 정보 및 제어 기능을 제공한다.[30]
6. 역사
2016년4월 5일, 엔비디아는 Tesla P100 제품 등에서 사용되는 파스칼 마이크로아키텍처에 NVLink를 구현한다고 발표했다.[40] NVLink 1세대는 GPU와 GPU 간 연결에 80GB/s의 대역폭을 제공했다.
2014년, 미국 에너지부는 엔비디아와 IBM과 "서밋"과 "시에라"라는 두 대의 슈퍼컴퓨터를 구축하는 계약을 체결했다. 이 시스템들은 볼타 (마이크로아키텍처)영어와 POWER9 패밀리 CPU를 조합하였으며, 노드 상호 연결에는 대역폭 300GB/s의 NVLink 2.0이 사용되었고, 시스템 인터커넥트에는 인피니밴드 기반의 것이 사용되었다.[45]
2020년, 엔비디아는 2021년 1월 1일부터 RTX 2000 시리즈 및 이전 제품에 더 이상 새로운 SLI 드라이버 프로파일을 추가하지 않을 것이라고 발표했다.[46]
2022년 현재, 최신 4세대 NVLink는 호퍼 (마이크로아키텍처)영어에 있으며, 대역폭은 900GB/s이다.
참조
[1]
뉴스
Nvidia NVLINK 2.0 arrives in IBM servers next year
http://www.fudzilla.[...]
fudzilla.com
2016-08-24
[2]
웹사이트
NVIDIA DGX-1 With Tesla V100 System Architecture
http://images.nvidia[...] [3]
웹사이트
What Is NVLink?
http://blogs.nvidia.[...]
Nvidia
2014-11-14
[4]
뉴스
NVIDIA Ampere Unleashed: NVIDIA Announces New GPU Architecture, A100 GPU, and Accelerator
https://www.anandtec[...]
AnandTech
2020-05-14
[5]
웹사이트
Nvidia reveals next-gen Hopper GPU architecture
https://www.club386.[...]
2022-03-23
[6]
웹사이트
PCIe - PCI Express (1.1 / 2.0 / 3.0 / 4.0 / 5.0)
https://www.elektron[...] [7]
웹사이트
PCIe 5.0 Is Ready For Prime Time
https://www.tomshard[...]
2019-01-17
[8]
웹사이트
The PCIe® 6.0 Specification Webinar Q&A: A Deeper Dive into FLIT Mode, PAM4, and Forward Error Correction (FEC) PCI-SIG
https://pcisig.com/b[...]
PCI-SIG
2024-11-28
[9]
웹사이트
NVLink-Network Switch - NVIDIA's Switch Chip for High Communication-Bandwidth SuperPODs
https://hc34.hotchip[...]
2022-08-23
[10]
웹사이트
NVIDIA Blackwell Architecture Technical Overview
https://resources.nv[...]
2024-11-28
[11]
웹사이트
NVIDIA Tesla P100 [SXM2], 16GB HBM2 (NVTP100-SXM) | heise online Preisvergleich / Deutschland
https://geizhals.de/[...] [12]
웹사이트
PNY Tesla P100 [PCIe], 16GB HBM2 (TCSP100M-16GB-PB/NVTP100-16) ab € 4990,00 (2020) | heise online Preisvergleich / Deutschland
https://geizhals.de/[...]
2023-08-14
[13]
뉴스
NVLink Takes GPU Acceleration To The Next Level
https://www.nextplat[...]
nextplatform.com
2016-05-04
[14]
웹사이트
NVIDIA Tesla V100 SXM2 16 GB Specs
https://www.techpowe[...]
2023-08-14
[15]
웹사이트
PNY Quadro GV100, 32GB HBM2, 4x DP (VCQGV100-PB) ab € 10199,00 (2020) | heise online Preisvergleich / Deutschland
https://geizhals.de/[...]
2023-08-14
[16]
웹사이트
Nvidia Unifies AI Compute With "Ampere" GPU
http://www.nextplatf[...]
2020-05-14
[17]
웹사이트
Data sheet
https://www.nvidia.c[...]
2020-09-15
[18]
웹사이트
NVIDIA ampere GA102 GPU Architecture Whitepaper
https://www.nvidia.c[...]
2023-05-02
[19]
웹사이트
Tensor Core GPU
https://www.nvidia.c[...]
2023-05-02
[20]
웹사이트
All aboard the PCIe bus for Nvidia's Tesla P100 supercomputer grunt
https://www.theregis[...]
2016-06-20
[21]
웹사이트
Nvidia Tesla V100: PCIe-Steckkarte mit Volta-Grafikchip und 16 GByte Speicher angekündigt
https://www.heise.de[...]
2017-06-22
[22]
뉴스
GV100 Blockdiagramm
https://www.hardware[...]
hardwareluxx.de
2017-05-10
[23]
웹사이트
Nvidia's Turing Architecture Explored: Inside the GeForce RTX 2080
https://www.tomshard[...]
2018-09-14
[24]
웹사이트
A100 PCIe: NVIDIA GA100-GPU kommt auch als PCI-Express-Variante
https://www.hardware[...]
2020-06-22
[25]
웹사이트
NVLINK AND NVSWITCH
https://www.nvidia.c[...]
2021-02-07
[26]
웹사이트
A Big Memory Nvidia GH200 Next to Your Desk: Closer Than You Think
https://www.hpcwire.[...]
2024-02-23
[27]
웹사이트
Comparing NVLink vs PCI-E with NVIDIA Tesla P100 GPUs on OpenPOWER Servers
https://www.microway[...]
2017-01-26
[28]
웹사이트
NVIDIA Quadro NVLink Grafikprozessor-Zusammenschaltung in Hochgeschwindigkeit
https://www.nvidia.c[...] [29]
웹사이트
Grafik neu erfunden: NVIDIA GeForce RTX 2080 Ti-Grafikkarte
https://www.nvidia.c[...] [30]
웹사이트
NVLink on NVIDIA GeForce RTX 2080 & 2080 Ti in Windows 10
https://www.pugetsys[...]
2018-10-05
[31]
문서
dead link
[32]
웹사이트
NVIDIA präsentiert Quadro GP100 mit GP100-GPU und 16 GB HBM2
https://www.hardware[...]
2017-02-05
[33]
웹사이트
NVIDIA GeForce RTX 2080 Founders Edition Graphics Card
https://www.nvidia.c[...] [34]
웹사이트
NVIDIA Quadro Graphics Cards for Professional Design Workstations
https://www.nvidia.c[...] [35]
웹사이트
NVIDIA Quadro RTX 6000 und RTX 5000 Ready für Pre-Order
https://www.hardware[...]
2018-10-01
[36]
웹사이트
'NVLink | pny.com'
https://www.pny.com/[...] [37]
웹사이트
NVIDIA Quadro RTX 8000 Specs
https://www.techpowe[...]
2023-08-14
[38]
웹사이트
NvLink Methods
http://docs.nvidia.c[...] [39]
웹사이트
NVIDIA Collective Communications Library (NCCL)
https://developer.nv[...]
2017-05-10
[40]
웹사이트
Inside Pascal: NVIDIA's Newest Computing Platform
https://devblogs.nvi[...]
2016-04-05
[41]
웹사이트
Anandtech.com
[42]
웹사이트
NVIDIA Unveils the DGX-1 HPC Server: 8 Teslas, 3U, Q2 2016
http://www.anandtech[...]
anandtech.com
2016-04
[43]
웹사이트
How NVLink Will Enable Faster, Easier Multi-GPU Computing
https://devblogs.nvi[...]
Mark Harris
2014-11-14
[44]
웹사이트
Whitepaper: Summit and Sierra Supercomputers
http://www.teratec.e[...]
2014-11-01
[45]
웹사이트
Nvidia Volta, IBM POWER9 Land Contracts For New US Government Supercomputers
http://www.anandtech[...]
AnandTech
2014-11-17
[46]
웹사이트
RIP: Nvidia slams the final nail in SLI's coffin, no new profiles after 2020
https://www.pcworld.[...]
PC World
2020-09-18
[47]
웹사이트
Inside Pascal: NVIDIA’s Newest Computing Platform
https://devblogs.nvi[...]
2016-04-05
[48]
웹사이트
Whitepaper: Summit and Sierra Supercomputers
http://www.teratec.e[...]
2014-11-01
[49]
웹사이트
NVLink と NVSwitch: 最速の HPC データ センター プラットフォーム
https://www.nvidia.c[...]
2022-04-30
[50]
웹사이트
Nvidia Volta, IBM POWER9 Land Contracts For New US Government Supercomputers
http://www.anandtech[...]
AnandTech
2014-11-17
[51]
웹사이트
All aboard the PCIe bus for Nvidia's Tesla P100 supercomputer grunt
https://www.theregis[...]
Chris Williams at theregister.co.uk
2016-06-20
[52]
웹사이트
NVLink Takes GPU Acceleration To The Next Level
https://www.nextplat[...]
Timothy Prickett Morgan at nextplatform.com
2016-05-04
[53]
웹사이트
POWER9 Webinar presentation by IBM for Power Systems VUG
https://www.ibm.com/[...]
Jeff Stuecheli
2017-01-26
[54]
웹사이트
GV100 Blockdiagramm
https://www.hardware[...]
Andreas Schilling on hardwareluxx.de
2017-05-10
[55]
웹사이트
NVIDIA Volta GV100 GPU Chip For Summit Supercomputer Twice as Fast as Pascal P100 – Speculated To Hit 9.5 TFLOPs FP64 Compute
http://wccftech.com/[...]
Hassan Mujtaba at wccftech.com
2016-12-20
본 사이트는 AI가 위키백과와 뉴스 기사,정부 간행물,학술 논문등을 바탕으로 정보를 가공하여 제공하는 백과사전형 서비스입니다.
모든 문서는 AI에 의해 자동 생성되며, CC BY-SA 4.0 라이선스에 따라 이용할 수 있습니다.
하지만, 위키백과나 뉴스 기사 자체에 오류, 부정확한 정보, 또는 가짜 뉴스가 포함될 수 있으며, AI는 이러한 내용을 완벽하게 걸러내지 못할 수 있습니다.
따라서 제공되는 정보에 일부 오류나 편향이 있을 수 있으므로, 중요한 정보는 반드시 다른 출처를 통해 교차 검증하시기 바랍니다.