볼타 (마이크로아키텍처)
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.
1. 개요
볼타는 엔비디아가 개발한 GPU 마이크로아키텍처로, 2017년에 발표되었다. 12nm FinFET 공정으로 제작되었으며, CUDA 컴퓨트 기능 7.0, 텐서 코어, NVLink 2.0, HBM2 메모리를 지원한다. 볼타 아키텍처는 정수 및 부동 소수점 연산의 동시 실행, 211억 개의 트랜지스터 집적, 1세대 텐서 코어, PureVideo 기능 세트 I 하드웨어 비디오 디코딩 등의 개선 사항을 제공한다. 볼타 기반 제품으로는 Tesla V100, Titan V, Quadro GV100 등이 있으며, 자율 주행차용 Tegra Xavier SoC의 GPU로도 사용된다. V100 가속기는 32GB 및 16GB 버전으로 출시되었으며, DGX 시스템에서 활용된다.
더 읽어볼만한 페이지
- 엔비디아 마이크로아키텍처 - 튜링 (마이크로아키텍처)
튜링은 엔비디아가 개발한 마이크로아키텍처로, 실시간 광선 추적을 위해 쿠다 코어, 레이 트레이싱 코어, 텐서 코어 등을 결합하여 그래픽 성능을 향상시킨다. - 엔비디아 마이크로아키텍처 - 파스칼 (마이크로아키텍처)
파스칼은 엔비디아가 2016년에 출시한 마이크로아키텍처로, 다양한 GPU를 포함하며 고대역폭 메모리 2, NVLink, 향상된 동시 다중 프로젝션 등의 기술을 지원하고 16비트 부동 소수점 연산 성능을 향상시켰으며, 2017년 볼타, 2018년 튜링에 의해 대체되었다. - 그래픽스 마이크로아키텍처 - 인텔 Xe
인텔 Xe는 저전력부터 고성능 컴퓨팅까지 다양한 시장을 목표로 하는 인텔의 GPU 아키텍처 제품군으로, Xe-LP, Xe-HPG, Xe-HP, Xe-HPC 등의 하위 아키텍처를 가지며 외장 그래픽 카드인 인텔 아크 시리즈와 내장 그래픽, 데이터 센터용 GPU 등에 활용된다. - 그래픽스 마이크로아키텍처 - 테라스케일 (마이크로아키텍처)
테라스케일은 AMD가 개발한 GPU 마이크로아키텍처로, 셰이더 처리량 증가를 위해 통합 셰이더 모델을 사용하며, VLIW 아키텍처를 기반으로 라데온 HD 2000, 3000, 4000, 5000, 6900 시리즈에 적용되었다가 그래픽스 코어 넥스트 아키텍처로 대체되었다.
볼타 (마이크로아키텍처) | |
---|---|
개요 | |
아키텍처 | |
지원 | |
제품 |
2. Details
볼타 아키텍처는 자율주행차에 중점을 둔 Tegra SoC의 Xavier 세대 내 GPU 마이크로아키텍처로 처음 발표되었다.[17][18]
엔비디아는 2017년 5월 10일 연례 GPU 기술 컨퍼런스 기조 연설에서 볼타 마이크로아키텍처와 Tesla V100을 공식 발표했다.[3] 볼타 GV100 GPU는 TSMC의 12 nm 공정으로 제조되었으며, HBM2 메모리를 탑재한 것이 특징이다.[19][9][8]
이후 볼타 아키텍처 기반의 소비자 및 전문가용 제품들이 출시되었다. 2017년 12월 7일에는 엔비디아 TITAN V가,[20][21] 2018년 3월 27일에는 Quadro GV100이 공식 발표되었다.[22] 2018년 6월에는 타이탄 V의 메모리 용량을 늘린 타이탄 V CEO 에디션이 발표되기도 했다.[25][26]
볼타 아키텍처는 GPGPU 연산 성능을 바탕으로 미국 에너지부의 서밋 및 시에라 슈퍼컴퓨터에도 채택되었다.[27][28] 이 슈퍼컴퓨터들에서 볼타 GPU는 NVLink 2.0 인터페이스를 통해 POWER9 CPU와 연결되며, 이는 캐시 일관성을 지원하여 GPGPU 성능을 향상시키는 데 기여한다.[29][30][31]
2. 1. 아키텍처 개선 사항
볼타 아키텍처의 주요 개선 사항은 다음과 같다.- CUDA 컴퓨트 기능 7.0[14]
- 정수 및 부동 소수점 연산의 동시 실행
- TSMC의 12 nm FinFET 공정을 사용하여 211억 개의 트랜지스터를 집적했다.[9][8]
- 고대역폭 메모리 2(HBM2)를 사용한다.[9][10]
- NVLink 2.0: CPU와 GPU 간, 그리고 여러 GPU 간의 고대역폭 버스이다. PCI Express보다 훨씬 높은 전송 속도를 제공하며, 레인당 25Gbit/s 속도로 추정된다.[30] (Titan V에서는 비활성화되었다.)
- 텐서 코어: 두 개의 4×4 FP16 행렬을 곱하고, 그 결과에 융합 곱셈-덧셈(FMA) 연산을 사용하여 세 번째 FP16 또는 FP32 행렬을 더하는 유닛이다. 결과는 FP32 또는 FP16으로 출력될 수 있다.[11] 텐서 코어는 신경망 훈련 속도를 높이기 위해 도입되었다.[11] 볼타의 텐서 코어는 1세대이며, 이후 앰페어 아키텍처에서는 3세대 텐서 코어가 탑재되었다.[12][13]
- PureVideo 기능 세트 I 하드웨어 비디오 디코딩 지원
=== 컴퓨트 기능 비교: GP100 vs GV100 vs GA100 ===[14]
GPU 기능 | 엔비디아 테슬라 P100 | 엔비디아 테슬라 V100 | 엔비디아 A100 |
---|---|---|---|
GPU 코드네임 | GP100 | GV100 | GA100 |
GPU 아키텍처 | 엔비디아 파스칼 | 엔비디아 볼타 | 엔비디아 앰페어 |
컴퓨트 기능 | 6.0 | 7.0 | 8.0 |
스레드 / 워프 | 32 | 32 | 32 |
최대 워프 / SM | 64 | 64 | 64 |
최대 스레드 / SM | 2048 | 2048 | 2048 |
최대 스레드 블록 / SM | 32 | 32 | 32 |
최대 32비트 레지스터 / SM | 65536 | 65536 | 65536 |
최대 레지스터 / 블록 | 65536 | 65536 | 65536 |
최대 레지스터 / 스레드 | 255 | 255 | 255 |
최대 스레드 블록 크기 | 1024 | 1024 | 1024 |
FP32 코어 / SM | 64 | 64 | 64 |
SM 레지스터 대 FP32 코어의 비율 | 1024 | 1024 | 1024 |
공유 메모리 크기 / SM | 64KB | 최대 96KB 구성 가능 | 최대 164KB 구성 가능 |
=== 정밀도 지원 매트릭스 비교 ===[15][16]
GPU 모델 | 지원되는 CUDA 코어 정밀도 | 지원되는 텐서 코어 정밀도 | ||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
FP16 | FP32 | FP64 | INT1 | INT4 | INT8 | TF32 | BF16 | FP16 | FP32 | FP64 | INT1 | INT4 | INT8 | TF32 | BF16 | |
엔비디아 테슬라 P4 | X | O | O | X | X | O | X | X | X | X | X | X | X | X | X | X |
엔비디아 테슬라 P100 | O | O | O | X | X | X | X | X | X | X | X | X | X | X | X | X |
엔비디아 테슬라 V100 (볼타) | O | O | O | X | X | O | X | X | O | X | X | X | X | X | X | X |
엔비디아 튜링 | O | O | O | X | X | X | X | X | O | X | X | O | O | O | X | X |
엔비디아 A100 | O | O | O | X | X | O | X | O | O | X | O | O | O | O | O | O |
범례:
=== 디코딩 성능 비교 ===
GPU 모델 | 동시 스트림 수 | H.264 디코딩 (1080p30) | H.265(HEVC) 디코딩 (1080p30) | VP9 디코딩 (1080p30) |
---|---|---|---|---|
엔비디아 테슬라 V100 | 16 | 22 | 22 | |
엔비디아 A100 | 75 | 157 | 108 |
2. 2. 컴퓨트 기능 비교
볼타 아키텍처는 CUDA 컴퓨트 기능 7.0을 지원하며, 정수 및 부동 소수점 연산의 동시 실행이 가능하다.'''컴퓨트 기능 비교: GP100 vs GV100 vs GA100'''[14]
GPU 기능 | 엔비디아 테슬라 P100 | 엔비디아 테슬라 V100 | 엔비디아 A100 |
---|---|---|---|
GPU 코드네임 | GP100 | GV100 | GA100 |
GPU 아키텍처 | 엔비디아 파스칼 | 엔비디아 볼타 | 엔비디아 암페어 |
컴퓨트 기능 | 6.0 | 7.0 | 8.0 |
스레드 / 워프 | 32 | 32 | 32 |
최대 워프 / SM | 64 | 64 | 64 |
최대 스레드 / SM | 2048 | 2048 | 2048 |
최대 스레드 블록 / SM | 32 | 32 | 32 |
최대 32비트 레지스터 / SM | 65536 | 65536 | 65536 |
최대 레지스터 / 블록 | 65536 | 65536 | 65536 |
최대 레지스터 / 스레드 | 255 | 255 | 255 |
최대 스레드 블록 크기 | 1024 | 1024 | 1024 |
FP32 코어 / SM | 64 | 64 | 64 |
SM 레지스터 대 FP32 코어의 비율 | 1024 | 1024 | 1024 |
공유 메모리 크기 / SM | 64KB | 최대 96KB 구성 가능 | 최대 164KB 구성 가능 |
GPU 모델 | 지원되는 CUDA 코어 정밀도 | 지원되는 텐서 코어 정밀도 | ||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
FP16 | FP32 | FP64 | INT1 | INT4 | INT8 | TF32 | BF16 | FP16 | FP32 | FP64 | INT1 | INT4 | INT8 | TF32 | BF16 | |
엔비디아 테슬라 P4 | 아니요 | 예 | 예 | 아니요 | 아니요 | 예 | 아니요 | 아니요 | 아니요 | 아니요 | 아니요 | 아니요 | 아니요 | 아니요 | 아니요 | 아니요 |
엔비디아 P100 | 예 | 예 | 예 | 아니요 | 아니요 | 아니요 | 아니요 | 아니요 | 아니요 | 아니요 | 아니요 | 아니요 | 아니요 | 아니요 | 아니요 | 아니요 |
엔비디아 볼타 (GV100) | 예 | 예 | 예 | 아니요 | 아니요 | 예 | 아니요 | 아니요 | 예 | 아니요 | 아니요 | 아니요 | 아니요 | 아니요 | 아니요 | 아니요 |
엔비디아 튜링 | 예 | 예 | 예 | 아니요 | 아니요 | 아니요 | 아니요 | 아니요 | 예 | 아니요 | 아니요 | 예 | 예 | 예 | 아니요 | 아니요 |
엔비디아 A100 | 예 | 예 | 예 | 아니요 | 아니요 | 예 | 아니요 | 예 | 예 | 아니요 | 예 | 예 | 예 | 예 | 예 | 예 |
'''범례:'''
'''디코딩 성능 비교'''
GPU 모델 | 동시 스트림 | H.264 디코딩(1080p30) | H.265(HEVC) 디코딩(1080p30) | VP9 디코딩(1080p30) |
---|---|---|---|---|
V100 | 16 | 22 | 22 | |
A100 | 75 | 157 | 108 |
2. 3. 정밀도 지원
볼타 아키텍처는 다양한 연산 정밀도를 지원하여 특정 작업 부하에 대한 성능과 효율성을 최적화한다. 특히 딥러닝 추론 및 훈련과 같은 작업에서 중요한 낮은 정밀도 연산에 대한 지원이 강화되었다.[11]볼타에 도입된 주요 특징 중 하나는 텐서 코어이다. 이 코어는 두 개의 4×4 FP16 행렬을 곱한 다음, 융합 곱셈-덧셈 연산을 사용하여 세 번째 FP16 또는 FP32 행렬을 결과에 더하는 방식으로 작동한다. 최종 결과는 FP32 정밀도를 가지며, 필요에 따라 FP16으로 변환될 수 있다.[11] 텐서 코어는 주로 신경망 훈련 속도를 가속화하는 데 사용된다.[11] 볼타의 텐서 코어는 1세대에 해당하며, 후속 아키텍처인 암페어에서는 3세대 텐서 코어로 발전했다.[12][13]
다음 표는 볼타 아키텍처(예: 엔비디아 테슬라 V100)와 다른 엔비디아 GPU 아키텍처 간의 정밀도 지원을 비교한 것이다.[15][16]
GPU 모델 | 지원되는 CUDA 코어 정밀도 | 지원되는 텐서 코어 정밀도 | ||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
FP16 | FP32 | FP64 | INT1 | INT4 | INT8 | TF32 | BF16 | FP16 | FP32 | FP64 | INT1 | INT4 | INT8 | TF32 | BF16 | |
엔비디아 테슬라 P4 | 미지원 | 지원 | 지원 | 미지원 | 미지원 | 지원 | 미지원 | 미지원 | 미지원 | 미지원 | 미지원 | 미지원 | 미지원 | 미지원 | 미지원 | 미지원 |
엔비디아 P100 | 지원 | 지원 | 지원 | 미지원 | 미지원 | 미지원 | 미지원 | 미지원 | 미지원 | 미지원 | 미지원 | 미지원 | 미지원 | 미지원 | 미지원 | 미지원 |
엔비디아 볼타 | 지원 | 지원 | 지원 | 미지원 | 미지원 | 지원 | 미지원 | 미지원 | 지원 | 미지원 | 미지원 | 미지원 | 미지원 | 미지원 | 미지원 | 미지원 |
엔비디아 튜링 | 지원 | 지원 | 지원 | 미지원 | 미지원 | 미지원 | 미지원 | 미지원 | 지원 | 미지원 | 미지원 | 지원 | 지원 | 지원 | 미지원 | 미지원 |
엔비디아 A100 | 지원 | 지원 | 지원 | 미지원 | 미지원 | 지원 | 미지원 | 지원 | 지원 | 미지원 | 지원 | 지원 | 지원 | 지원 | 지원 | 지원 |
범례:
- '''FPnn''': nn 비트 부동소수점
- '''INTn''': n 비트 정수
- '''INT1''': 바이너리(1비트 정수)
- '''TF32''': TensorFloat-32
- '''BF16''': bfloat16
표에서 볼 수 있듯이, 볼타 아키텍처는 CUDA 코어에서 FP16, FP32, FP64, INT8 정밀도를 지원하며, 텐서 코어에서는 FP16 정밀도 연산을 가속한다. 이는 이전 세대인 파스칼(P100)에 비해 INT8 지원이 추가되고, 텐서 코어를 통한 FP16 연산 가속 기능이 도입된 점이 특징이다. 후속 아키텍처인 튜링과 암페어에서는 지원되는 정밀도 종류와 텐서 코어 기능이 더욱 확장되었다.
2. 4. 디코딩 성능 비교
동시 스트림 | H.264 디코딩(1080p30) | H.265(HEVC) 디코딩(1080p30) | VP9 디코딩(1080p30) |
---|---|---|---|
V100 | 16 | 22 | 22 |
A100 | 75 | 157 | 108 |
볼타는 자율주행차에 주력하는 Tegra SoC의 Xavier 세대 내 GPU 마이크로아키텍처로 발표되었다.[17][18]
볼타는 GPGPU 연산에 사용되며, 서밋 및 시에라 슈퍼컴퓨터에도 포함될 것으로 알려졌다.[27][28] 볼타 GPU는 NVLink 2.0을 통해 POWER9 CPU에 연결되며, 이는 캐시 일관성을 지원하여 GPGPU 성능을 향상시킬 것으로 예상된다.[29][30][31]
DGX 시스템에서 사용되는 주요 엔비디아 가속기 사양 비교는 아래 표와 같다.[32][33][34] 이 중 V100 가속기는 2017년 3분기에 출시되었으며, 16GB HBM2 모델과 32GB HBM2 모델 두 가지로 제공되었다. 두 모델은 주로 VRAM 용량과 TDP(열 설계 전력)에서 차이를 보인다.
[1]
뉴스
Nvidia Volta Trademark Status
https://tsdr.uspto.g[...]
United_States_Patent_and_Trademark_Office
2023-08-14
3. 제품
2017년 5월 10일 엔비디아 연례 GPU 기술 컨퍼런스 기조 연설에서 엔비디아는 볼타 마이크로아키텍처와 Tesla V100을 공식 발표했다.[3] 볼타 GV100 GPU는 HBM2 메모리를 사용하여 TSMC 12 nm 공정으로 제작되었으며, 900GB/s의 대역폭을 갖는다.[19]
엔비디아는 2017년 12월 7일 Nvidia Titan V를 공식 발표했다.[20][21]
엔비디아는 2018년 3월 27일 Quadro GV100을 공식 발표했다.[22]모델 출시 코드명 (들) 공정
(nm)트랜지스터
(십억 개)다이 크기
(mm2)버스 인터페이스 코어 구성 SM
개수그래픽
처리
클러스터L2 캐시
크기 (MiB)클럭 속도 필레이트 메모리 처리 성능 (GFLOPS) TDP
(W)NVLink 지원 출시 가격
(USD)CUDA
코어텐서
코어기본 코어
클럭 (MHz)부스트 클럭
(MHz)메모리
(MT/s)픽셀
(GP/s)텍스처
(GT/s)크기
(GiB)대역폭
(GB/s)버스
유형버스 폭
(bit)단정밀도 (부스트) 배정밀도 (부스트) 반정밀도 (부스트) MSRP Nvidia Titan V[23] 2017년 12월 7일 GV100-400-A1 TSMC 12 nm 21.1 815mm2 PCIe 3.0 ×16 5120:320:96 640 80 6 4.5 1200 1455 1700 139.7 465.6 12 652.8GB/s HBM2 3072 12288 (14899) 6144 (7450) 24576 (29798) 250 아니요 2999USD Quadro GV100[24] 2018년 3월 27일 GV100 5120:320:128 6 1132 1628 1696 208.4 521 32 868.4GB/s 4096 11592 (16671) 5796 (8335) 23183 (33341) 예 8999USD Nvidia Titan V CEO 에디션[25][26] 2018년 6월 21일 1200 1455 1700 186.2 465.6 870.4GB/s 12288 (14899) 6144 (7450) 24576 (29798) N/A
4. 응용
5. V100 가속기 및 DGX V100
모델 아키텍처 소켓 FP32
CUDA
코어FP64 코어
(텐서 제외)혼합
INT32/FP32
코어INT32
코어부스트
클럭메모리
클럭메모리
버스 폭메모리
대역폭VRAM 단정밀도
(FP32)배정밀도
(FP64)INT8
(비텐서)INT8
밀집 텐서INT32 FP4
밀집 텐서FP16 FP16
밀집 텐서bfloat16
밀집 텐서텐서플로트-32
(TF32)
밀집 텐서FP64
밀집 텐서상호 연결
(NVLink)GPU L1 캐시 L2 캐시 TDP 다이 크기 트랜지스터
수공정 출시 B200 블랙웰 SXM6 N/A N/A N/A N/A N/A 8 Gbit/s HBM3e 8192-비트 8 TB/초 192 GB HBM3e N/A N/A N/A 4.5 POPS N/A 9 PFLOPS N/A 2.25 PFLOPS 2.25 PFLOPS 1.2 PFLOPS 40 TFLOPS 1.8 TB/초 GB100 N/A N/A 1000 W N/A 208 B TSMC 4NP 2024년 4분기 (예상) B100 블랙웰 SXM6 N/A N/A N/A N/A N/A 8 Gbit/s HBM3e 8192-비트 8 TB/초 192 GB HBM3e N/A N/A N/A 3.5 POPS N/A 7 PFLOPS N/A 1.98 PFLOPS 1.98 PFLOPS 989 TFLOPS 30 TFLOPS 1.8 TB/초 GB100 N/A N/A 700 W N/A 208 B TSMC 4NP H200 호퍼 SXM5 16896 4608 16896 N/A 1980 MHz 6.3 Gbit/s HBM3e 6144-비트 4.8 TB/초 141 GB HBM3e 67 TFLOPS 34 TFLOPS N/A 1.98 POPS N/A N/A N/A 990 TFLOPS 990 TFLOPS 495 TFLOPS 67 TFLOPS 900 GB/초 GH100 25344 KB (192 KB × 132) 51200 KB 1000 W 814mm2 80 B TSMC 4N 2023년 3분기 H100 호퍼 SXM5 16896 4608 16896 N/A 1980 MHz 5.2 Gbit/s HBM3 5120-비트 3.35 TB/초 80 GB HBM3 67 TFLOPS 34 TFLOPS N/A 1.98 POPS N/A N/A N/A 990 TFLOPS 990 TFLOPS 495 TFLOPS 67 TFLOPS 900 GB/초 GH100 25344 KB (192 KB × 132) 51200 KB 700 W 814mm2 80 B TSMC 4N 2022년 3분기 A100 80GB 암페어 SXM4 6912 3456 6912 N/A 1410 MHz 3.2 Gbit/s HBM2e 5120-비트 1.52 TB/초 80 GB HBM2e 19.5 TFLOPS 9.7 TFLOPS N/A 624 TOPS 19.5 TOPS N/A 78 TFLOPS 312 TFLOPS 312 TFLOPS 156 TFLOPS 19.5 TFLOPS 600 GB/초 GA100 20736 KB (192 KB × 108) 40960 KB 400 W 826mm2 54.2 B TSMC N7 2020년 1분기 A100 40GB 암페어 SXM4 6912 3456 6912 N/A 1410 MHz 2.4 Gbit/s HBM2 5120-비트 1.52 TB/초 40 GB HBM2 19.5 TFLOPS 9.7 TFLOPS N/A 624 TOPS 19.5 TOPS N/A 78 TFLOPS 312 TFLOPS 312 TFLOPS 156 TFLOPS 19.5 TFLOPS 600 GB/초 GA100 20736 KB (192 KB × 108) 40960 KB 400 W 826mm2 54.2 B TSMC N7 V100 32GB 볼타 SXM3 5120 2560 N/A 5120 1530 MHz 1.75 Gbit/s HBM2 4096-비트 900 GB/초 32 GB HBM2 15.7 TFLOPS 7.8 TFLOPS 62 TOPS N/A 15.7 TOPS N/A 31.4 TFLOPS 125 TFLOPS N/A N/A N/A 300 GB/초 GV100 10240 KB (128 KB × 80) 6144 KB 350 W 815mm2 21.1 B TSMC 12FFN 2017년 3분기 V100 16GB 볼타 SXM2 5120 2560 N/A 5120 1530 MHz 1.75 Gbit/s HBM2 4096-비트 900 GB/초 16 GB HBM2 15.7 TFLOPS 7.8 TFLOPS 62 TOPS N/A 15.7 TOPS N/A 31.4 TFLOPS 125 TFLOPS N/A N/A N/A 300 GB/초 GV100 10240 KB (128 KB × 80) 6144 KB 300 W 815mm2 21.1 B TSMC 12FFN P100 파스칼 SXM/SXM2 N/A 1792 3584 N/A 1480 MHz 1.4 Gbit/s HBM2 4096-비트 720 GB/초 16 GB HBM2 10.6 TFLOPS 5.3 TFLOPS N/A N/A N/A N/A 21.2 TFLOPS N/A N/A N/A N/A 160 GB/초 GP100 1344 KB (24 KB × 56) 4096 KB 300 W 610mm2 15.3 B TSMC 16FF+ 2016년 2분기
참조
[2]
뉴스
Nvidia's Volta GPU to feature on-chip DRAM
https://techreport.c[...]
The Tech Report
2017-03-14
[3]
뉴스
The NVIDIA GPU Tech Conference 2017 Keynote Live Blog
https://www.anandtec[...]
2018-11-03
[4]
웹사이트
NVIDIA Volta AI Architecture {{!}} NVIDIA
https://www.nvidia.c[...]
2018-04-11
[5]
뉴스
Volta trademark Cancellation Proceeding
https://ttabvue.uspt[...]
United_States_Patent_and_Trademark_Office
[6]
뉴스
Volta trademark Exparte Appeal Proceeding
https://ttabvue.uspt[...]
United_States_Patent_and_Trademark_Office
[7]
뉴스
Volta Trademark status
https://tsdr.uspto.g[...]
United_States_Patent_and_Trademark_Office
[8]
웹사이트
Inside Volta: The World's Most Advanced Data Center GPU
https://devblogs.nvi[...]
2017-05-10
[9]
뉴스
Report: TSMC set to fabricate Volta and Centriq on 12-nm process
https://techreport.c[...]
The Tech Report
2017-03-14
[10]
웹사이트
Nvidia's Volta GPU to feature on-chip DRAM
https://techreport.c[...]
The Tech Report
2013-03-19
[11]
웹사이트
CUDA 9 Features Revealed: Volta, Cooperative Groups and More
https://devblogs.nvi[...]
2017-08-12
[12]
웹사이트
NVIDIA Ampere Architecture In-Depth
https://devblogs.nvi[...]
2020-05-14
[13]
웹사이트
NVIDIA A100 Tensor Core GPU Architecture
https://www.nvidia.c[...]
2023-12-15
[14]
웹사이트
NVIDIA A100 Tensor Core GPU Architecture: Unprecedented Acceleration at Every Scale
https://www.nvidia.c[...]
2020-09-18
[15]
웹사이트
NVIDIA Tensor Cores: Versatility for HPC & AI
https://www.nvidia.c[...]
[16]
웹사이트
Abstract
https://docs.nvidia.[...]
[17]
뉴스
CES 2017: Nvidia Keynote Liveblog
http://www.anandtech[...]
AnandTech
2017-01-09
[18]
뉴스
NVIDIA DRIVE Xavier, World's Most Powerful SoC, Brings Dramatic New AI Capabilities {{!}} NVIDIA Blog
https://blogs.nvidia[...]
2018-11-03
[19]
뉴스
Nvidia Volta Unveiled
http://www.anandtech[...]
AnandTech
2017-06-02
[20]
웹사이트
NVIDIA TITAN V Transforms the PC into AI Supercomputer
https://nvidianews.n[...]
[21]
웹사이트
Introducing NVIDIA TITAN V: The World's Most Powerful PC Graphics Card
https://www.nvidia.c[...]
[22]
웹사이트
NVIDIA Reinvents the Workstation with Real-Time Ray Tracing
https://nvidianews.n[...]
[23]
웹사이트
Introducing NVIDIA TITAN V: The World's Most Powerful PC Graphics Card
https://www.nvidia.c[...]
2017-12-08
[24]
웹사이트
NVIDIA Quadro GV100
https://www.nvidia.c[...]
2018-03-27
[25]
뉴스
NVIDIA Unveils & Gives Away New Limited Edition 32GB Titan V "CEO Edition"
https://www.anandtec[...]
2018-07-06
[26]
뉴스
NVIDIA TITAN V CEO Edition
https://www.techpowe[...]
2018-07-07
[27]
웹사이트
IBM, Nvidia land $325M supercomputer deal
http://www.cnet.com/[...]
CNET
2015-12-29
[28]
웹사이트
IBM, Nvidia rev HPC engines in next-gen supercomputer push
http://www.pcworld.c[...]
PC World
2015-12-29
[29]
뉴스
Nvidia Volta, IBM Power9 Land Contracts for New US Government Supercomputers
http://www.anandtech[...]
Anandtech
2017-03-14
[30]
뉴스
Nvidia's NVLink 2.0 will first appear in Power9 servers next year
http://www.pcworld.c[...]
PC World
2017-03-14
[31]
웹사이트
NVIDIA 12nm FinFET Volta GPU Architecture Reportedly Replacing Pascal In 2017
http://hothardware.c[...]
HotHardware
2017-01-25
[32]
뉴스
NVIDIA Hopper GPU Architecture and H100 Accelerator Announced: Working Smarter and Harder
https://www.anandtec[...]
AnandTech
2022-03-22
[33]
뉴스
NVIDIA Ampere Unleashed: NVIDIA Announces New GPU Architecture, A100 GPU, and Accelerator
https://www.anandtec[...]
AnandTech
2020-05-14
[34]
웹사이트
NVIDIA Tesla V100 tested: near unbelievable GPU power
https://www.tweaktow[...]
2017-09-17
[35]
뉴스
Nvidia's Volta GPU to feature on-chip DRAM
https://techreport.c[...]
The Tech Report
2017-03-14
[36]
뉴스
The NVIDIA GPU Tech Conference 2017 Keynote Live Blog
https://www.anandtec[...]
2018-11-03
[37]
웹인용
NVIDIA Volta AI Architecture {{!}} NVIDIA
https://www.nvidia.c[...]
2018-04-11
[38]
웹인용
Introducing NVIDIA TITAN V: The World’s Most Powerful PC Graphics Card
https://www.nvidia.c[...]
2017-12-08
[39]
웹인용
NVIDIA Quadro GV100
https://www.nvidia.c[...]
2018-03-27
[40]
뉴스
NVIDIA Unveils & Gives Away New Limited Edition 32GB Titan V "CEO Edition"
https://www.anandtec[...]
2018-07-06
[41]
뉴스
NVIDIA TITAN V CEO Edition
https://www.techpowe[...]
TechPowerUp
2018-07-07
본 사이트는 AI가 위키백과와 뉴스 기사,정부 간행물,학술 논문등을 바탕으로 정보를 가공하여 제공하는 백과사전형 서비스입니다.
모든 문서는 AI에 의해 자동 생성되며, CC BY-SA 4.0 라이선스에 따라 이용할 수 있습니다.
하지만, 위키백과나 뉴스 기사 자체에 오류, 부정확한 정보, 또는 가짜 뉴스가 포함될 수 있으며, AI는 이러한 내용을 완벽하게 걸러내지 못할 수 있습니다.
따라서 제공되는 정보에 일부 오류나 편향이 있을 수 있으므로, 중요한 정보는 반드시 다른 출처를 통해 교차 검증하시기 바랍니다.
문의하기 : help@durumis.com