볼타 (마이크로아키텍처)

"오늘의AI위키"는 AI 기술로 일관성 있고 체계적인 최신 지식을 제공하는 혁신 플랫폼입니다.
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.

1. 개요
2. Details
3. 제품
4. 응용
5. V100 가속기 및 DGX V100
참조

1. 개요

볼타는 엔비디아가 개발한 GPU 마이크로아키텍처로, 2017년에 발표되었다. 12nm FinFET 공정으로 제작되었으며, CUDA 컴퓨트 기능 7.0, 텐서 코어, NVLink 2.0, HBM2 메모리를 지원한다. 볼타 아키텍처는 정수 및 부동 소수점 연산의 동시 실행, 211억 개의 트랜지스터 집적, 1세대 텐서 코어, PureVideo 기능 세트 I 하드웨어 비디오 디코딩 등의 개선 사항을 제공한다. 볼타 기반 제품으로는 Tesla V100, Titan V, Quadro GV100 등이 있으며, 자율 주행차용 Tegra Xavier SoC의 GPU로도 사용된다. V100 가속기는 32GB 및 16GB 버전으로 출시되었으며, DGX 시스템에서 활용된다.

더 읽어볼만한 페이지

엔비디아 마이크로아키텍처 - 튜링 (마이크로아키텍처)
튜링은 엔비디아가 개발한 마이크로아키텍처로, 실시간 광선 추적을 위해 쿠다 코어, 레이 트레이싱 코어, 텐서 코어 등을 결합하여 그래픽 성능을 향상시킨다.
엔비디아 마이크로아키텍처 - 파스칼 (마이크로아키텍처)
파스칼은 엔비디아가 2016년에 출시한 마이크로아키텍처로, 다양한 GPU를 포함하며 고대역폭 메모리 2, NVLink, 향상된 동시 다중 프로젝션 등의 기술을 지원하고 16비트 부동 소수점 연산 성능을 향상시켰으며, 2017년 볼타, 2018년 튜링에 의해 대체되었다.
그래픽스 마이크로아키텍처 - 인텔 Xe
인텔 Xe는 저전력부터 고성능 컴퓨팅까지 다양한 시장을 목표로 하는 인텔의 GPU 아키텍처 제품군으로, Xe-LP, Xe-HPG, Xe-HP, Xe-HPC 등의 하위 아키텍처를 가지며 외장 그래픽 카드인 인텔 아크 시리즈와 내장 그래픽, 데이터 센터용 GPU 등에 활용된다.
그래픽스 마이크로아키텍처 - 테라스케일 (마이크로아키텍처)
테라스케일은 AMD가 개발한 GPU 마이크로아키텍처로, 셰이더 처리량 증가를 위해 통합 셰이더 모델을 사용하며, VLIW 아키텍처를 기반으로 라데온 HD 2000, 3000, 4000, 5000, 6900 시리즈에 적용되었다가 그래픽스 코어 넥스트 아키텍처로 대체되었다.

볼타 (마이크로아키텍처)
개요
아키텍처
지원
제품

2. Details

볼타 아키텍처는 자율주행차에 중점을 둔 Tegra SoC의 Xavier 세대 내 GPU 마이크로아키텍처로 처음 발표되었다.^[17]^[18]

엔비디아는 2017년 5월 10일 연례 GPU 기술 컨퍼런스 기조 연설에서 볼타 마이크로아키텍처와 Tesla V100을 공식 발표했다.^[3] 볼타 GV100 GPU는 TSMC의 12 nm 공정으로 제조되었으며, HBM2 메모리를 탑재한 것이 특징이다.^[19]^[9]^[8]

이후 볼타 아키텍처 기반의 소비자 및 전문가용 제품들이 출시되었다. 2017년 12월 7일에는 엔비디아 TITAN V가,^[20]^[21] 2018년 3월 27일에는 Quadro GV100이 공식 발표되었다.^[22] 2018년 6월에는 타이탄 V의 메모리 용량을 늘린 타이탄 V CEO 에디션이 발표되기도 했다.^[25]^[26]

볼타 아키텍처는 GPGPU 연산 성능을 바탕으로 미국 에너지부의 서밋 및 시에라 슈퍼컴퓨터에도 채택되었다.^[27]^[28] 이 슈퍼컴퓨터들에서 볼타 GPU는 NVLink 2.0 인터페이스를 통해 POWER9 CPU와 연결되며, 이는 캐시 일관성을 지원하여 GPGPU 성능을 향상시키는 데 기여한다.^[29]^[30]^[31]

2. 1. 아키텍처 개선 사항

볼타 아키텍처의 주요 개선 사항은 다음과 같다.

CUDA 컴퓨트 기능 7.0^[14]
정수 및 부동 소수점 연산의 동시 실행
TSMC의 12 nm FinFET 공정을 사용하여 211억 개의 트랜지스터를 집적했다.^[9]^[8]
고대역폭 메모리 2(HBM2)를 사용한다.^[9]^[10]
NVLink 2.0: CPU와 GPU 간, 그리고 여러 GPU 간의 고대역폭 버스이다. PCI Express보다 훨씬 높은 전송 속도를 제공하며, 레인당 25Gbit/s 속도로 추정된다.^[30] (Titan V에서는 비활성화되었다.)
텐서 코어: 두 개의 4×4 FP16 행렬을 곱하고, 그 결과에 융합 곱셈-덧셈(FMA) 연산을 사용하여 세 번째 FP16 또는 FP32 행렬을 더하는 유닛이다. 결과는 FP32 또는 FP16으로 출력될 수 있다.^[11] 텐서 코어는 신경망 훈련 속도를 높이기 위해 도입되었다.^[11] 볼타의 텐서 코어는 1세대이며, 이후 앰페어 아키텍처에서는 3세대 텐서 코어가 탑재되었다.^[12]^[13]
PureVideo 기능 세트 I 하드웨어 비디오 디코딩 지원

=== 컴퓨트 기능 비교: GP100 vs GV100 vs GA100 ===^[14]

GPU 기능	엔비디아 테슬라 P100	엔비디아 테슬라 V100	엔비디아 A100
GPU 코드네임	GP100	GV100	GA100
GPU 아키텍처	엔비디아 파스칼	엔비디아 볼타	엔비디아 앰페어
컴퓨트 기능	6.0	7.0	8.0
스레드 / 워프	32	32	32
최대 워프 / SM	64	64	64
최대 스레드 / SM	2048	2048	2048
최대 스레드 블록 / SM	32	32	32
최대 32비트 레지스터 / SM	65536	65536	65536
최대 레지스터 / 블록	65536	65536	65536
최대 레지스터 / 스레드	255	255	255
최대 스레드 블록 크기	1024	1024	1024
FP32 코어 / SM	64	64	64
SM 레지스터 대 FP32 코어의 비율	1024	1024	1024
공유 메모리 크기 / SM	64KB	최대 96KB 구성 가능	최대 164KB 구성 가능

=== 정밀도 지원 매트릭스 비교 ===^[15]^[16]

GPU 모델	지원되는 CUDA 코어 정밀도								지원되는 텐서 코어 정밀도
GPU 모델	FP16	FP32	FP64	INT1	INT4	INT8	TF32	BF16	FP16	FP32	FP64	INT1	INT4	INT8	TF32	BF16
엔비디아 테슬라 P4	X	O	O	X	X	O	X	X	X	X	X	X	X	X	X	X
엔비디아 테슬라 P100	O	O	O	X	X	X	X	X	X	X	X	X	X	X	X	X
엔비디아 테슬라 V100 (볼타)	O	O	O	X	X	O	X	X	O	X	X	X	X	X	X	X
엔비디아 튜링	O	O	O	X	X	X	X	X	O	X	X	O	O	O	X	X
엔비디아 A100	O	O	O	X	X	O	X	O	O	X	O	O	O	O	O	O

범례:

FPnn: nn 비트 부동소수점
INTn: n 비트 정수
INT1: 바이너리 (1비트 정수)
TF32: TensorFloat32
BF16: bfloat16

=== 디코딩 성능 비교 ===

GPU 모델	동시 스트림 수	H.264 디코딩 (1080p30)	H.265(HEVC) 디코딩 (1080p30)	VP9 디코딩 (1080p30)
엔비디아 테슬라 V100	16	22	22
엔비디아 A100	75	157	108

2. 2. 컴퓨트 기능 비교

볼타 아키텍처는 CUDA 컴퓨트 기능 7.0을 지원하며, 정수 및 부동 소수점 연산의 동시 실행이 가능하다.

'''컴퓨트 기능 비교: GP100 vs GV100 vs GA100'''^[14]

GPU 기능	엔비디아 테슬라 P100	엔비디아 테슬라 V100	엔비디아 A100
GPU 코드네임	GP100	GV100	GA100
GPU 아키텍처	엔비디아 파스칼	엔비디아 볼타	엔비디아 암페어
컴퓨트 기능	6.0	7.0	8.0
스레드 / 워프	32	32	32
최대 워프 / SM	64	64	64
최대 스레드 / SM	2048	2048	2048
최대 스레드 블록 / SM	32	32	32
최대 32비트 레지스터 / SM	65536	65536	65536
최대 레지스터 / 블록	65536	65536	65536
최대 레지스터 / 스레드	255	255	255
최대 스레드 블록 크기	1024	1024	1024
FP32 코어 / SM	64	64	64
SM 레지스터 대 FP32 코어의 비율	1024	1024	1024
공유 메모리 크기 / SM	64KB	최대 96KB 구성 가능	최대 164KB 구성 가능

'''정밀도 지원 매트릭스 비교'''^[15]^[16]

GPU 모델	지원되는 CUDA 코어 정밀도								지원되는 텐서 코어 정밀도
GPU 모델	FP16	FP32	FP64	INT1	INT4	INT8	TF32	BF16	FP16	FP32	FP64	INT1	INT4	INT8	TF32	BF16
엔비디아 테슬라 P4	아니요	예	예	아니요	아니요	예	아니요	아니요	아니요	아니요	아니요	아니요	아니요	아니요	아니요	아니요
엔비디아 P100	예	예	예	아니요	아니요	아니요	아니요	아니요	아니요	아니요	아니요	아니요	아니요	아니요	아니요	아니요
엔비디아 볼타 (GV100)	예	예	예	아니요	아니요	예	아니요	아니요	예	아니요	아니요	아니요	아니요	아니요	아니요	아니요
엔비디아 튜링	예	예	예	아니요	아니요	아니요	아니요	아니요	예	아니요	아니요	예	예	예	아니요	아니요
엔비디아 A100	예	예	예	아니요	아니요	예	아니요	예	예	아니요	예	예	예	예	예	예

'''범례:'''

FPnn: nn 비트 부동소수점
INTn: n 비트 정수
INT1: 바이너리
TF32: TensorFloat32
BF16: bfloat16

'''디코딩 성능 비교'''

GPU 모델	동시 스트림	H.264 디코딩(1080p30)	H.265(HEVC) 디코딩(1080p30)	VP9 디코딩(1080p30)
V100	16	22	22
A100	75	157	108

2. 3. 정밀도 지원

볼타 아키텍처는 다양한 연산 정밀도를 지원하여 특정 작업 부하에 대한 성능과 효율성을 최적화한다. 특히 딥러닝 추론 및 훈련과 같은 작업에서 중요한 낮은 정밀도 연산에 대한 지원이 강화되었다.^[11]

볼타에 도입된 주요 특징 중 하나는 텐서 코어이다. 이 코어는 두 개의 4×4 FP16 행렬을 곱한 다음, 융합 곱셈-덧셈 연산을 사용하여 세 번째 FP16 또는 FP32 행렬을 결과에 더하는 방식으로 작동한다. 최종 결과는 FP32 정밀도를 가지며, 필요에 따라 FP16으로 변환될 수 있다.^[11] 텐서 코어는 주로 신경망 훈련 속도를 가속화하는 데 사용된다.^[11] 볼타의 텐서 코어는 1세대에 해당하며, 후속 아키텍처인 암페어에서는 3세대 텐서 코어로 발전했다.^[12]^[13]

다음 표는 볼타 아키텍처(예: 엔비디아 테슬라 V100)와 다른 엔비디아 GPU 아키텍처 간의 정밀도 지원을 비교한 것이다.^[15]^[16]

GPU 모델	지원되는 CUDA 코어 정밀도								지원되는 텐서 코어 정밀도
GPU 모델	FP16	FP32	FP64	INT1	INT4	INT8	TF32	BF16	FP16	FP32	FP64	INT1	INT4	INT8	TF32	BF16
엔비디아 테슬라 P4	미지원	지원	지원	미지원	미지원	지원	미지원	미지원	미지원	미지원	미지원	미지원	미지원	미지원	미지원	미지원
엔비디아 P100	지원	지원	지원	미지원	미지원	미지원	미지원	미지원	미지원	미지원	미지원	미지원	미지원	미지원	미지원	미지원
엔비디아 볼타	지원	지원	지원	미지원	미지원	지원	미지원	미지원	지원	미지원	미지원	미지원	미지원	미지원	미지원	미지원
엔비디아 튜링	지원	지원	지원	미지원	미지원	미지원	미지원	미지원	지원	미지원	미지원	지원	지원	지원	미지원	미지원
엔비디아 A100	지원	지원	지원	미지원	미지원	지원	미지원	지원	지원	미지원	지원	지원	지원	지원	지원	지원

범례:

'''FPnn''': nn 비트 부동소수점
'''INTn''': n 비트 정수
'''INT1''': 바이너리(1비트 정수)
'''TF32''': TensorFloat-32
'''BF16''': bfloat16

표에서 볼 수 있듯이, 볼타 아키텍처는 CUDA 코어에서 FP16, FP32, FP64, INT8 정밀도를 지원하며, 텐서 코어에서는 FP16 정밀도 연산을 가속한다. 이는 이전 세대인 파스칼(P100)에 비해 INT8 지원이 추가되고, 텐서 코어를 통한 FP16 연산 가속 기능이 도입된 점이 특징이다. 후속 아키텍처인 튜링과 암페어에서는 지원되는 정밀도 종류와 텐서 코어 기능이 더욱 확장되었다.

2. 4. 디코딩 성능 비교

동시 스트림	H.264 디코딩(1080p30)	H.265(HEVC) 디코딩(1080p30)	VP9 디코딩(1080p30)
V100	16	22	22
A100	75	157	108

3. 제품

볼타는 자율주행차에 주력하는 Tegra SoC의 Xavier 세대 내 GPU 마이크로아키텍처로 발표되었다.^[17]^[18]

2017년 5월 10일 엔비디아 연례 GPU 기술 컨퍼런스 기조 연설에서 엔비디아는 볼타 마이크로아키텍처와 Tesla V100을 공식 발표했다.^[3] 볼타 GV100 GPU는 HBM2 메모리를 사용하여 TSMC 12 nm 공정으로 제작되었으며, 900GB/s의 대역폭을 갖는다.^[19]

엔비디아는 2017년 12월 7일 Nvidia Titan V를 공식 발표했다.^[20]^[21]

엔비디아는 2018년 3월 27일 Quadro GV100을 공식 발표했다.^[22]

모델	출시	코드명 (들)	공정 (nm)	트랜지스터 (십억 개)	다이 크기 (mm²)	버스 인터페이스	코어 구성		SM 개수	그래픽 처리 클러스터	L2 캐시 크기 (MiB)	클럭 속도			필레이트		메모리				처리 성능 (GFLOPS)			TDP (W)	NVLink 지원	출시 가격 (USD)
							CUDA 코어	텐서 코어				기본 코어 클럭 (MHz)	부스트 클럭 (MHz)	메모리 (MT/s)	픽셀 (GP/s)	텍스처 (GT/s)	크기 (GiB)	대역폭 (GB/s)	버스 유형	버스 폭 (bit)	단정밀도 (부스트)	배정밀도 (부스트)	반정밀도 (부스트)			출시 가격 (USD)
							CUDA 코어	텐서 코어				기본 코어 클럭 (MHz)	부스트 클럭 (MHz)	메모리 (MT/s)	픽셀 (GP/s)	텍스처 (GT/s)	크기 (GiB)	대역폭 (GB/s)	버스 유형	버스 폭 (bit)	단정밀도 (부스트)	배정밀도 (부스트)	반정밀도 (부스트)			MSRP
Nvidia Titan V^[23]	2017년 12월 7일	GV100-400-A1	TSMC 12 nm	21.1	815mm²	PCIe 3.0 ×16	5120:320:96	640	80	6	4.5	1200	1455	1700	139.7	465.6	12	652.8GB/s	HBM2	3072	12288 (14899)	6144 (7450)	24576 (29798)	250	아니요	2999USD
Quadro GV100^[24]	2018년 3월 27일	GV100					5120:320:128				6	1132	1628	1696	208.4	521	32	868.4GB/s		4096	11592 (16671)	5796 (8335)	23183 (33341)		예	8999USD
Nvidia Titan V CEO 에디션^[25]^[26]	2018년 6월 21일	GV100					5120:320:128				6	1200	1455	1700	186.2	465.6	32	870.4GB/s		4096	12288 (14899)	6144 (7450)	24576 (29798)		예	N/A

4. 응용

볼타는 GPGPU 연산에 사용되며, 서밋 및 시에라 슈퍼컴퓨터에도 포함될 것으로 알려졌다.^[27]^[28] 볼타 GPU는 NVLink 2.0을 통해 POWER9 CPU에 연결되며, 이는 캐시 일관성을 지원하여 GPGPU 성능을 향상시킬 것으로 예상된다.^[29]^[30]^[31]

5. V100 가속기 및 DGX V100

DGX 시스템에서 사용되는 주요 엔비디아 가속기 사양 비교는 아래 표와 같다.^[32]^[33]^[34] 이 중 V100 가속기는 2017년 3분기에 출시되었으며, 16GB HBM2 모델과 32GB HBM2 모델 두 가지로 제공되었다. 두 모델은 주로 VRAM 용량과 TDP(열 설계 전력)에서 차이를 보인다.

모델	아키텍처	소켓	FP32 CUDA 코어	FP64 코어 (텐서 제외)	혼합 INT32/FP32 코어	INT32 코어	부스트 클럭	메모리 클럭	메모리 버스 폭	메모리 대역폭	VRAM	단정밀도 (FP32)	배정밀도 (FP64)	INT8 (비텐서)	INT8 밀집 텐서	INT32	FP4 밀집 텐서	FP16	FP16 밀집 텐서	bfloat16 밀집 텐서	텐서플로트-32 (TF32) 밀집 텐서	FP64 밀집 텐서	상호 연결 (NVLink)	GPU	L1 캐시	L2 캐시	TDP	다이 크기	트랜지스터 수	공정	출시
B200	블랙웰	SXM6	N/A	N/A	N/A	N/A	N/A	8 Gbit/s HBM3e	8192-비트	8 TB/초	192 GB HBM3e	N/A	N/A	N/A	4.5 POPS	N/A	9 PFLOPS	N/A	2.25 PFLOPS	2.25 PFLOPS	1.2 PFLOPS	40 TFLOPS	1.8 TB/초	GB100	N/A	N/A	1000 W	N/A	208 B	TSMC 4NP	2024년 4분기 (예상)
B100	블랙웰	SXM6	N/A	N/A	N/A	N/A	N/A	8 Gbit/s HBM3e	8192-비트	8 TB/초	192 GB HBM3e	N/A	N/A	N/A	3.5 POPS	N/A	7 PFLOPS	N/A	1.98 PFLOPS	1.98 PFLOPS	989 TFLOPS	30 TFLOPS	1.8 TB/초	GB100	N/A	N/A	700 W	N/A	208 B	TSMC 4NP	2024년 4분기 (예상)
H200	호퍼	SXM5	16896	4608	16896	N/A	1980 MHz	6.3 Gbit/s HBM3e	6144-비트	4.8 TB/초	141 GB HBM3e	67 TFLOPS	34 TFLOPS	N/A	1.98 POPS	N/A	N/A	N/A	990 TFLOPS	990 TFLOPS	495 TFLOPS	67 TFLOPS	900 GB/초	GH100	25344 KB (192 KB × 132)	51200 KB	1000 W	814mm²	80 B	TSMC 4N	2023년 3분기
H100	호퍼	SXM5	16896	4608	16896	N/A	1980 MHz	5.2 Gbit/s HBM3	5120-비트	3.35 TB/초	80 GB HBM3	67 TFLOPS	34 TFLOPS	N/A	1.98 POPS	N/A	N/A	N/A	990 TFLOPS	990 TFLOPS	495 TFLOPS	67 TFLOPS	900 GB/초	GH100	25344 KB (192 KB × 132)	51200 KB	700 W	814mm²	80 B	TSMC 4N	2022년 3분기
A100 80GB	암페어	SXM4	6912	3456	6912	N/A	1410 MHz	3.2 Gbit/s HBM2e	5120-비트	1.52 TB/초	80 GB HBM2e	19.5 TFLOPS	9.7 TFLOPS	N/A	624 TOPS	19.5 TOPS	N/A	78 TFLOPS	312 TFLOPS	312 TFLOPS	156 TFLOPS	19.5 TFLOPS	600 GB/초	GA100	20736 KB (192 KB × 108)	40960 KB	400 W	826mm²	54.2 B	TSMC N7	2020년 1분기
A100 40GB	암페어	SXM4	6912	3456	6912	N/A	1410 MHz	2.4 Gbit/s HBM2	5120-비트	1.52 TB/초	40 GB HBM2	19.5 TFLOPS	9.7 TFLOPS	N/A	624 TOPS	19.5 TOPS	N/A	78 TFLOPS	312 TFLOPS	312 TFLOPS	156 TFLOPS	19.5 TFLOPS	600 GB/초	GA100	20736 KB (192 KB × 108)	40960 KB	400 W	826mm²	54.2 B	TSMC N7	2020년 1분기
V100 32GB	볼타	SXM3	5120	2560	N/A	5120	1530 MHz	1.75 Gbit/s HBM2	4096-비트	900 GB/초	32 GB HBM2	15.7 TFLOPS	7.8 TFLOPS	62 TOPS	N/A	15.7 TOPS	N/A	31.4 TFLOPS	125 TFLOPS	N/A	N/A	N/A	300 GB/초	GV100	10240 KB (128 KB × 80)	6144 KB	350 W	815mm²	21.1 B	TSMC 12FFN	2017년 3분기
V100 16GB	볼타	SXM2	5120	2560	N/A	5120	1530 MHz	1.75 Gbit/s HBM2	4096-비트	900 GB/초	16 GB HBM2	15.7 TFLOPS	7.8 TFLOPS	62 TOPS	N/A	15.7 TOPS	N/A	31.4 TFLOPS	125 TFLOPS	N/A	N/A	N/A	300 GB/초	GV100	10240 KB (128 KB × 80)	6144 KB	300 W	815mm²	21.1 B	TSMC 12FFN	2017년 3분기
P100	파스칼	SXM/SXM2	N/A	1792	3584	N/A	1480 MHz	1.4 Gbit/s HBM2	4096-비트	720 GB/초	16 GB HBM2	10.6 TFLOPS	5.3 TFLOPS	N/A	N/A	N/A	N/A	21.2 TFLOPS	N/A	N/A	N/A	N/A	160 GB/초	GP100	1344 KB (24 KB × 56)	4096 KB	300 W	610mm²	15.3 B	TSMC 16FF+	2016년 2분기

참조

_[1] 뉴스 Nvidia Volta Trademark Status https://tsdr.uspto.g[...] United_States_Patent_and_Trademark_Office 2023-08-14
_[2] 뉴스 Nvidia's Volta GPU to feature on-chip DRAM https://techreport.c[...] The Tech Report 2017-03-14
_[3] 뉴스 The NVIDIA GPU Tech Conference 2017 Keynote Live Blog https://www.anandtec[...] 2018-11-03
_[4] 웹사이트 NVIDIA Volta AI Architecture {{!}} NVIDIA https://www.nvidia.c[...] 2018-04-11
_[5] 뉴스 Volta trademark Cancellation Proceeding https://ttabvue.uspt[...] United_States_Patent_and_Trademark_Office
_[6] 뉴스 Volta trademark Exparte Appeal Proceeding https://ttabvue.uspt[...] United_States_Patent_and_Trademark_Office
_[7] 뉴스 Volta Trademark status https://tsdr.uspto.g[...] United_States_Patent_and_Trademark_Office
_[8] 웹사이트 Inside Volta: The World's Most Advanced Data Center GPU https://devblogs.nvi[...] 2017-05-10
_[9] 뉴스 Report: TSMC set to fabricate Volta and Centriq on 12-nm process https://techreport.c[...] The Tech Report 2017-03-14
_[10] 웹사이트 Nvidia's Volta GPU to feature on-chip DRAM https://techreport.c[...] The Tech Report 2013-03-19
_[11] 웹사이트 CUDA 9 Features Revealed: Volta, Cooperative Groups and More https://devblogs.nvi[...] 2017-08-12
_[12] 웹사이트 NVIDIA Ampere Architecture In-Depth https://devblogs.nvi[...] 2020-05-14
_[13] 웹사이트 NVIDIA A100 Tensor Core GPU Architecture https://www.nvidia.c[...] 2023-12-15
_[14] 웹사이트 NVIDIA A100 Tensor Core GPU Architecture: Unprecedented Acceleration at Every Scale https://www.nvidia.c[...] 2020-09-18
_[15] 웹사이트 NVIDIA Tensor Cores: Versatility for HPC & AI https://www.nvidia.c[...]
_[16] 웹사이트 Abstract https://docs.nvidia.[...]
_[17] 뉴스 CES 2017: Nvidia Keynote Liveblog http://www.anandtech[...] AnandTech 2017-01-09
_[18] 뉴스 NVIDIA DRIVE Xavier, World's Most Powerful SoC, Brings Dramatic New AI Capabilities {{!}} NVIDIA Blog https://blogs.nvidia[...] 2018-11-03
_[19] 뉴스 Nvidia Volta Unveiled http://www.anandtech[...] AnandTech 2017-06-02
_[20] 웹사이트 NVIDIA TITAN V Transforms the PC into AI Supercomputer https://nvidianews.n[...]
_[21] 웹사이트 Introducing NVIDIA TITAN V: The World's Most Powerful PC Graphics Card https://www.nvidia.c[...]
_[22] 웹사이트 NVIDIA Reinvents the Workstation with Real-Time Ray Tracing https://nvidianews.n[...]
_[23] 웹사이트 Introducing NVIDIA TITAN V: The World's Most Powerful PC Graphics Card https://www.nvidia.c[...] 2017-12-08
_[24] 웹사이트 NVIDIA Quadro GV100 https://www.nvidia.c[...] 2018-03-27
_[25] 뉴스 NVIDIA Unveils & Gives Away New Limited Edition 32GB Titan V "CEO Edition" https://www.anandtec[...] 2018-07-06
_[26] 뉴스 NVIDIA TITAN V CEO Edition https://www.techpowe[...] 2018-07-07
_[27] 웹사이트 IBM, Nvidia land $325M supercomputer deal http://www.cnet.com/[...] CNET 2015-12-29
_[28] 웹사이트 IBM, Nvidia rev HPC engines in next-gen supercomputer push http://www.pcworld.c[...] PC World 2015-12-29
_[29] 뉴스 Nvidia Volta, IBM Power9 Land Contracts for New US Government Supercomputers http://www.anandtech[...] Anandtech 2017-03-14
_[30] 뉴스 Nvidia's NVLink 2.0 will first appear in Power9 servers next year http://www.pcworld.c[...] PC World 2017-03-14
_[31] 웹사이트 NVIDIA 12nm FinFET Volta GPU Architecture Reportedly Replacing Pascal In 2017 http://hothardware.c[...] HotHardware 2017-01-25
_[32] 뉴스 NVIDIA Hopper GPU Architecture and H100 Accelerator Announced: Working Smarter and Harder https://www.anandtec[...] AnandTech 2022-03-22
_[33] 뉴스 NVIDIA Ampere Unleashed: NVIDIA Announces New GPU Architecture, A100 GPU, and Accelerator https://www.anandtec[...] AnandTech 2020-05-14
_[34] 웹사이트 NVIDIA Tesla V100 tested: near unbelievable GPU power https://www.tweaktow[...] 2017-09-17
_[35] 뉴스 Nvidia's Volta GPU to feature on-chip DRAM https://techreport.c[...] The Tech Report 2017-03-14
_[36] 뉴스 The NVIDIA GPU Tech Conference 2017 Keynote Live Blog https://www.anandtec[...] 2018-11-03
_[37] 웹인용 NVIDIA Volta AI Architecture {{!}} NVIDIA https://www.nvidia.c[...] 2018-04-11
_[38] 웹인용 Introducing NVIDIA TITAN V: The World’s Most Powerful PC Graphics Card https://www.nvidia.c[...] 2017-12-08
_[39] 웹인용 NVIDIA Quadro GV100 https://www.nvidia.c[...] 2018-03-27
_[40] 뉴스 NVIDIA Unveils & Gives Away New Limited Edition 32GB Titan V "CEO Edition" https://www.anandtec[...] 2018-07-06
_[41] 뉴스 NVIDIA TITAN V CEO Edition https://www.techpowe[...] TechPowerUp 2018-07-07

본 사이트는 AI가 위키백과와 뉴스 기사,정부 간행물,학술 논문등을 바탕으로 정보를 가공하여 제공하는 백과사전형 서비스입니다.
모든 문서는 AI에 의해 자동 생성되며, CC BY-SA 4.0 라이선스에 따라 이용할 수 있습니다.
하지만, 위키백과나 뉴스 기사 자체에 오류, 부정확한 정보, 또는 가짜 뉴스가 포함될 수 있으며, AI는 이러한 내용을 완벽하게 걸러내지 못할 수 있습니다.
따라서 제공되는 정보에 일부 오류나 편향이 있을 수 있으므로, 중요한 정보는 반드시 다른 출처를 통해 교차 검증하시기 바랍니다.

문의하기 : help@durumis.com