맨위로가기

암페어 (마이크로아키텍처)

"오늘의AI위키"는 AI 기술로 일관성 있고 체계적인 최신 지식을 제공하는 혁신 플랫폼입니다.
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.

1. 개요

암페어는 엔비디아의 마이크로아키텍처로, CUDA 연산 능력 8.0 및 3세대 텐서 코어를 지원하며, TSMC 7nm FinFET 공정 또는 삼성 8nm 공정을 사용한다. GA100, GA102, GA103, GA104, GA106, GA107, GA10B, GA10F 등 다양한 칩 종류가 있으며, 지포스 30 시리즈, 쿼드로, 테슬라, 테그라 SoC 제품군에 사용된다. A100 가속기는 2020년에 출시되었으며, 이전 세대 GPU보다 향상된 연산 능력과 디코딩 성능을 제공한다.

더 읽어볼만한 페이지

  • 엔비디아 마이크로아키텍처 - 볼타 (마이크로아키텍처)
    엔비디아의 볼타 마이크로아키텍처는 CUDA 컴퓨트 기능 7.0 지원, 정수 및 부동 소수점 연산 동시 실행, 12nm FinFET 공정, HBM2 및 NVLink 2.0을 통한 성능 향상, 딥 러닝을 위한 텐서 코어 도입을 특징으로 하며 Tegra Xavier SoC, Tesla V100 등에 적용되어 GPGPU 연산 성능을 향상시키고 딥 러닝 연구 개발에 기여했다.
  • 엔비디아 마이크로아키텍처 - 튜링 (마이크로아키텍처)
    튜링은 엔비디아가 개발한 마이크로아키텍처로, 실시간 광선 추적을 위해 쿠다 코어, 레이 트레이싱 코어, 텐서 코어 등을 결합하여 그래픽 성능을 향상시킨다.
  • 그래픽스 마이크로아키텍처 - 인텔 Xe
    인텔 Xe는 저전력부터 고성능 컴퓨팅까지 다양한 시장을 목표로 하는 인텔의 GPU 아키텍처 제품군으로, Xe-LP, Xe-HPG, Xe-HP, Xe-HPC 등의 하위 아키텍처를 가지며 외장 그래픽 카드인 인텔 아크 시리즈와 내장 그래픽, 데이터 센터용 GPU 등에 활용된다.
  • 그래픽스 마이크로아키텍처 - 테라스케일 (마이크로아키텍처)
    테라스케일은 AMD가 개발한 GPU 마이크로아키텍처로, 셰이더 처리량 증가를 위해 통합 셰이더 모델을 사용하며, VLIW 아키텍처를 기반으로 라데온 HD 2000, 3000, 4000, 5000, 6900 시리즈에 적용되었다가 그래픽스 코어 넥스트 아키텍처로 대체되었다.
암페어 (마이크로아키텍처)
일반 정보
엔비디아 암페어 아키텍처 블록 다이어그램
엔비디아 암페어 아키텍처 블록 다이어그램
출시일2020년 5월 14일
단종일알 수 없음
판매자엔비디아
설계 회사엔비디아
제조사TSMC, 삼성전자
공정TSMC N7 (전문가용), 삼성 8N (소비자용)
코드명GA10x
제품
데스크톱GeForce RTX 30 시리즈
고성능 데스크톱RTX A 시리즈
서버A100
API 지원
DirectX 버전DirectX 12 Ultimate (Feature Level 12_2)
Direct3D 버전Direct3D 12.0
Shader Model 버전Shader Model 6.8
OpenCL 버전OpenCL 3.0
OpenGL 버전OpenGL 4.6
CUDA 버전Compute Capability 8.6
Vulkan 버전Vulkan 1.3
메모리
메모리 지원GDDR6
GDDR6X
HBM2
L1 캐시192KB/SM (전문가용), 128KB/SM (소비자용)
L2 캐시2MB ~ 6MB
PCIe 지원PCIe 4.0
인코딩/디코딩
인코딩 코덱H.264
H.265
디코딩 코덱H.264
H.265
AV1
색상 심도8비트
10비트
인코더NVENC
디스플레이 출력
디스플레이 출력DisplayPort 1.4a
HDMI 2.1
기타
이전 세대Turing (소비자용), Volta (전문가용)
다음 세대Ada Lovelace (소비자용), Hopper (데이터센터)
지원 상태지원됨

2. 자세히

암페어 아키텍처는 이전 세대 대비 다음과 같은 구조적 개선이 이루어졌다.[36][37][40]


  • CUDA 연산 능력 8.0 (A100) 및 8.6 (지포스 30 시리즈)
  • A100의 TSMC7 nm FinFET 공정
  • 지포스 30 시리즈의 삼성전자의 8 nm 공정 (8N) 커스텀 버전
  • FP16, bfloat16, TensorFloat-32(TF32) 및 FP64 지원과 희소성 가속을 갖춘 3세대 텐서 코어. 개별 텐서 코어는 이전 텐서 코어 세대에 비해 초당 256 FP16 FMA 연산 4배(GA100만 해당, GA10x에 2배)를 가지고 있다. 텐서 코어 카운트는 SM 당 1회로 감소한다.
  • 지포스 30 시리즈의 2세대 광선 추적 코어, 동시 광선 추적, 음영 처리 및 컴퓨팅
  • A100 40GB 및 A100 80GB의 HBM2
  • 지포스 RTX 3090, RTX 3080 Ti, RTX 3080, RTX 3070 Ti의 GDDR6X 메모리
  • GA10x GPU에서 SM당 FP32 코어 2개
  • 쌍당 50Gbit/s 처리량을 지원하는 NVLink 3.0
  • SR-IOV를 지원하는 PCI 익스프레스 4.0 (SR-IOV는 A100에만 예약됨)
  • 최대 7개의 인스턴스를 지원하는 A100의 다중 인스턴스 GPU 가상화 및 GPU 파티셔닝 기능
  • AV1 하드웨어 디코딩이 포함된 지포스 30 시리즈의 퓨어비디오 하드웨어 비디오 디코딩 기능 세트 K 및 A100의 기능 세트 J
  • A100용 5 NVDEC
  • YUV420, YUV422, YUV444, YUV400, RGBA와 함께 새로운 하드웨어 기반 5코어 JPEG 디코딩 ('''NVJPG''')을 추가. 엔비디아 '''NVJPEG'''(JPEG 인코딩/디코딩을 위한 GPU 가속 라이브러리)가 아님


암페어 기반 A100 가속기는 2020년 5월 14일에 발표 및 출시되었다.[22] A100은 19.5 테라플롭스(FP32) 성능, 6912 FP32/INT32 CUDA 코어, 3456 FP64 CUDA 코어, 40GB의 그래픽 메모리, 1.6TB/s의 그래픽 메모리 대역폭을 특징으로 한다.[21] A100 가속기는 처음에는 8개의 A100을 포함하는 3세대 DGX 서버에서만 사용할 수 있었다.[22] DGX A100에는 15TB의 PCIe 4세대 NVMe 스토리지,[21] 2개의 64코어 AMD Rome 7742 CPU, 1TB의 RAM, Mellanox 기반 HDR InfiniBand 상호 연결도 포함되어 있다. DGX A100의 초기 가격은 199000USD였다.[22]

DGX에 사용된 가속기를 비교하면 다음과 같다.[23][24][25]

모델아키텍처소켓FP32
CUDA
코어
FP64 코어
(텐서 제외)
혼합
INT32/FP32
코어
INT32
코어
부스트
클럭
메모리
클럭
메모리
버스 폭
메모리
대역폭
VRAM단정밀도
(FP32)
배정밀도
(FP64)
INT8
(비텐서)
INT8
밀집 텐서
INT32FP4
밀집 텐서
FP16FP16
밀집 텐서
bfloat16
밀집 텐서
텐서플로트-32
(TF32)
밀집 텐서
FP64
밀집 텐서
상호 연결
(NVLink)
GPUL1 캐시L2 캐시TDP다이 크기트랜지스터
공정출시
A100 80GB암페어SXM4691234566912N/A1410 MHz3.2 Gbit/s HBM2e5120-bit1.52 TB/sec80 GB HBM2e19.5 TFLOPS9.7 TFLOPSN/A624 TOPS19.5 TOPSN/A78 TFLOPS312 TFLOPS312 TFLOPS156 TFLOPS19.5 TFLOPS600 GB/secGA10020736 KB (192 KB × 108)40960 KB400 W826mm254.2 BTSMC N72020년 1분기
A100 40GB암페어SXM4691234566912N/A1410 MHz2.4 Gbit/s HBM25120-bit1.52 TB/sec40 GB HBM219.5 TFLOPS9.7 TFLOPSN/A624 TOPS19.5 TOPSN/A78 TFLOPS312 TFLOPS312 TFLOPS156 TFLOPS19.5 TFLOPS600 GB/secGA10020736 KB (192 KB × 108)40960 KB400 W826mm254.2 BTSMC N7


2. 1. 핵심 기술


  • CUDA 연산 능력 8.0 (A100) 및 8.6 (지포스 30 시리즈)[36]
  • A100의 TSMC7 nm FinFET 공정
  • 지포스 30 시리즈의 삼성전자의 8 nm 공정 (8N) 커스텀 버전[37]
  • FP16, bfloat16, TensorFloat-32(TF32) 및 FP64가 지원되는 3세대 텐서 코어 및 희소성 가속 지원.[40] 개별 텐서 코어는 이전 텐서 코어 세대에 비해 초당 256 FP16 FMA 연산 4배(GA100만 해당, GA10x에 2배)를 가지고 있다. 텐서 코어 카운트는 SM 당 1회로 감소한다.
  • 지포스 30 시리즈의 2세대 광선 추적 코어, 동시 광선 추적, 음영 처리 및 컴퓨팅
  • A100 40GB 및 A100 80GB의 HBM2
  • 지포스 RTX 3090, RTX 3080 Ti, RTX 3080, RTX 3070 Ti의 GDDR6X 메모리
  • GA10x GPU에서 SM당 FP32 코어 2개
  • 쌍당 50Gbit/s 처리량을 지원하는 NVLink 3.0
  • SR-IOV를 지원하는 PCI 익스프레스 4.0 (SR-IOV는 A100에만 예약됨)
  • 최대 7개의 인스턴스를 지원하는 A100의 다중 인스턴스 GPU 가상화 및 GPU 파티셔닝 기능
  • AV1 하드웨어 디코딩이 포함된 지포스 30 시리즈의 퓨어비디오 하드웨어 비디오 디코딩 기능 세트 K 및 A100의 기능 세트 J
  • A100용 5 NVDEC
  • YUV420, YUV422, YUV444, YUV400, RGBA와 함께 새로운 하드웨어 기반 5코어 JPEG 디코딩 ('''NVJPG''')을 추가. 엔비디아 '''NVJPEG'''(JPEG 인코딩/디코딩을 위한 GPU 가속 라이브러리)가 아님

2. 2. 칩 종류

암페어 마이크로아키텍처 기반 칩의 종류는 다음과 같다.[14][15][16][17][18][19][20]

다이GA100GA102GA103GA104GA106GA107GA10BGA10F
다이 크기826mm2628mm2496mm2392mm2276mm2200mm2448mm2?
트랜지스터542억 개283억 개220억 개174억 개120억 개87억 개210억 개?
트랜지스터 밀도65.6 MTr/mm245.1 MTr/mm244.4 MTr/mm244.4 MTr/mm243.5 MTr/mm243.5 MTr/mm246.9 MTr/mm2?
그래픽 처리 클러스터87663221
스트리밍 멀티프로세서12884604830201612
CUDA 코어1228810752768061443840256020481536
텍스처 매핑 유닛512336240192120806448
렌더 출력 유닛192112969648323216
텐서 코어512336240192120806448
RT 코어N/A8460483020812
L1 캐시24MB10.5MB7.5MB6MB3MB2.5MB3MB1.5MB
192KB per SM128KB per SM192KB per SM128KB per SM
L2 캐시40MB6MB4MB4MB3MB2MB4MB?


2. 3. 연산 능력 및 디코딩 성능 비교

암페어 아키텍처는 다음과 같은 연산 능력 및 디코딩 성능을 제공한다.[36]

연산 능력 비교: GP100 vs GV100 vs GA100[38]
GPU 기능NVIDIA Tesla P100NVIDIA Tesla V100NVIDIA A100
GPU 코드네임GP100GV100GA100
GPU 아키텍처NVIDIA 파스칼NVIDIA 볼타NVIDIA 암페어
CUDA 연산 능력6.07.08.0
스레드 / 워프323232
최대 워프 / SM646464
최대 스레드 / SM204820482048
최대 스레드 블록 / SM323232
최대 32비트 레지스터 / SM655366553665536
최대 레지스터 / block655366553665536
최대 레지스터 / 스레드255255255
최대 스레드 블록 크기102410241024
FP32 코어 / SM646464 (+64 혼합 INT/FP32 코어)
SM 레지스터 대 FP32 코어 비율102410241024
공유 메모리 크기 / SM64 KB최대 96 KB까지 설정 가능최대 164 KB까지 설정 가능



정밀도 지원 매트릭스 비교[12][13]
rowspan="2" |지원되는 CUDA 코어 정밀도지원되는 텐서 코어 정밀도
FP16FP32FP64INT1INT4INT8TF32BF16FP16FP32FP64INT1INT4INT8TF32BF16
Nvidia Tesla P4
Nvidia P100
Nvidia Volta
Nvidia Turing
NVIDIA A100



범례:


  • FPnn: nn 비트 부동 소수점
  • INTn: n 비트 정수
  • INT1: 바이너리
  • TF32: 텐서플로트32
  • BF16: bfloat16


디코딩 성능 비교
동시 스트림H.264 디코딩 (1080p30)H.265 (HEVC) 디코딩 (1080p30)VP9 디코딩 (1080p30)
V100162222
NVIDIA A10075157108


3. A100 가속기와 DGX A100

암페어 기반 A100 가속기는 2020년 5월 14일에 발표 및 출시되었다.[40] A100은 19.5 테라플롭스의 FP32 성능, 6912개의 CUDA 코어, 40GB의 그래픽 메모리, 1.6TB/s의 그래픽 메모리 대역폭을 가지고 있다.[39] A100 가속기는 처음에 8대의 A100을 포함한 3세대 DGX 서버에서만 사용할 수 있었다.[40]

DGX A100에는 15TB의 PCIe Gen 4 NVMe 스토리지,[39] 2개의 64코어 AMD Rome 7742 CPU, 1TB의 RAM 및 멜라녹스 기반 HDR InfiniBand 인터커넥트가 포함되어 있다. DGX A100의 최초 가격은 199000USD였다.[40]

DGX에 사용된 가속기 비교:[23][24][25]

모델아키텍처FP32
CUDA
코어
메모리
대역폭
VRAM단정밀도
(FP32)
출시
A100 80GB암페어69121.52TB/sec80 GB HBM2e19.5 TFLOPS2020년 1분기
A100 40GB암페어69121.52TB/sec40 GB HBM219.5 TFLOPS


4. 암페어 기반 제품

RTX A2000RTX A3000 (모바일)
RTX A4000 (모바일)
RTX A4000
RTX A5000 (모바일)RTX A5500 (모바일)RTX A4500
RTX A5000
RTX A5500
RTX A6000Nvidia 데이터 센터 GPUNvidia A2
Nvidia A16Nvidia A10
Nvidia A40Nvidia A30
Nvidia A100Tegra SoCAGX Orin
Orin NX
Orin Nano



각 제품군에 대한 자세한 내용은 하위 섹션을 참고할 수 있다.

4. 1. 지포스 시리즈

다음은 암페어 마이크로아키텍처의 지포스 시리즈이다.

4. 2. 쿼드로 시리즈

Nvidia 워크스테이션 GPU(구 Quadro)는 다음 칩들을 사용한다.

칩 종류제품
GA107RTX A1000 (모바일)
GA106RTX A2000 (모바일), RTX A2000
GA104RTX A3000 (모바일), RTX A4000 (모바일), RTX A4000, RTX A5000 (모바일)
GA103RTX A5500 (모바일)
GA102RTX A4500, RTX A5000, RTX A5500, RTX A6000

[41]

4. 3. 테슬라 시리즈

엔비디아 데이터센터 GPU (이전의 테슬라)는 암페어 마이크로아키텍처를 기반으로 하는 제품군이다. 해당 제품 목록은 다음과 같다.

칩 종류제품 목록
GA100Nvidia A30, Nvidia A100, Nvidia A100 80GB
GA102Nvidia A10, Nvidia A40
GA107Nvidia A2, Nvidia A16


4. 4. 테그라 시스템 온 칩 (SoC)

Tegra 시스템 온 칩(SoC)에는 AGX Orin, Orin NX, Orin Nano가 있으며, 이들은 모두 GA10B 칩을 사용한다.

참조

[1] 웹사이트 NVIDIA's New Ampere Data Center GPU in Full Production http://nvidianews.nv[...]
[2] 웹사이트 NVIDIA Ampere Architecture In-Depth https://developer.nv[...] 2020-05-14
[3] 웹사이트 NVIDIA Delivers Greatest-Ever Generational Leap with GeForce RTX 30 Series GPUs http://nvidianews.nv[...] 2023-04-09
[4] 웹사이트 NVIDIA GeForce Ultimate Countdown https://www.nvidia.c[...]
[5] 웹사이트 NVIDIA Doubles Down: Announces A100 80GB GPU, Supercharging World's Most Powerful GPU for AI Supercomputing https://nvidianews.n[...] 2023-04-09
[6] 웹사이트 NVIDIA GeForce Beyond at CES 2023 https://www.nvidia.c[...]
[7] 웹사이트 I.7. Compute Capability 8.x https://docs.nvidia.[...] 2020-09-23
[8] 웹사이트 Samsung's old 8nm tech at the heart of NVIDIA's monstrous Ampere cards https://www.sammobil[...] 2020-09-19
[9] 웹사이트 GeForce RTX 30 Series GPUs: Ushering In A New Era of Video Content With AV1 Decode https://www.nvidia.c[...] 2023-04-09
[10] 웹사이트 Diving Deep Into The Nvidia Ampere GPU Architecture https://www.nextplat[...] 2022-03-24
[11] 웹사이트 NVIDIA A100 Tensor Core GPU Architecture: Unprecedented Accerlation at Every Scale https://www.nvidia.c[...] 2020-09-18
[12] 웹사이트 NVIDIA Tensor Cores: Versatility for HPC & AI https://www.nvidia.c[...]
[13] 웹사이트 Abstract https://docs.nvidia.[...]
[14] 웹사이트 NVIDIA A100 Tensor Core GPU Architecture https://images.nvidi[...] 2024-04-29
[15] 웹사이트 NVIDIA GA102 GPU Specs https://www.techpowe[...] 2024-04-29
[16] 웹사이트 NVIDIA GA103 GPU Specs https://www.techpowe[...] 2024-04-29
[17] 웹사이트 NVIDIA GA104 GPU Specs https://www.techpowe[...] 2024-04-29
[18] 웹사이트 NVIDIA GA106 GPU Specs https://www.techpowe[...] 2024-04-29
[19] 웹사이트 NVIDIA GA107 GPU Specs https://www.techpowe[...] 2024-04-29
[20] 웹사이트 NVIDIA AGX Orin Series Technical Brief v1.2 https://www.nvidia.c[...] 2024-04-29
[21] 뉴스 Nvidia's first Ampere GPU is designed for data centers and AI, not your PC https://www.theverge[...] The Verge 2020-05-14
[22] 뉴스 NVIDIA Ampere Unleashed: NVIDIA Announces New GPU Architecture, A100 GPU, and Accelerator https://www.anandtec[...] AnandTech 2020-05-14
[23] 뉴스 NVIDIA Hopper GPU Architecture and H100 Accelerator Announced: Working Smarter and Harder https://www.anandtec[...] AnandTech 2022-03-22
[24] 뉴스 NVIDIA Ampere Unleashed: NVIDIA Announces New GPU Architecture, A100 GPU, and Accelerator https://www.anandtec[...] AnandTech 2020-05-14
[25] 웹사이트 NVIDIA Tesla V100 tested: near unbelievable GPU power https://www.tweaktow[...] 2017-09-17
[26] 웹사이트 The two faces of the GeForce RTX 3050 8GB https://www.igorslab[...] 2022-02-23
[27] 웹사이트 Gainward and Galax List GeForce RTX 3060 Cards With GA104 GPU https://www.tomshard[...] 2022-09-23
[28] 뉴스 Zotac Debuts First RTX 3060 Ti Desktop Cards With GA103 GPU https://www.tomshard[...] 2022-09-23
[29] 웹사이트 ZOTAC launches GeForce RTX 3070 Ti with GA102-150 GPU https://videocardz.c[...] 2023-05-21
[30] 웹인용 NVIDIA's New Ampere Data Center GPU in Full Production http://nvidianews.nv[...]
[31] 웹인용 NVIDIA Ampere Architecture In-Depth https://developer.nv[...] 2020-05-14
[32] 웹인용 NVIDIA Delivers Greatest-Ever Generational Leap with GeForce RTX 30 Series GPUs http://nvidianews.nv[...]
[33] 웹인용 NVIDIA GeForce Ultimate Countdown https://www.nvidia.c[...]
[34] 웹인용 NVIDIA Doubles Down: Announces A100 80GB GPU, Supercharging World's Most Powerful GPU for AI Supercomputing https://nvidianews.n[...]
[35] 웹인용 Join us for an NVIDIA GeForce RTX: Game on Special Broadcast Event https://www.nvidia.c[...]
[36] 웹인용 I.7. Compute Capability 8.x https://docs.nvidia.[...] 2020-09-23
[37] 웹인용 Samsung's old 8nm tech at the heart of NVIDIA's monstrous Ampere cards https://www.sammobil[...] 2020-09-19
[38] 웹인용 NVIDIA A100 Tensor Core GPU Architecture https://www.nvidia.c[...] 2020-09-18
[39] 뉴스 Nvidia's first Ampere GPU is designed for data centers and AI, not your PC https://www.theverge[...] The Verge 2020-05-14
[40] 뉴스 NVIDIA Ampere Unleashed: NVIDIA Announces New GPU Architecture, A100 GPU, and Accelerator https://www.anandtec[...] AnandTech 2020-05-14
[41] 웹인용 The two faces of the geforce RTX 3050 8GB https://www.igorslab[...] 2022-02-23



본 사이트는 AI가 위키백과와 뉴스 기사,정부 간행물,학술 논문등을 바탕으로 정보를 가공하여 제공하는 백과사전형 서비스입니다.
모든 문서는 AI에 의해 자동 생성되며, CC BY-SA 4.0 라이선스에 따라 이용할 수 있습니다.
하지만, 위키백과나 뉴스 기사 자체에 오류, 부정확한 정보, 또는 가짜 뉴스가 포함될 수 있으며, AI는 이러한 내용을 완벽하게 걸러내지 못할 수 있습니다.
따라서 제공되는 정보에 일부 오류나 편향이 있을 수 있으므로, 중요한 정보는 반드시 다른 출처를 통해 교차 검증하시기 바랍니다.

문의하기 : help@durumis.com