RDNA 2
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.
1. 개요
RDNA 2는 AMD가 2020년에 출시한 새로운 그래픽 아키텍처로, 이전 RDNA 아키텍처의 개선된 버전이다. TSMC의 7nm 공정을 기반으로 하며, 레이 트레이싱 기술 지원, 컴퓨트 유닛(CU) 수 증가, 인피니티 캐시를 통한 메모리 성능 향상, 전력 효율성 개선 등의 특징을 갖는다. RDNA 2는 데스크톱, 모바일, 워크스테이션, 통합 그래픽, 게임 콘솔 등 다양한 제품에 적용되었으며, RX 6000 시리즈 데스크톱 그래픽 카드, RX 6000M 시리즈 모바일 그래픽 카드, Radeon Pro W6000 시리즈 워크스테이션 그래픽 카드, Xbox Series X/S, PlayStation 5, 스팀 덱 등에서 활용되었다.
더 읽어볼만한 페이지
- 그래픽스 마이크로아키텍처 - 인텔 Xe
인텔 Xe는 저전력부터 고성능 컴퓨팅까지 다양한 시장을 목표로 하는 인텔의 GPU 아키텍처 제품군으로, Xe-LP, Xe-HPG, Xe-HP, Xe-HPC 등의 하위 아키텍처를 가지며 외장 그래픽 카드인 인텔 아크 시리즈와 내장 그래픽, 데이터 센터용 GPU 등에 활용된다. - 그래픽스 마이크로아키텍처 - 테라스케일 (마이크로아키텍처)
테라스케일은 AMD가 개발한 GPU 마이크로아키텍처로, 셰이더 처리량 증가를 위해 통합 셰이더 모델을 사용하며, VLIW 아키텍처를 기반으로 라데온 HD 2000, 3000, 4000, 5000, 6900 시리즈에 적용되었다가 그래픽스 코어 넥스트 아키텍처로 대체되었다. - AMD 마이크로아키텍처 - 젠 (마이크로아키텍처)
AMD에서 개발한 x86-64 기반 마이크로아키텍처인 젠은 불도저 아키텍처의 문제점을 개선하고 IPC를 향상시켜 라이젠 프로세서와 함께 출시되었으며, 여러 세대를 거치면서 다양한 제품군에 적용되었다. - AMD 마이크로아키텍처 - 불도저 (마이크로아키텍처)
불도저는 AMD가 2011년에 출시한 x86 마이크로아키텍처로, CMT 기술을 사용하여 모듈 구조를 특징으로 하며, FX 시리즈와 옵테론 시리즈로 출시되었고, 성능 논란과 소송에 휘말리기도 했다.
RDNA 2 | |
---|---|
RDNA 2 개요 | |
![]() | |
출시일 | 2020년 11월 18일 |
단종 | 알 수 없음 |
판매 회사 | AMD |
설계 회사 | AMD |
제조사 | TSMC |
제조 공정 | TSMC N6 TSMC N7 |
코드명 | Navi 2x Big Navi |
제품 | |
데스크톱 | Radeon RX 6000 시리즈 |
HEDT (고성능 데스크톱) | Radeon Pro W6000 시리즈 |
서버 | 알 수 없음 |
API 지원 | |
Direct3D 버전 | Direct3D 12.0 Ultimate (feature level 12_2) |
Shader Model 버전 | Shader Model 6.7 |
OpenCL 버전 | OpenCL 2.1 |
OpenGL 버전 | OpenGL 4.6 |
OpenGL ES 버전 | 알 수 없음 |
CUDA 버전 | 알 수 없음 |
OptiX 버전 | 알 수 없음 |
Mantle API | 알 수 없음 |
Vulkan API | Vulkan 1.3 |
OpenGL Compute 버전 | 알 수 없음 |
CUDA Compute 버전 | 알 수 없음 |
DirectCompute 버전 | 알 수 없음 |
컴퓨팅 성능 | |
연산 능력 | 알 수 없음 |
최저 클럭 | 알 수 없음 |
최저 클럭 단위 | 알 수 없음 |
최고 클럭 | 알 수 없음 |
최고 클럭 단위 | 알 수 없음 |
셰이더 클럭 | 알 수 없음 |
캐시 메모리 | |
L0 캐시 | 32 KB (각 당): 16 KB 벡터 데이터, 16 KB 스칼라 데이터 |
L1 캐시 | 128 KB (각 어레이당) |
L2 캐시 | 1 MB ~ 4 MB |
L3 캐시 | 16 MB ~ 128 MB |
메모리 | |
메모리 지원 | GDDR6 |
메모리 클럭 | 14–18 Gbps |
인터페이스 | |
PCI Express 지원 | PCIe 4.0 |
인코딩 및 디코딩 | |
인코딩 코덱 | H.264 H.265 |
디코딩 코덱 | H.264 H.265 AV1 |
색상 깊이 | 8비트 10비트 |
인코더 | AMF VCE |
디스플레이 출력 | |
디스플레이 출력 | DisplayPort 1.4a HDMI 2.1 USB-C |
제품 계보 | |
이전 제품 | RDNA |
파생 제품 | CDNA 2 (데이터센터) |
다음 제품 | RDNA 3 |
2. 배경
2019년 7월 7일, AMD는 노후화된 GCN (Graphics Core Next) 마이크로아키텍처를 대체하는, 게임용으로 특별히 설계된 새로운 그래픽 아키텍처인 RDNA 마이크로아키텍처의 첫 번째 버전을 출시했다. RDNA를 통해 AMD는 GCN 5세대 및 엔비디아의 경쟁 튜링 마이크로아키텍처를 기반으로 한 이전 베가 시리즈에 비해 대기 시간을 줄이고 전력 효율성을 향상시키려고 했다.[100]
AMD는 2019년에 구형 GCN 마이크로아키텍처를 대체하기 위해 게임용으로 설계된 새로운 그래픽 아키텍처인 RDNA 마이크로아키텍처를 처음 출시했다. RDNA를 통해 AMD는 베가 시리즈와 엔비디아의 튜링 마이크로아키텍처에 비해 대기 시간을 줄이고 전력 효율을 높이고자 했다.[100]
RDNA 2는 2020년 1월에 처음 공개되었으며, AMD는 처음에 RDNA 2를 전년도의 원래 RDNA 아키텍처의 "새로운 버전"이라고 불렀다.[101] 2020년 3월 5일 개최된 AMD 재무 분석가의 날에서 AMD는 RDNA의 후속작인 RDNA 2에 대한 세부 정보를 제공하는 클라이언트 GPU 로드맵을 공개했는데, 이는 TSMC의 7nm 프로세스를 사용하여 다시 구축되고 2020년에 출시될 예정이었다.[102] AMD는 투자자들에게 RDNA 2 마이크로아키텍처를 통해 와트당 성능을 50% 향상시키고 IPC를 높이는 것을 목표로 삼았다고 밝혔다.[103]
2020년 10월 28일, AMD는 RDNA 2 아키텍처 및 라데온 RX 6000 시리즈에 대한 온라인 공개 행사를 개최했다.[104][105] 이 행사는 AMD가 젠 3 마이크로아키텍처를 기반으로 구축된 라이젠 5000 시리즈 프로세서를 공개한 지 20일 후에 열렸다.
3. 아키텍처 세부 사항
2020년 1월, AMD는 RDNA 2를 처음 공개하면서 RDNA 아키텍처의 "새로 고침"이라고 표현했다.[101] 2020년 3월 5일, AMD는 재무 분석가의 날 행사에서 TSMC의 7nm 공정을 사용하며 2020년에 출시될 RDNA 2에 대한 세부 로드맵을 공개했다.[102] AMD는 RDNA 2를 통해 와트당 성능을 50% 향상시키고 IPC를 높이는 것을 목표로 했다.[103]
2020년 10월 28일, AMD는 온라인 행사를 통해 RDNA 2 아키텍처와 라데온 RX 6000 시리즈를 공개했다.[104][105] 이 행사는 AMD가 젠 3 마이크로아키텍처 기반의 라이젠 5000 시리즈 프로세서를 공개한 지 20일 후에 개최되었다.
3. 1. 컴퓨트 유닛 (Compute Unit)
RDNA 2는 Radeon RX 5700 XT의 최대 40개에서 두 배 증가한 최대 80개의 컴퓨트 유닛(CU)을 포함한다.[1] 각 컴퓨트 유닛은 64개의 셰이더 코어를 포함한다.[7] CU는 워크 그룹 프로세서(WGP)로 명명된 두 개의 그룹으로 구성되며, 각 CU는 SIMD32 벡터 유닛 2세트, SISD 스칼라 유닛, 텍스처 유닛, 그리고 다양한 캐시 스택을 포함한다.[8] INT4 및 INT8과 같은 새로운 저정밀도 데이터 유형은 RDNA 2 CU에서 새롭게 지원되는 데이터 유형이다.[8]
RDNA 2 그래픽 파이프라인은 와트당 성능 향상과 셰이더 엔진에 캐시를 더 가깝게 배치하여 보다 효율적인 렌더링을 위해 재구성 및 재정렬되었다. 새로운 메시 셰이더 모델을 통해 "메시릿(meshlet)"이라고 불리는 더 작은 기본 도형 배치를 사용하여 셰이더 렌더링을 병렬로 수행할 수 있다. 결과적으로, 메시 셰이더 기능은 GPU 지오메트리 파이프라인에 대한 더 큰 제어를 가능하게 한다.[9]
3. 2. 레이 트레이싱
실시간 하드웨어 가속 레이 트레이싱은 각 CU 내부에 있는 전용 레이 가속기에 의해 처리되는 RDNA 2의 새로운 기능이다.[10] RDNA 2의 레이 트레이싱은 Nvidia RTX 프로토콜이 아닌 더욱 개방적인 DirectX 레이트레이싱 프로토콜에 의존한다.[11]
2023년 2월, 드라이버 업데이트를 통해 DirectX 레이트레이싱을 사용하여 레이 트레이싱 성능을 최대 40%까지 향상시켰다는 보고가 있었다.[12]
3. 3. 클럭 속도
RDNA 2는 RDNA와 동일한 7nm 공정을 사용하지만, AMD는 RDNA 2가 동일한 전력을 사용하면서도 이전 세대보다 30%의 클럭 속도 향상을 달성했다고 주장한다.[13]
3. 4. 캐시 및 메모리 서브시스템
RDNA 2는 GPU가 일반적으로 갖는 L1 및 L2 캐시 외에, AMD가 "인피니티 캐시"라고 부르는 새로운 글로벌 L3 캐시를 추가했다.[14] 이는 더 넓은 메모리 버스를 사용하지 않으면서도 동일한 데이터 대역폭을 유지하기 위해 수행되었다. 제품 기술 아키텍트 샘 내프지거는 인피니티 캐시가 없었다면 "512비트 인터페이스와 그와 관련된 모든 전력, 면적 및 비용을 감당해야 하는 어려운 상황을 고려하고 있었다"라고 말했다.[15] 더 넓은 메모리 버스를 사용하면 더 많은 전력이 필요하며, 이는 RDNA 2의 와트당 성능 향상 목표와 상충된다. AMD 엔지니어는 대형 온다이(on-die) 캐시와 더 넓은 메모리 버스를 갖춘 RDNA 2 실리콘을 비교하는 테스트를 진행했다. 그들은 이러한 캐시가 GPU가 복잡한 이미지를 렌더링할 때 시간적 및 공간적 데이터의 재사용에 도움이 된다는 것을 발견했다. GPU의 컴퓨트 유닛이 비디오 메모리에서 데이터를 검색하는 것보다 물리적으로 가까운 캐시에 빠르게 접근하는 것이 유리하다. AMD는 RDNA 2의 128MB 온다이 인피니티 캐시가 "대기 시간과 전력 소비를 획기적으로 줄인다"라고 주장한다.[16] GPU가 대형 L2 또는 L3 캐시에 접근할 수 있으면 VRAM 또는 시스템 RAM에 접근하는 것보다 필요한 데이터에 더 빠르게 접근할 수 있다. 인피니티 캐시는 GPU 코어와 독립적으로 자체 클럭 속도로 실행될 수 있는 두 세트의 64MB 캐시로 구성된다. 인피니티 캐시는 최대 내부 전송 대역폭이 1986.6GB/s이며, GPU의 GDDR6 메모리 컨트롤러에 대한 의존도를 줄인다.[8] 이제 각 셰이더 엔진에는 두 세트의 L1 캐시가 있다. RDNA 2 GPU의 대형 캐시는 Nvidia의 지포스 RTX 30 시리즈 GPU에 비해 전체 메모리 대역폭이 더 높다.
3. 5. 전력 효율성
AMD는 RDNA 2가 최초의 RDNA 마이크로아키텍처보다 와트당 성능이 최대 54% 향상되었다고 주장한다.[16] 이러한 성능 향상의 21%는 인피니티 캐시 추가와 부분적으로 관련된 클럭당 성능 향상 덕분이다.[17]
3. 6. 미디어 엔진
RDNA 2는 미디어 엔진에서 VCN 3.0, VCN 3.1 및 VCN 3.1.2 비디오 디코딩 블록을 사용한다.[18][19] 최대 8K 해상도에서 AV1 디코딩을 지원하며, AV1 하드웨어 인코딩 지원은 2022년 RDNA 3에서나 지원될 것이다.[20][21] 그러나 로우엔드 Navi 24 다이와 RDNA 2.0 기반의 iGPU는 미디어 인코더를 포함하지 않으며, 결과적으로 AV1을 디코딩할 수 없다.[18]
5. 제품
RDNA 2는 2020년 1월에 처음 공개되었으며, AMD는 이 아키텍처를 이전 RDNA 아키텍처의 "새로 고침"이라고 불렀다.[101] 2020년 3월 5일, AMD는 재무 분석가의 날 행사에서 RDNA 2에 대한 세부 정보를 공개했다. RDNA 2는 TSMC의 7nm 공정을 사용하여 구축되었으며, 2020년에 출시될 예정이었다.[102] AMD는 RDNA 2 마이크로아키텍처를 통해 와트당 성능을 50% 향상시키고 IPC를 높이는 것을 목표로 했다.[103]
2020년 10월 28일, AMD는 RDNA 2 아키텍처 및 라데온 RX 6000 시리즈에 대한 온라인 공개 행사를 개최했다.[104][105] 이 행사는 AMD가 젠 3 마이크로아키텍처를 기반으로 구축된 라이젠 5000 시리즈 프로세서를 공개한 지 20일 후에 열렸다.
RDNA 2 아키텍처는 데스크톱 및 모바일 그래픽 카드 제품군, 통합 그래픽 처리 장치(iGPU), 스팀 덱, Xbox Series X/S, PlayStation 5와 같은 게임 콘솔에 사용된다.
5. 1. 데스크톱
제조 공정다이 크기
설정
(MHz)
(GT/s)
(GP/s)
(GFLOPS)
(GFLOPS)
(GFLOPS)
크기
대역폭 (GB/s)
크기
대역폭 (GB/s)
버스 너비
(MT/s)
TSMC N6
12 CU
2321
111.4
74.3
7,130
3,565
222.8
64비트
219USD (8GB)
16 CU
2815
180.2
90.1
11,530
5,765
360.3
8 GB
113 W
OEM
12 CU
2040
97.9
65.3
6,267
3,133
195.8
32비트
TSMC N7
28 CU
2491
279
159.4
17,860
8,928
558
128비트
32 CU
2589
331.4
165.7
21,209
10,605
662.8
2635
337.2
168.6
21,586
10,793
674.6
36 CU
2450
352.8
156.8
22,579
11,290
705.6
160비트
40 CU
2581
413
165.2
26,429
13,215
825.9
192비트
2600
416
166.4
26,624
13,312
832
60 CU
2105
505.2
202.1
32,333
16,166
1,010
256비트
72 CU
2250
648
288
41,472
20,736
1,296
80 CU
2250
720
288
46,080
23,040
1,440
256비트
2310
739.2
295.7
47,309
23,654
1,478