테슬라 (마이크로아키텍처)

"오늘의AI위키"는 AI 기술로 일관성 있고 체계적인 최신 지식을 제공하는 혁신 플랫폼입니다.
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.

1. 개요
2. 셰이더 아키텍처
- 2.1. 텍스처 필터링
- 2.2. 안티앨리어싱
3. 성능
- 3.1. 배정밀도 연산
4. 비디오 압축/해제
- 4.1. NVENC
5. 칩 종류
참조

1. 개요

테슬라 마이크로아키텍처는 엔비디아의 GPU 아키텍처로, 통합 셰이더 아키텍처를 기반으로 하며, 스칼라 프로세서를 사용하여 유연성과 효율성을 높였다. 향상된 텍스처 필터링, 안티앨리어싱 기술을 제공하며, 단정밀도 및 배정밀도 연산 성능을 갖는다. 또한, 비디오 압축/해제를 위한 NVDEC, 비디오 인코딩 가속을 위한 NVENC를 지원한다. G8x, G9x, C7x, ION, GT2xx, C8x 등 다양한 칩 시리즈를 포함한다.

더 읽어볼만한 페이지

엔비디아 마이크로아키텍처 - 볼타 (마이크로아키텍처)
엔비디아의 볼타 마이크로아키텍처는 CUDA 컴퓨트 기능 7.0 지원, 정수 및 부동 소수점 연산 동시 실행, 12nm FinFET 공정, HBM2 및 NVLink 2.0을 통한 성능 향상, 딥 러닝을 위한 텐서 코어 도입을 특징으로 하며 Tegra Xavier SoC, Tesla V100 등에 적용되어 GPGPU 연산 성능을 향상시키고 딥 러닝 연구 개발에 기여했다.
엔비디아 마이크로아키텍처 - 튜링 (마이크로아키텍처)
튜링은 엔비디아가 개발한 마이크로아키텍처로, 실시간 광선 추적을 위해 쿠다 코어, 레이 트레이싱 코어, 텐서 코어 등을 결합하여 그래픽 성능을 향상시킨다.
GPGPU - 인텔 Xe
인텔 Xe는 저전력부터 고성능 컴퓨팅까지 다양한 시장을 목표로 하는 인텔의 GPU 아키텍처 제품군으로, Xe-LP, Xe-HPG, Xe-HP, Xe-HPC 등의 하위 아키텍처를 가지며 외장 그래픽 카드인 인텔 아크 시리즈와 내장 그래픽, 데이터 센터용 GPU 등에 활용된다.
GPGPU - 테라스케일 (마이크로아키텍처)
테라스케일은 AMD가 개발한 GPU 마이크로아키텍처로, 셰이더 처리량 증가를 위해 통합 셰이더 모델을 사용하며, VLIW 아키텍처를 기반으로 라데온 HD 2000, 3000, 4000, 5000, 6900 시리즈에 적용되었다가 그래픽스 코어 넥스트 아키텍처로 대체되었다.
그래픽스 마이크로아키텍처 - 인텔 Xe
인텔 Xe는 저전력부터 고성능 컴퓨팅까지 다양한 시장을 목표로 하는 인텔의 GPU 아키텍처 제품군으로, Xe-LP, Xe-HPG, Xe-HP, Xe-HPC 등의 하위 아키텍처를 가지며 외장 그래픽 카드인 인텔 아크 시리즈와 내장 그래픽, 데이터 센터용 GPU 등에 활용된다.
그래픽스 마이크로아키텍처 - 테라스케일 (마이크로아키텍처)
테라스케일은 AMD가 개발한 GPU 마이크로아키텍처로, 셰이더 처리량 증가를 위해 통합 셰이더 모델을 사용하며, VLIW 아키텍처를 기반으로 라데온 HD 2000, 3000, 4000, 5000, 6900 시리즈에 적용되었다가 그래픽스 코어 넥스트 아키텍처로 대체되었다.

테슬라 (마이크로아키텍처)
일반 정보
이름	엔비디아 테슬라
종류	GPU 마이크로아키텍처
개발	엔비디아
출시	2006년 11월
선행 아키텍처	퀴리
후속 아키텍처	페르미
제조 공정	90 nm, 80 nm, 65 nm, 55 nm, 40 nm
지원 상태	지원 중단
테슬라 마이크로아키텍처를 특징으로 하는 지포스 200 라인의 그래픽 카드인 엔비디아 지포스 GTX 295 (GT200-400-B3).

2. 셰이더 아키텍처

테슬라 마이크로아키텍처 기반 엔비디아 지포스 GTX 280 카드 내부의 GT200 GPU 다이샷

테슬라는 통합 셰이더 모델을 구현한 엔비디아의 첫 번째 마이크로아키텍처이다. 드라이버는 Direct3D 10 셰이더 모델 4.0과 OpenGL 2.1(이후 드라이버 업데이트로 OpenGL 3.3 지원) 아키텍처를 지원한다. 이 설계는 GPU 기능과 성능 면에서 엔비디아에게 큰 변화를 가져왔는데, 가장 큰 특징은 이전 GPU의 분리된 기능 유닛(픽셀 셰이더, 정점 셰이더)에서 벗어나, 범용적인 작업을 수행할 수 있는 통합된 부동 소수점 프로세서, 즉 '스트림 프로세서'(SP)를 도입한 점이다.

지포스 8의 통합 셰이더 아키텍처는 여러 개의 스트림 프로세서(SP)로 구성된다. 각 SP는 이전 세대의 벡터 처리 방식과 달리, 한 번에 하나의 연산 요소만 처리하는 스칼라 방식으로 작동한다. 이는 구조를 단순화하면서도 유연성과 범용성을 높이는 장점이 있다. 또한, 스칼라 셰이더 유닛은 최적의 명령어 조합과 순서에 의존했던 이전 세대 벡터 셰이더 유닛보다 여러 상황에서 더 효율적이다. 이러한 스칼라 프로세서의 낮은 최대 처리량은 높은 효율성과 클럭 속도(구조 단순화로 가능)로 보완된다. 지포스 8은 이전 지포스 7 시리즈 GPU와 유사하게 코어의 여러 부분을 서로 다른 클럭 속도(클럭 도메인)로 실행하여 성능을 최적화했다. 예를 들어, 지포스 8800 GTX의 스트림 프로세서는 1.35 GHz로 작동하는 반면, 칩의 나머지 부분은 575 MHz로 작동했다.^[1]

2. 1. 텍스처 필터링

지포스 8 시리즈는 이전 제품들보다 텍스처 필터링 성능이 크게 향상되었다. 이는 다양한 최적화 기술과 시각적 기법을 활용하여 필터링 품질을 유지하면서도 렌더링 속도를 높였기 때문이다. 특히, 지포스 8 라인업은 각도에 영향을 받지 않는 이방성 필터링 알고리즘과 완전한 삼선형 텍스처 필터링을 정확하게 처리할 수 있다. 대표적인 G80 칩은 이전 세대 칩보다 텍스처 필터링 연산 능력이 뛰어나, 고품질 필터링을 적용해도 성능 저하가 훨씬 적다.^[1]

2. 2. 안티앨리어싱

엔비디아는 테슬라 마이크로아키텍처에서 새로운 폴리곤 에지 안티앨리어싱 방식을 도입했다. 이 칩의 ROP은 멀티샘플 안티앨리어싱 (MSAA)과 HDR 조명을 동시에 수행할 수 있도록 개선되어 이전 세대의 다양한 제한 사항을 해결했다. 지포스 8 GPU는 FP16 및 FP32 텍스처 형식에서도 MSAA를 적용할 수 있으며, 이전 카드의 64비트 지원에서 향상된 128비트 HDR 렌더링을 지원한다.^[2]

특히, 커버리지 샘플링 AA(CSAA)라는 새로운 안티앨리어싱 기술이 도입되었다. CSAA는 Z-버퍼, 색상, 커버리지 정보를 종합적으로 활용하여 최종 픽셀 색상을 결정하는 방식으로 작동한다. 이러한 최적화를 통해 16배(16X) CSAA 설정에서도 선명하고 또렷한 이미지를 구현할 수 있다.^[2]

3. 성능

테슬라 기반 그래픽 카드의 이론적인 단정밀도 처리 성능은 FLOPS 단위로 제시되지만, 실제 작업 환경에서는 이 수치에 도달하기 어려울 수 있다.^[3]

G80, G90, GT200 아키텍처에서 각 스트리밍 멀티프로세서(SM)는 8개의 셰이더 프로세서(SP, 통합 셰이더 또는 CUDA 코어라고도 함)와 2개의 특수 기능 유닛(SFU)으로 구성된다. 각 SP는 클럭 사이클당 최대 두 개의 단정밀도 연산(곱셈 1개와 덧셈 1개를 하나의 MAD 명령어로 처리)을 수행할 수 있다. 각 SFU는 클럭당 최대 네 개의 곱셈(MUL) 명령어를 처리할 수 있다. 따라서 하나의 SM은 이론적으로 클럭당 최대 24개의 연산(SP에서 8 MAD = 16 연산, SFU에서 8 MUL = 8 연산)을 수행할 수 있으며, 이는 SP 수의 3배에 해당한다. 그래픽 카드의 SP 수를 n, 셰이더 클럭 주파수를 f(GHz)라고 할 때, 이론적인 최대 성능(듀얼 이슈 MAD+MUL, GFLOPS 단위)은 다음 공식으로 계산할 수 있다: FLOPS_sp+sfu = 3 × n × f.^[4]^[5]

하지만 이러한 듀얼 이슈 성능(MAD와 MUL 동시 처리)을 실제로 활용하는 데에는 몇 가지 제약이 따른다.

G80/G90에서는 그래픽 처리 모드에서 MUL 연산을 듀얼 이슈로 활용할 수 없었으나, 이 문제는 GT200에서 크게 개선되었다.^[6]^[7]
SFU는 32비트 부동소수점 곱셈, 초월 함수 계산, 보간, 역수, 역 제곱근, 사인, 코사인 등 특정 연산에 특화되어 있어, SP와 SFU에서 모든 명령어 조합을 동시에 병렬로 실행할 수는 없다.^[8]
SFU가 특정 명령어를 처리하는 동안에는 여러 클럭 사이클 동안 다른 작업을 처리할 수 없게 되어, 이 시간 동안에는 MUL 명령어를 듀얼 이슈로 사용할 수 없다.^[4]

이러한 이유로 실제 작업 환경에서의 성능을 추정할 때는 SFU의 기여를 제외하고 SP당 클럭 사이클당 1개의 MAD(2개 연산)만 수행한다고 가정하는 것이 더 현실적일 수 있다. 이 경우 이론적인 성능 계산 공식은 다음과 같다: FLOPS_sp = 2 × n × f.

3. 1. 배정밀도 연산

테슬라 마이크로아키텍처 기반 GPU 중 GT200 아키텍처는 배정밀도 연산을 지원하며, 이론적인 처리 성능은 단정밀도 성능의 1/8 수준이다. 반면, 이전 세대인 G8x 및 G9x 아키텍처에서는 배정밀도 연산을 지원하지 않는다.^[9]

4. 비디오 압축/해제

NVDEC(Nvidia Decoder)는 비디오 디코딩 과정을 가속하는 엔비디아의 하드웨어 모듈이다.

4. 1. NVENC

NVENC는 엔비디아의 비디오 인코딩 가속 하드웨어 모듈로, 테슬라 마이크로아키텍처 이후 세대의 칩에 도입되었다.

5. 칩 종류

테슬라 마이크로아키텍처 기반의 다양한 GPU 칩들이 출시되었다. 주요 칩 시리즈는 다음과 같으며, 각 시리즈별 상세 칩 목록은 하위 문단에서 확인할 수 있다.

G8x 시리즈
G9x 시리즈
C7x 시리즈
ION 시리즈
GT2xx 시리즈
C8x 시리즈

5. 1. G8x 시리즈

테슬라 마이크로아키텍처의 G8x 시리즈에 해당하는 주요 GPU 칩셋 코드명은 다음과 같다.

G80
G84
G86

5. 2. G9x 시리즈

테슬라 마이크로아키텍처의 G9x 시리즈는 다음과 같은 코드명을 포함한다. 이 GPU들은 주로 지포스 8 시리즈 후기 모델 및 지포스 9 시리즈에 탑재되었다.

5. 3. C7x 시리즈

C77
C78
C79
C7A
C7A-ION

5. 4. ION 시리즈

ION
C7A-ION

5. 5. GT2xx 시리즈

테슬라 마이크로아키텍처의 GT2xx 시리즈는 다음 코드명을 포함한다.

코드명
GT200
GT200B
GT215
GT216
GT218

5. 6. C8x 시리즈

C87
C89

참조

_[1] 간행물 NVIDIA's GeForce 8800 graphics processor http://www.techrepor[...] Tech Report 2007-11-08
_[2] 간행물 NVIDIA G80: Image Quality Analysis http://www.beyond3d.[...] Beyond3D 2006-12-12
_[3] 웹사이트 Beyond3D - NVIDIA GT200 GPU and Architecture Analysis https://www.beyond3d[...]
_[4] 웹사이트 Derek Gets Technical: 15th Century Loom Technology Makes a Comeback - NVIDIA's 1.4 Billion Transistor GPU: GT200 Arrives as the GeForce GTX 280 & 260 http://www.anandtech[...]
_[5] 웹사이트 G80: A Mile High Overview - NVIDIA's GeForce 8800 (G80): GPUs Re-architected for DirectX 10 http://www.anandtech[...]
_[6] 간행물 NVIDIA G80: Architecture and GPU Analysis - Page 11 http://www.beyond3d.[...] Beyond3D 2006-11-08
_[7] 웹사이트 Technical Brief NVIDIA GeForce GTX 200 GPU Architectural Overview http://www.nvidia.co[...] 2008-05
_[8] 뉴스 NVIDIA's GT200: Inside a Parallel Processor http://www.realworld[...] 2008-09-08
_[9] 뉴스 The NVIDIA GeForce GTX Titan X Review http://www.anandtech[...] 2015-03-17

본 사이트는 AI가 위키백과와 뉴스 기사,정부 간행물,학술 논문등을 바탕으로 정보를 가공하여 제공하는 백과사전형 서비스입니다.
모든 문서는 AI에 의해 자동 생성되며, CC BY-SA 4.0 라이선스에 따라 이용할 수 있습니다.
하지만, 위키백과나 뉴스 기사 자체에 오류, 부정확한 정보, 또는 가짜 뉴스가 포함될 수 있으며, AI는 이러한 내용을 완벽하게 걸러내지 못할 수 있습니다.
따라서 제공되는 정보에 일부 오류나 편향이 있을 수 있으므로, 중요한 정보는 반드시 다른 출처를 통해 교차 검증하시기 바랍니다.

문의하기 : help@durumis.com