엔비디아 테그라

"오늘의AI위키"는 AI 기술로 일관성 있고 체계적인 최신 지식을 제공하는 혁신 플랫폼입니다.
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.

1. 개요

엔비디아 테그라는 엔비디아가 개발한 시스템 온 칩(SoC) 제품군으로, 저전력 고성능 그래픽을 특징으로 한다. 2008년 APX 2500 발표를 시작으로, 듀얼 코어, 쿼드 코어 CPU와 다양한 GPU 아키텍처를 탑재하며 발전해 왔다. 테그라 2는 듀얼 코어 CPU를, 테그라 3는 쿼드 코어 CPU를 최초로 탑재했으며, 테그라 K1은 고성능 GPU를 통해 이전 세대 게임기의 성능을 넘어서는 그래픽 성능을 제공했다. 이후 테그라 X1, X2, 자비에, 오린, 그레이스, 아틀란, 토르에 이르기까지 지속적으로 발전하며, 닌텐도 스위치, 자동차 인포테인먼트 시스템, AI 및 HPC 애플리케이션 등 다양한 분야에 활용되고 있다.

엔비디아 테그라
기본 정보

이미지 준비중입니다.

NVIDIA Tegra SoC 제품군
제품 유형시스템 온 칩
브랜드엔비디아
출시일2008년 1분기 (Tegra APX 2500)
중단일2019년 (Tegra TX2)
중앙 처리 장치 (CPU)
명령어 집합ARM
x86 (단종)
그래픽 처리 장치 (GPU)
제조사엔비디아
특징
특징전력 관리
HD 비디오 처리
이미지 처리
제품군
제품군Tegra APX
Tegra 2
Tegra 3
Tegra 4
Tegra K1
Tegra X1
Tegra X2
Tegra Xavier
Tegra Orin
기타
사용 제품스마트폰
태블릿 컴퓨터
휴대용 게임기
자동차
📚 더 읽어볼만한 페이지
  • ARM 기반 시스템 온 칩 - 삼성 엑시노스
    삼성 엑시노스는 삼성전자 시스템LSI 사업부에서 설계 및 생산하는 모바일 AP로, 갤럭시 S에 처음 탑재된 이후 다양한 기기에 사용되었으며, ARM 코어와 자체 개발 코어를 거쳐 AMD와 협력하여 RDNA 아키텍처 기반 GPU를 탑재한 제품을 출시하고 있다.
  • ARM 기반 시스템 온 칩 - 구글 텐서
    구글 텐서는 구글이 자체 개발한 시스템 온 칩(SoC)으로, 픽셀 스마트폰 등 구글 하드웨어 제품에 탑재되어 이미지 처리, AI, 머신 러닝 기능을 강화하며, 여러 세대의 모델이 출시되어 성능과 보안을 향상시키는 데 기여한다.
  • 엔비디아 제품 - 지포스 나우
    지포스 나우는 엔비디아에서 제공하는 클라우드 게이밍 서비스로, 엔비디아 그래픽 카드가 탑재된 서버에서 게임을 실행하여 사용자의 장치로 스트리밍하는 방식으로, 사용자는 고사양 PC 없이도 보유한 게임을 즐길 수 있으며, 다양한 요금제와 얼라이언스 파트너를 통해 서비스되고 대한민국에서는 LG유플러스가 제공한다.
  • 엔비디아 제품 - 스케일러블 링크 인터페이스
    스케일러블 링크 인터페이스(SLI)는 여러 개의 그래픽 처리 장치(GPU)로 3차원 컴퓨터 그래픽 렌더링 작업을 분담하는 기술이며, 엔비디아가 PCI Express용으로 개량하여 지포스 시리즈에 적용했다.
  • 모바일 컴퓨터 - 모바일 컴퓨팅
    모바일 컴퓨팅은 휴대성과 연결성을 특징으로 하는 정보 기술 분야이며, 휴대성, 연결성, 상호 작용, 개별성을 주요 원칙으로 다양한 장치를 포함하고 확장성, 전력 소비, 보안 문제 등의 한계를 가지며 차량 내 컴퓨팅 등 특수한 환경에서도 활용된다.
  • 모바일 컴퓨터 - 전자수첩
    전자수첩은 정보를 기록하고 관리하는 휴대용 전자기기로, 1980년대 일본에서 출시되어 주소록, 일정 관리, 메모 기능 등을 제공했으며, 개인용 컴퓨터와 휴대 정보 단말기의 등장으로 시장이 축소되었다.

2. 역사

엔비디아 테그라는 2008년 2월 APX 2500 모델을 처음 선보였다. 2008년 6월에는 테그라 6xx 제품군이 공개되었고, 2009년 2월에는 APX 2600이 발표되었다. APX 칩은 스마트폰, 테그라 600 및 650 칩은 스마트북과 모바일 인터넷 기기(MID)용으로 설계되었다.

테그라를 탑재한 첫 제품은 2009년 9월 출시된 마이크로소프트의 Zune HD였다. 이후 삼성전자 M1에도 테그라가 탑재되었다. 은 테그라를 사용한 최초의 휴대폰이었지만, 앱 스토어가 없어 테그라의 성능을 제대로 활용하지 못했다.

2010년 1월, 엔비디아는 소비자 가전 전시회 2010에서 차세대 테그라인 테그라 250 (테그라 2)를 발표했다. 2011년 2월 모바일 월드 콩그레스에서는 최초의 쿼드 코어 SoC인 테그라 3 (코드명 Kal-El)을 발표했다.

2012년 1월, 아우디는 차량용 인포테인먼트 시스템과 디지털 계기판에 테그라 3 프로세서를 채택한다고 발표했다. 이 프로세서는 2013년부터 아우디의 모든 차량에 탑재될 예정이며, ISO 26262 인증을 받았다.

2015년 3월에는 1테라플롭의 그래픽 성능을 가진 테그라 X1이 발표되었다. 2016년 10월, 닌텐도 스위치에 테그라 하드웨어가 탑재될 것이라고 발표되었다. 2017년 3월, 닌텐도 스위치에는 맞춤형 테그라 X1(모델 T210)이 탑재되었으며 클럭 속도가 낮다는 사실이 밝혀졌다.

2011년경에 등장한 테그라 2부터 서서히 태블릿 등에 탑재되기 시작했다. 2017년에 출시된 닌텐도 하이브리드 게임기 닌텐도 스위치에 테그라가 탑재되면서, 2018년에는 테그라만으로 1530의 수익을 기록했다 (Switch 관련 972, 자동차 관련 558).

3. 특징

엔비디아 테그라(Tegra)는 다음과 같은 특징을 가지고 있다.

* 저전력으로 높은 그래픽 성능을 제공한다.
* 단일 칩에 CPU, GPU, 2D 엔진, HD 동영상 인코더/디코더, 오디오/이미지 처리 등 다양한 기능이 집약되어 칩셋 면적이 작다.
* 테그라 2는 세계 최초로 듀얼 코어 ARM Cortex A9 CPU를 탑재했다.
* 테그라 3는 세계 최초로 쿼드 코어 ARM Cortex A9 CPU를 탑재했다.
* 테그라 3는 저주파수, 저전력 동작을 위한 컴패니언 CPU 코어를 탑재했다.
* 테그라 X1은 모바일 프로세서 최초로 1TFLOPS 처리 성능을 달성했다.

테그라는 모바일 SoC(System on a Chip)의 기본 구조를 따르며, ARM 프로세서, GPU, 2D 엔진, HD 동영상 인코더/디코더, 오디오 및 이미지 처리 등 독립된 기능별 프로세서 코어를 하나의 칩에 탑재한다. 사용하지 않는 기능의 프로세서는 전원을 차단하여 소비 전력을 100~500mW 정도로 낮춘다.

2011년에 출시된 테그라 2부터 태블릿 등에 탑재되기 시작했으며, TV에 연결하여 대화면 출력이 가능하고, PS3, Wii, Xbox 등의 게임 컨트롤러를 연결하여 가정용 게임기 수준의 3D 게임을 즐길 수 있다.

테그라는 스마트폰이나 태블릿 등 모바일 기기용 SoC로서 게임 등에 강한 고성능 처리를 지향했지만, 채용 점유율은 낮았다. 엔비디아는 자체 개발한 태블릿 게임기 엔비디아 실드(nVidia Shield)에 테그라 K1을 탑재하여 점유율 회복을 꾀했다.

2017년 출시된 닌텐도의 하이브리드 게임기 닌텐도 스위치에 테그라가 탑재되었으며, 2018년에는 테그라만으로 15억 3000만 달러의 수익을 기록했다(스위치 9억 7200만 달러, 자동차 5억 5800만 달러).

4. 사양

엔비디아 테그라의 사양은 다음과 같다.

👆
좌우로 밀어서 보기
세대테그라 2테그라 3테그라 4테그라 4i테그라 K1테그라 X1테그라 X1+테그라 X2자비에오린토르
CPU명령어 집합ARMv7-A (32비트)ARMv8-A (64비트)ARMv8.2-A (64비트)ARMv9.2-A (64비트)
코어2 A94+1 A94+1 A154+1 A94+1 A152 덴버4 A53 (사용 안 함) +
4 A57
2 Denver2 + 4 A578 Carmel12 A78AENeoverse V3AE
L1 캐시 (I/D)32KB/32KB128KB/64KB32KB/32KB + 64KB/32KB128KB/64KB + 48KB/32KB128KB/64KB64KB/64KB
L2 캐시1MB2MB128KB + 2MB2MB + 2MB8MB3MB?
L3 캐시해당 없음4MB6MB?
GPU아키텍처Vec4KeplerMaxwell파스칼볼타암페어블랙웰
CUDA 코어4+48+448+2448+121922565122048?
텐서 코어해당 없음64?
RT 코어해당 없음8?
RAM프로토콜DDR2/LPDDR2DDR3/LPDDR2DDR3/LPDDR3LPDDR3/LPDDR4LPDDR4/LPDDR4XLPDDR5?
최대 크기1GB2GB4GB8GB64GB128GB
대역폭2.7GB/s6.4GB/s7.5GB/s14.88GB/s25.6GB/s34.1GB/s59.7GB/s136.5GB/s204.8GB/s?
공정40nm28nm20nm16nm12nm8nm4nm

Kepler 이후, 통합 셰이더가 사용됨.

* Tegra 650의 그래픽 성능은 "지포스 6" 시리즈 상당으로, 『퀘이크 3 아레나』를 46fps로 실행할 수 있다.
* Tegra 250은 1024x600 해상도를 60fps로 실행할 수 있다.
* Tegra 3은 12코어의 지포스 GPU를 탑재, Tegra 2 대비 약 3배의 그래픽 성능을 가진다. 1080p, 40 비디오 재생 및 스테레오스코픽 3D를 지원한다.
* Tegra 4는 72코어 GeForce GPU를 탑재, Tegra 3의 약 6배, Tegra 2의 약 20배의 그래픽 성능을 가진다.
* Tegra K1은 192개 CUDA 코어를 탑재, Tegra 4의 3.75배 그래픽 성능을 가지며, 7세대 가정용 게임기(PS3/Xbox 360) 성능을 넘어섰다.
* Tegra X1은 256개 CUDA 코어를 탑재, Tegra K1의 1.5~2배 그래픽 성능을 가진다. FP16에 대응하며, 최대 1TFLOPS 연산 능력을 가진다. HDMI 2.0, HDCP 2.2를 지원하여 60fps 4K 콘텐츠 출력이 가능하며, 내장 하드웨어 비디오 프로세서는 HEVC를 지원, 색 심도는 Deep Color 상당의 10bit까지 지원한다.
* Xavier는 512개 CUDA 코어를 탑재, Volta 아키텍처에 AI 처리를 위한 "텐서 코어"를 탑재하여 Tegra X1 대비 10배 이상 연산 성능을 발휘한다. 10W 소비 전력의 NX 시리즈(8GB/16GB)와 40W 소비 전력의 AGX 시리즈(AGX 32GB/64GB, Industrial)가 있다.
* Orin은 Xavier의 6배 처리 성능을 제공한다. 7W 소비 전력부터 최대 70W 소비 전력의 Nano, NX, AGX 3개 시리즈 9개 모델이 있다.

4.1. 테그라 APX

테그라 APX 시리즈는 엔비디아가 초기 출시한 모바일 프로세서 제품군이다.

👆
좌우로 밀어서 보기
Tegra APX
제조 공정아키텍처CPUGPU메모리비디오 인코딩화면 해상도모뎀
Tegra APX 2500, 2600ARM111코어, 0.6 GHzNEON 미지원 (Advanced SIMD)LPDDR-333720p@30fps854x480 (LCD)
1280x1024 (CRT)
1280x720 (HDMI)
Tegra 6001280x1024
Tegra 6501코어, 0.8 GHzLPDDR-4001080p@24fps1680x1050


* 테그라 600은 GPS 및 자동차 분야를 타겟으로 ARM11 700MHz MPCore 프로세서와 저전력 DDR (DDR-333, 166MHz) 메모리를 사용한다. SXGA, HDMI, USB, 스테레오 잭, HD 카메라 720p를 지원한다.
* 테그라 650은 휴대용 기기 및 노트북의 GTX를 타겟으로, ARM11 800MHz MPCore 프로세서와 저전력 DDR (DDR-400, 200MHz) 메모리를 사용한다. 1W 미만의 전력을 소비하며, HD 이미지 처리를 지원한다. 1080p 24프레임/초, HDMI v1.3, WSXGA+ LCD 및 CRT, NTSC/PAL TV 출력을 지원하며, Wi-Fi, 디스크 드라이브, 키보드, 마우스 및 기타 주변 장치를 직접 지원한다. Windows Mobile 기반 설계를 위한 보드 지원 패키지(BSP)를 제공한다.

4.1.1. 테그라 APX 2500

테그라 APX 2500은 ARM11 600 MHz MPCore (원래 지포스 ULV) 프로세서를 기반으로 하며, NOR 또는 NAND 플래시 메모리와 Mobile DDR 메모리를 사용한다. 그래픽은 이미지 프로세서 (FWVGA 854×480 픽셀)를 사용하며, 최대 12 메가픽셀 카메라와 최대 1280×1024 해상도의 LCD 컨트롤러를 지원한다. 저장 장치로는 SSD용 IDE를 지원하며, 비디오 코덱은 최대 720p MPEG-4 AVC/H.264VC-1 디코딩을 지원한다. OpenGL ES 2.0, Direct3D Mobile 및 프로그래밍 가능 셰이더를 지원하는 GeForce ULV를 포함한다. 출력은 HDMI, VGA, composite video, S-Video, 스테레오 잭, USB를 지원하며, USB On-The-Go 기능을 제공한다.

4.1.2. 테그라 APX 2600

wikitext
엔비디아 테그라 APX 2600은 자료가 충분하지 않아, 테그라 250과 함께 요약되어 있다.

👆
좌우로 밀어서 보기
Tegra 250
제조 공정아키텍처CPUGPU메모리비디오 인코딩화면 해상도모뎀
코어 수클럭코어 수연산 성능
Tegra APX 2500, 2600ARM1110.6 GHzNEON 미지원 (Advanced SIMD)LPDDR-333720p@30fps854x480 (LCD)
1280x1024 (CRT)
1280x720 (HDMI)
없음
Tegra 6000.7 GHz1280x1024
Tegra 6500.8 GHzLPDDR-4001080p@24fps1680x1050

4.2. 테그라 6xx

테그라 6xx 시리즈는 테그라 APX 시리즈의 후속 제품군으로, 주로 모바일 기기 및 임베디드 시스템을 대상으로 설계되었다.

👆
좌우로 밀어서 보기
모델프로세서메모리특징주요 용도
테그라 600ARM11 700MHz MPCore저전력 DDR (DDR-333, 166MHz)SXGA, HDMI, USB, 스테레오 잭, HD 카메라 720p 지원GPS 및 자동차 분야
테그라 650ARM11 800MHz MPCore저전력 DDR (DDR-400, 200MHz)1W 미만 소비 전력, HD 이미지 처리, 1080p 24프레임/초, HDMI v1.3, WSXGA+ LCD 및 CRT, NTSC/PAL TV 출력, Wi-Fi, 디스크 드라이브, 키보드, 마우스 및 기타 주변 장치 직접 지원, Windows Mobile 기반 설계를 위한 보드 지원 패키지(BSP) 제공휴대용 기기 및 노트북


하위 섹션에서 이미 상세히 다루고 있으므로, 테그라 600과 테그라 650에 대한 간략한 정보만 표 형태로 제공하여 중복을 최소화하였다.

4.2.1. 테그라 600

* GPS 및 자동차 분야를 타겟으로 한다.
* 프로세서: ARM11 700MHz MPCore
* 메모리: 저전력 DDR (DDR-333, 166MHz)
* SXGA, HDMI, USB, 스테레오 잭을 지원한다.
* HD 카메라 720p를 지원한다.

4.2.2. 테그라 650

테그라 650은 휴대용 기기 및 노트북을 겨냥한 GTX 제품군이다. ARM11 800MHz MPCore 프로세서를 탑재했으며, 저전력 DDR (DDR-400, 200MHz) 메모리를 사용한다. 1W 미만의 낮은 소비 전력을 특징으로 하며, 고급 디지털 카메라 및 HD 캠코더 기능을 위한 HD 이미지 처리를 지원한다.

1080p 24프레임/초, HDMI v1.3, WSXGA+ LCD 및 CRT, NTSC/PAL TV 출력을 지원한다. Wi-Fi, 디스크 드라이브, 키보드, 마우스 및 기타 주변 장치를 직접 지원하며, Windows Mobile 기반 설계를 빠르게 출시할 수 있도록 완벽한 보드 지원 패키지(BSP)를 제공한다.

4.3. 테그라 2

엔비디아 테그라 2 T20
엔비디아 테그라 2 T20

테그라 2는 2세대 테그라로, 1GHz Cortex A9 듀얼 코어 CPU와 ULP(Ultra Low Power) GeForce GPU, 싱글 채널 DDR2 메모리 컨트롤러를 탑재했다. 코어당 32KB/32KB L1 캐시와 1MB 공유 L2 캐시를 가지고 있다.

테그라 2는 SoC 하드웨어 코덱이 지원하는 포맷이 제한적이다. 소프트웨어 가속을 하더라도 ARM NEON 명령어를 지원하지 않아 동영상 디코딩 성능이 떨어진다. ARM NEON을 지원하는 이전 세대 싱글 코어 AP보다 성능이 낮으며, 퀄컴스냅드래곤 S3 프로세서와 비교해도 성능 차이가 크지 않은 듀얼 코어 프로세서이다.

4.3.1. 모델

엔비디아 테그라 250 AP20H (Ventana)는 40nm 공정으로 제조되었으며, ARMv7 아키텍처를 기반으로 한다. 1 GHz ARM Cortex-A9 듀얼 코어 CPU와 ULP GeForce 300 MHz GPU를 탑재하고 있다. 32비트 싱글채널 600 MHz LPDDR2 또는 667 MHz DDR2 메모리를 지원하며, 2010년 1분기에 출시되었다. LG 옵티머스 2X, 모토로라 아트릭스 등의 기기에 사용되었다.

테그라 250 T20 (Harmony)는 AP20H와 동일한 CPU를 사용하지만, GPU 클럭이 333 MHz로 약간 더 높다. 모토로라 줌, 삼성 갤럭시 탭 10.1 등에 사용되었다.

테그라 250 3D AP25와 T25는 1.2 GHz CPU와 400 MHz GPU를 탑재하여 성능이 향상되었다. AP25는 LG 옵티머스 Q2, LG 옵티머스 EX에 사용되었다.

테그라 600 시리즈는 GPS 및 자동차 분야를 타겟으로 하며, 테그라 600은 ARM11 700MHz MPCore CPU와 저전력 DDR (DDR-333, 166MHz) 메모리를 탑재했다. 테그라 650은 ARM11 800MHz MPCore CPU와 저전력 DDR (DDR-400, 200MHz) 메모리를 탑재했으며, 1W 미만의 소비 전력을 가진다.

테그라 4i(코드명 "그레이")는 2013년 2월 19일에 발표되었으며, Cortex-A9 코어를 사용하여 테그라 4의 저전력 변종으로 설계되었다. Icera i500 LTE/HSPA+ 베이스밴드 프로세서를 통합한다.

테그라 K1(코드명 "로건")은 ARM Cortex-A15 코어 또는 엔비디아의 64비트 프로젝트 덴버 듀얼 코어 프로세서와 케플러 GPU를 특징으로 한다.

테그라 K1은 32비트 버전과 64비트 버전으로 나뉜다. 32비트 버전은 Cortex-A15 R3 4+1 코어, 64비트 버전은 Denver 듀얼 코어를 사용한다. 두 버전 모두 GK20A (케플러) GPU를 탑재했다.

다음은 모델별 상세 사양을 표로 정리한 것이다.

👆
좌우로 밀어서 보기
모델명반도체 공정CPU 아키텍처CPUGPU지원 메모리출시일
테그라 250 AP20H (Ventana)40nmARMv71 GHz ARM Cortex-A9 듀얼 코어ULP GeForce 300 MHz32-bit 싱글채널 600 MHz LPDDR2 또는 667 MHz DDR22010년 1분기
테그라 250 T20 (Harmony)40nmARMv71 GHz ARM Cortex-A9 듀얼코어ULP GeForce 333 MHz32비트 싱글채널 600 MHz LPDDR2 또는 667 MHz DDR22010년 1분기
테그라 250 3D AP2540nmARMv71.2 GHz ARM Cortex-A9 듀얼 코어ULP GeForce 400 MHz32비트 싱글채널 600 MHz LPDDR2 또는 667 MHz DDR22011년 1분기
테그라 250 3D T2540nmARMv71.2 GHz dual-core ARM Cortex-A9ULP GeForce 400 MHz32-bit Single-channel 600 MHz LPDDR2 또는 667 MHz DDR22011년 1분기


👆
좌우로 밀어서 보기
모델
번호
CPUGPU메모리채택
프로세서코어주파수마이크로아키텍처코어
구성1
주파수유형용량버스
대역
출시
T148?Cortex-A9 "R4"4+1최대 2.0 GHzVLIW 기반 VEC4 유닛60 (48:12:2)660 MHzLPDDR332비트 단일 채널6.4–7.5 GB/s (800–933 MHz)2014년 1분기

👆
좌우로 밀어서 보기
모델
번호
CPUGPU메모리채택
프로세서코어주파수마이크로-
아키텍처
코어
구성1
주파수GFLOPS
(FP32)
유형용량버스
대역-
사용 가능 여부
T124Cortex-A15 R3
(32비트)
4+1최대 2.3 GHzGK20A
(케플러)
192:8:4756–951 MHz290–365DDR3L
LPDDR3
최대 8 GB
40비트 주소 확장2 사용
64 비트17 GB/s2014년 2분기
T132Denver
(64비트)
2최대 2.5 GHz최대 8 GB??2014년 3분기

1 통합 셰이더: 텍스처 매핑 유닛 : 렌더 출력 유닛

2 ARM LPAE(Large Physical Page Extension)는 1 TiB (240 바이트)를 지원한다. 8 GiB 제한은 부품별로 다르다.

👆
좌우로 밀어서 보기
Tegra 250
제조 공정아키텍처CPUGPU메모리비디오 인코딩화면 해상도모뎀
코어 수클럭코어 수연산 성능
Tegra APX 2500, 2600ARM1110.6 GHzNEON 미지원 (Advanced SIMD)LPDDR-333720p@30fps854x480 (LCD)
1280x1024 (CRT)
1280x720 (HDMI)
없음
Tegra 6000.7 GHz1280x1024
Tegra 6500.8 GHzLPDDR-4001080p@24fps1680x1050
Tegra 23040 nmCortex-A921.0 GHzVFPv3-D16 (VFPv3 대비 레지스터 수 절반)
NEON 미지원 (Advanced SIMD)
8 (4:4)단정밀도 5.6 GFLOPS (333 MHz)싱글 채널 LPDDR2-6001080p1024x600 (LCD)
1280x1024 (CRT)
1920x1080 (HDMI)
Tegra 250싱글 채널 LPDDR2-600, 6671680x1050 (LCD)
1600x1200 (CRT)1920x1080 (HDMI)

👆
좌우로 밀어서 보기
Tegra 3 / Tegra 4
제조 공정아키텍처CPUGPU메모리비디오 인코딩화면 해상도모뎀
코어 수클럭연산 성능L2 캐시코어 수연산 성능
Tegra 340 nmCortex-A94 + 11.3 - 1.7 GHzVFPv3
NEON 지원 (Advanced SIMD)
단정밀도 27.2 GFLOPS
배정밀도 10.2 GFLOPS
1 MB12 (4:8)단정밀도 12.4 GFLOPS(520 MHz32bit 싱글 채널 LPDDR3-L 1600, LPDDR2-10661440p2048x1536(LCD)
1920x1200(CRT)
1920x1080(HDMI)
없음
Tegra 4i28 nmCortex-A9 R4? - 2.3 GHzVFPv4
NEON 지원 (Advanced SIMD)
단정밀도 36.8 GFLOPS
배정밀도 13.8 GFLOPS
60 (20:40)단정밀도 79.2 GFLOPS (660 MHz)32bit 싱글 채널 LPDDR3-21331920x1200(LCD)
1920x1080(HDMI)
LTE Cat4
HSPA+
TD-HSPA
GSM / GPRS / EDGE
Tegra 4Cortex-A15 r21.2 - 1.9 GHz단정밀도 60.8 GFLOPS
배정밀도 15.2 GFLOPS
2 MB + 0.5 MB72 (24:48)단정밀도 96.76 GFLOPS
(672 MHz)
32bit 듀얼 채널 LPDDR3-L, LPDDR3-18663200x2000(LCD)
3840x2160(HDMI)
없음

👆
좌우로 밀어서 보기
Tegra K1 / Tegra X1 / Tegra X2
제조 공정아키텍처CPUGPU메모리비디오 인코딩화면 해상도모뎀
코어 수클럭연산 성능L2 캐시코어 수클럭연산 성능
Tegra K128 nm (TSMC HPM)Cortex-A15 r34 + 1? - 2.3 GHz단정밀도 73.6 GFLOPS
배정밀도 18.4 GFLOPS
2 MB + 0.5 MBCUDA Kepler
Unified Shader 192 코어
950 MHz단정밀도 365 GFLOPS64bit 듀얼 채널 LPDDR3,LPDDR3-L 14.9 GB/sH.264, VP8 등 2160p 30fps3840x2160 (LCD)
4096x2160 (HDMI)
없음
Tegra K1Denver2? - 2.5 GHz단정밀도 40 GFLOPS
배정밀도 20 GFLOPS
2 MB
Tegra X120 nm (TSMC 20 SoC)Cortex-A57 + Cortex-A534 + 4Cortex-A57 1.9 GHz2 MB + 0.5 MBCUDA Maxwell 256 코어1024 MHz단정밀도 512 GFLOPS64bit LPDDR4, LPDDR3, DDR3 25.6 GB/sH.265, VP9 등 2160p 30fps4096x2160 60fps
Tegra X1+16 nm1267 MHz단정밀도 649 GFLOPS64bit LPDDR4X
Tegra X2 (Parker)16 nmDenver 2 + Cortex-A572 + 42.0 GHz + 2.0 GHz2 MB + 2 MBCUDA Pascal 256 코어1465 MHz단정밀도 750 GFLOPS128bit LPDDR4 58.4 GB/sH.265, VP9 등 2160p 60fps

👆
좌우로 밀어서 보기
Xavier / Orin
제조 공정아키텍처CPUGPU메모리비디오 인코딩화면 해상도모뎀
코어 수클럭연산 성능L2 캐시L3 캐시코어 수클럭연산 성능
Xavier12 nmNVIDIA Carmel Arm®v8.281.9GHz(Nano)
2.2 GHz(AGX)
6MBr
4MBCUDA Volta 384코어 Tensor 48코어(Nano)
1.1 GHz(Nano)
단정밀도 1410 GFLOPS128bit LPDDR4X 59.7 GB/s
H.265,VP94K 60fps3840x2160 60fps
Orin8 nmCortex®-A78AE v8.2121.5GHz(Nano)
2.2 GHz(AGX)
1.5MB(Nano)
3MB(AGX)
4MB(Nano)
6MB(AGX)
CUDA Ampere 512코어 Tensor 16코어(Nano)
625 MHz(Nano)
단정밀도 0.64 – 5.32 TFLOPS128bit LPDDR5 102.4 GB/s
H.265,VP9,AV1 등 4K 60fps3840x2160 60fps

4.4. 테그라 3 (칼엘)

테그라 3(코드명 "칼엘")은 쿼드 코어 ARM Cortex-A9 CPU와 저전력 상황에서 작동하는 컴패니언 코어를 결합한 "4-PLUS-1" 아키텍처를 사용한다. 이 기술은 상황에 따라 4개의 주 코어 또는 저전력 컴패니언 코어를 활용하여 전체 소비 전력을 줄이는 방식이다.

엔비디아 ULP GeForce GPU는 테그라 2 GPU에서 발전된 형태로, 4개의 픽셀 셰이더 유닛이 추가되었고 더 높은 클럭으로 작동한다. 최대 2560x1600 해상도의 비디오 출력을 지원하며, 1080p H.264 High-Profile @ 40 Mbps의 하드웨어 비디오 가속을 지원한다. 이전 세대와 달리 NEON SIMD 확장 기능을 지원한다.

4.4.1. 모델

3세대 테그라는 네 개의 1.3Ghz Cortex A9 코어와 "컴패니언" 코어로 불리는 저전력 저클럭의 서브코어로 구성되어 있다. 엔비디아는 로드가 낮을 때 다른 코어는 모두 오프라인 상태로 만들고 컴패니언 코어만 사용해 연산을 하여 전력소모를 최대 61%까지 줄였다고 주장한다. 이 새로운 방식의 코어로 인해 테그라 3는 종종 4+1 코어로 불린다.

이전 세대의 테그라와는 달리 NEON SIMD 명령어를 탑재하였으며 2560x1600 해상도의 화면 출력과 1080p H264 High-Profile @ 40 Mbps의 하드웨어 동영상 가속을 지원한다.

👆
좌우로 밀어서 보기
모델명반도체 공정CPU 아키텍처CPUCPU 캐시GPU메모리 지원출시시기탑재 기기
테그라 3 T30L40 nm LPG by TSMCARMv71.2 GHz 쿼드코어 ARM Cortex-A9 (싱글 코어 모드에서 최대 1.3 GHz)L1: 32 KB instruction + 32 KB data, L2: 1 MB416 MHz ULP GeForce32-비트 싱글채널 667 MHz DDR32012년 1분기ASUS Transformer Pad 300, 에이수스 :en:Nexus 7
테그라 3 T3040 nm LPG by TSMCARMv71.4 GHz 쿼드코어 ARM Cortex-A9 (싱글코어 가동시 1.5 GHz)L1: 32 KB instruction + 32 KB data, L2: 1 MB520 MHz ULP GeForce32비트 싱글채널 1066 MHz LPDDR2 또는 1500 MHz DDR3-L2011년 4분기:en:Asus Eee Pad Transformer Prime, IdeaTab K2 / LePad K2, :en:Acer Iconia Tab A510, :en:Acer Iconia Tab A700, :en:LG Optimus 4X HD, :en:HTC One X, ZTE Era, ZTE PF 100, ZTE T98, Toshiba AT270, Toshiba AT300 (Excite 10), Asus Tablet 610, Fuhu Inc. nabi 2 Tablet, :en:Tesla Model S
테그라 3 T3340 nm LPG by TSMCARMv71.6 GHz 쿼드코어 ARM Cortex-A9 (싱글코어 가동시 1.7 GHz)L1: 32 KB instruction + 32 KB data, L2: 1 MB520 MHz ULP GeForce32비트 싱글채널 1600 MHz DDR32012년 2분기ASUS Transformer Pad Infinity 700 (TF700T), :en:Ouya


; 테그라 600
* GPS 및 자동차 분야 타겟
* 프로세서: ARM11 700MHz MPCore
* 메모리: 저전력 DDR (DDR-333, 166MHz)
* SXGA, HDMI, USB, 스테레오 잭
* HD 카메라 720p

; 테그라 650
* 휴대용 기기 및 노트북의 GTX 타겟
* 프로세서: ARM11 800MHz MPCore
* 저전력 DDR (DDR-400, 200MHz)
* 1W 미만 소비 전력
* 고급 디지털 카메라 및 HD 캠코더 기능을 위한 HD 이미지 처리
* 디스플레이는 1080p 24프레임/초, HDMI v1.3, WSXGA+ LCD 및 CRT, NTSC/PAL TV 출력을 지원
* Wi-Fi, 디스크 드라이브, 키보드, 마우스 및 기타 주변 장치 직접 지원
* Windows Mobile 기반 설계를 위한 빠른 출시를 가능하게 하는 완벽한 보드 지원 패키지(BSP)

👆
좌우로 밀어서 보기
모델장치
T124Jetson TK1 개발 보드, 엔비디아 쉴드 태블릿(Shield Tablet), 에이서 크롬북 13, HP 크롬북 14 G3, 샤오미 미패드, 스네일 게임즈(Snail Games) OBox, UTStarcom MC8718, 구글 프로젝트 탱고 태블릿, 아팔리스 TK1 시스템 온 모듈, 퓨즈 토마호크 F1, JXD 싱귤래리티 S192
T132HTC 넥서스 9(Nexus 9)


X1은 닌텐도 스위치 비디오 게임 콘솔의 기반이다.
X1은 닌텐도 스위치 비디오 게임 콘솔의 기반이다.

Tegra X1의 다이 샷
Tegra X1의 다이 샷

Nvidia Shield TV의 Tegra X1
Nvidia Shield TV의 Tegra X1

2015년에 출시된 엔비디아의 Tegra X1(코드명 "Erista")은 두 개의 CPU 클러스터를 특징으로 하며, 하나는 4개의 ARM Cortex-A57 코어를, 다른 하나는 4개의 ARM Cortex-A53 코어를, 그리고 Maxwell 기반의 그래픽 처리 장치를 가지고 있다.
Adaptive Scalable Texture Compression을 지원한다.

공식적으로 Tegra X1+로 알려진, 전력 효율성이 향상된 개정판(코드명 "Mariko")은 2019년에 출시되었다. 또한 T214 및 T210B01로 알려져 있다.

* CPU: ARMv8 ARM Cortex-A57 쿼드 코어(64비트) + (미사용?) ARM Cortex-A53 쿼드 코어(64비트)
* GPU: Maxwell 기반 256 코어 GPU (Jetson Nano: 128코어만)
* MPEG-4 HEVC VP8 인코딩/디코딩 및 VP9 디코딩 지원 (Jetson Nano: 인코더는 H.265, H.264/스테레오, VP8, JPEG; 디코더는 H.265, H.264/스테레오, VP8, VP9, VC-1, MPEG-2, JPEG)
* TSMC 20 nm 공정 (Tegra X1)
* TSMC 16 nm 공정 (Tegra X1+)
* TDP:
T210: 15 W, 평균 전력 소비는 10 W 미만
Jetson Nano: 10 W(모드 0); 모드 1: 5W(2개의 CPU 코어만 @ 918 MHz, GPU @ 640 MHz)

👆
좌우로 밀어서 보기
모델
번호
SOC 변형공정CPUGPU메모리채택
프로세서코어주파수1마이크로-
아키텍처
코어
구성2
주파수GFLOPS
(FP32)
GFLOPS
(FP16)
유형용량3버스
너비
대역-
4
사용 가능 여부
T210ODNX02-A2TSMC 20 nmCortex-A57 +
Cortex-A53
A57: 4
A53: 4
A57: 2.2 GHz
A53: 1.3 GHz
GM20B
(Maxwell)
256: 16:161000 MHz5121024LPDDR3 / LPDDR48 GB64 비트25.6 GB/s2015년 2분기
TM660M-A2A57: 1.428 GHz
A53: ? GHz
128:16:16921 MHz236472LPDDR3? / LPDDR44 GB2019년 3월
T214 / T210b01ODNX10-A1TSMC 16 nmCortex-A57A57: 4A57: 2.1 GHzGM21B (Maxwell)256:16:161267 MHz6491298LPDDR4 /LPDDR4X8 GB34.1 GB/s2019년 2분기

👆
좌우로 밀어서 보기
Tegra 250
제조 공정아키텍처CPUGPU메모리비디오 인코딩화면 해상도모뎀
코어 수클럭코어 수연산 성능
Tegra APX 2500, 2600ARM1110.6 GHzNEON 미지원 (Advanced SIMD)LPDDR-333720p@30fps854x480 (LCD)
1280x1024 (CRT)
1280x720 (HDMI)
없음
Tegra 6000.7 GHz1280x1024
Tegra 6500.8 GHzLPDDR-4001080p@24fps1680x1050
Tegra 23040 nmCortex-A921.0 GHzVFPv3-D16 (VFPv3 대비 레지스터 수 절반)
NEON 미지원 (Advanced SIMD)
8 (4VS : 4PS)단정밀도 5.6 GFLOPS (333 MHz)싱글 채널 LPDDR2-6001080p1024x600 (LCD)
1280x1024 (CRT)
1920x1080 (HDMI)
Tegra 250싱글 채널 LPDDR2-600, 6671680x1050 (LCD)
1600x1200 (CRT)1920x1080 (HDMI)

👆
좌우로 밀어서 보기
Tegra 3 / Tegra 4
제조 공정아키텍처CPUGPU메모리비디오 인코딩화면 해상도모뎀
코어 수클럭연산 성능L2 캐시코어 수연산 성능
Tegra 340 nmCortex-A94 + 11.3 - 1.7 GHzVFPv3
NEON 지원 (Advanced SIMD)
단정밀도 27.2 GFLOPS
배정밀도 10.2 GFLOPS
1 MB12 (4VS : 8PS단정밀도 12.4 GFLOPS (520 MHz)32bit 싱글 채널 LPDDR3-L 1600, LPDDR2-10661440p2048x1536(LCD)
1920x1200(CRT)
1920x1080(HDMI)
없음
Tegra 4i28 nmCortex-A9 R4? - 2.3 GHzVFPv4
NEON 지원 (Advanced SIMD)
단정밀도 36.8 GFLOPS
배정밀도 13.8 GFLOPS
60 (20VS : 40PS)단정밀도 79.2 GFLOPS (660 MHz)32bit 싱글 채널 LPDDR3-21331920x1200(LCD)
1920x1080(HDMI)
LTE Cat4
HSPA+
TD-HSPA
GSM / GPRS / EDGE
Tegra 4Cortex-A15 r21.2 - 1.9 GHz단정밀도 60.8 GFLOPS
배정밀도 15.2 GFLOPS
2 MB + 0.5 MB72 (24VS : 48PS)단정밀도 96.76 GFLOPS
(672 MHz)
32bit 듀얼 채널 LPDDR3-L, LPDDR3-18663200x2000(LCD)
3840x2160(HDMI)
없음

👆
좌우로 밀어서 보기
Tegra K1 / Tegra X1 / Tegra X2
제조 공정아키텍처CPUGPU메모리비디오 인코딩화면 해상도모뎀
코어 수클럭연산 성능L2 캐시코어 수클럭연산 성능
Tegra K128 nm (TSMC HPM)Cortex-A15 r34 + 1? - 2.3 GHz단정밀도 73.6 GFLOPS
배정밀도 18.4 GFLOPS
2 MB + 0.5 MBCUDA Kepler
Unified Shader 192 코어
950 MHz단정밀도 365 GFLOPS64bit 듀얼 채널 LPDDR3,LPDDR3-L 14.9 GB/sH.264, VP8 등 2160p 30fps3840x2160 (LCD)
4096x2160 (HDMI)
없음
Tegra K1Denver2? - 2.5 GHz단정밀도 40 GFLOPS
배정밀도 20 GFLOPS
2 MB
Tegra X120 nm (TSMC 20 SoC)Cortex-A57 + Cortex-A534 + 4Cortex-A57 1.9 GHz2 MB + 0.5 MBCUDA Maxwell 256 코어1024 MHz단정밀도 512 GFLOPS64bit LPDDR4, LPDDR3, DDR3 25.6 GB/sH.265, VP9 등 2160p 30fps4096x2160 60fps
Tegra X1+16 nm1267 MHz단정밀도 649 GFLOPS64bit LPDDR4X
Tegra X2 (Parker)16 nmDenver 2 + Cortex-A572 + 42.0 GHz + 2.0 GHz2 MB + 2 MBCUDA Pascal 256 코어1465 MHz단정밀도 750 GFLOPS128bit LPDDR4 58.4 GB/sH.265, VP9 등 2160p 60fps

👆
좌우로 밀어서 보기
Xavier / Orin
제조 공정아키텍처CPUGPU메모리비디오 인코딩화면 해상도모뎀
코어 수클럭연산 성능L2 캐시L3 캐시코어 수클럭연산 성능
Xavier12 nmNVIDIA Carmel Arm®v8.281.9GHz (Nano)
2.2 GHz (AGX)
6MB
4MBCUDA Volta 384코어 Tensor 48코어 (Nano)
1.1 GHz (Nano)
단정밀도 1410 GFLOPS128bit LPDDR4X 59.7 GB/s
H.265,VP94K 60fps3840x2160 60fps
Orin8 nmCortex®-A78AE v8.2121.5GHz (Nano)
2.2 GHz (AGX)
1.5MB (Nano)
3MB (AGX)
4MB (Nano)
6MB (AGX)
CUDA Ampere 512코어 Tensor 16코어 (Nano)
625 MHz (Nano)
단정밀도 0.64 – 5.32 TFLOPS128bit LPDDR5 102.4 GB/s
H.265,VP9,AV1 등 4K 60fps3840x2160 60fps

4.5. 테그라 4 (웨인)

테그라 4(코드명 "웨인")는 2013년 초에 출시된 시스템 온 칩(SoC)이다.

테그라 4는 ARM Cortex-A15 CPU와 저전력 Cortex-A15 컴패니언 코어를 탑재한 쿼드 코어 프로세서로, 테그라 3와 유사한 가변 SMP 아키텍처(4+1 코어)를 사용하며 1.9GHz로 작동한다. 72코어 ULP 지포스 GPU를 탑재하여 이전 제품보다 향상된 기능과 효율성을 제공한다.

최대 1080p 60Mbit/s @ 60fps의 WebM 비디오 하드웨어 디코딩 및 인코딩을 지원하며, Icera 인수 후 개발된 소프트웨어 정의 라디오 i500을 통해 카테고리 3(100Mbit/s) LTE를 지원하고, 추후 카테고리 4(150Mbit/s) 업데이트가 예정되어 있다.

4.5.1. 모델

👆
좌우로 밀어서 보기
모델명반도체 공정CPU 아키텍처CPUGPU지원 메모리출시일사용 기기통신칩
테그라 4 T4028 nmARMv71.8 GHz ARM Cortex-A15 쿼드 코어ULP GeForce 672 MHz32-bit 듀얼채널 ?? MHz LPDDR3& ?? MHz DDR3L2013 Q1
테그라 4 T4328 nmARMv72.0 GHz ARM Cortex-A15 쿼드 코어ULP GeForce 672 MHz32비트 듀얼채널 ?? MHz LPDDR3& ?? MHz DDR3L2013 Q3
테그라 4 AP4028 nmARMv7?? GHz ARM Cortex-A15 쿼드 코어ULP GeForce 672 MHz32비트 듀얼채널 ?? MHz LPDDR3& ?? MHz DDR3L2013 Q3
테그라 4i SP3X28 nmARMv72.3 GHz ARM Cortex-A9 쿼드 코어ULP GeForce 400 MHz32-bit 듀얼채널 ?? MHz LPDDR32013 Q3i500 LTE 베이스밴드, TD-SCDMA/WCDMA/FDD-LTE/TD-LTE


👆
좌우로 밀어서 보기
Tegra 250
제조 공정아키텍처CPUGPU메모리비디오 인코딩화면 해상도모뎀
코어 수클럭코어 수연산 성능
Tegra APX 2500, 2600ARM1110.6 GHzNEON 미지원 (Advanced SIMD)LPDDR-333720p@30fps854x480 (LCD)
1280x1024 (CRT)
1280x720 (HDMI)
없음
Tegra 6000.7 GHz1280x1024
Tegra 6500.8 GHzLPDDR-4001080p@24fps1680x1050
Tegra 23040 nmCortex-A921.0 GHzVFPv3-D16 (VFPv3 대비 레지스터 수 절반)
NEON 미지원 (Advanced SIMD)
8 (4 셰이더 프로세서 : 4 픽셀 셰이더)단정밀도 5.6 GFLOPS (333 MHz)싱글 채널 LPDDR2-6001080p1024x600 (LCD)
1280x1024 (CRT)
1920x1080 (HDMI)
Tegra 250싱글 채널 LPDDR2-600, 6671680x1050 (LCD)
1600x1200 (CRT)1920x1080 (HDMI)


👆
좌우로 밀어서 보기
Tegra 3 / Tegra 4
제조 공정아키텍처CPUGPU메모리비디오 인코딩화면 해상도모뎀
코어 수클럭연산 성능L2 캐시코어 수연산 성능
Tegra 340 nmCortex-A94 + 11.3 - 1.7 GHzVFPv3
NEON 지원 (Advanced SIMD)
단정밀도 27.2 GFLOPS
배정밀도 10.2 GFLOPS
1 MB12 (4 셰이더 프로세서 : 8 픽셀 셰이더)단정밀도 12.4 GFLOPS (520 MHz)32bit 싱글 채널 LPDDR3-L 1600, LPDDR2-10661440p2048x1536(LCD)
1920x1200(CRT)
1920x1080(HDMI)
없음
Tegra 4i28 nmCortex-A9 R4? - 2.3 GHzVFPv4
NEON 지원 (Advanced SIMD)
단정밀도 36.8 GFLOPS
배정밀도 13.8 GFLOPS
60 (20 셰이더 프로세서 : 40 픽셀 셰이더)단정밀도 79.2 GFLOPS (660 MHz)32bit 싱글 채널 LPDDR3-21331920x1200(LCD)
1920x1080(HDMI)
LTE Cat4
HSPA+
TD-HSPA
GSM / GPRS / EDGE
Tegra 4Cortex-A15 r21.2 - 1.9 GHz단정밀도 60.8 GFLOPS
배정밀도 15.2 GFLOPS
2 MB + 0.5 MB72 (24 셰이더 프로세서 : 48 픽셀 셰이더)단정밀도 96.76 GFLOPS
(672 MHz)
32bit 듀얼 채널 LPDDR3-L, LPDDR3-18663200x2000(LCD)
3840x2160(HDMI)
없음


👆
좌우로 밀어서 보기
Tegra K1 / Tegra X1 / Tegra X2
제조 공정아키텍처CPUGPU메모리비디오 인코딩화면 해상도모뎀
코어 수클럭연산 성능L2 캐시코어 수클럭연산 성능
Tegra K128 nm (TSMC HPM)Cortex-A15 r34 + 1? - 2.3 GHz단정밀도 73.6 GFLOPS
배정밀도 18.4 GFLOPS
2 MB + 0.5 MBCUDA Kepler
Unified Shader 192 코어
950 MHz단정밀도 365 GFLOPS64bit 듀얼 채널 LPDDR3,LPDDR3-L 14.9 GB/sH.264, VP8 등 2160p 30fps3840x2160 (LCD)
4096x2160 (HDMI)
없음
Tegra K1Denver2? - 2.5 GHz단정밀도 40 GFLOPS
배정밀도 20 GFLOPS
2 MB
Tegra X120 nm (TSMC 20 SoC)Cortex-A57 + Cortex-A534 + 4Cortex-A57 1.9 GHz2 MB + 0.5 MBCUDA Maxwell 256 코어1024 MHz단정밀도 512 GFLOPS64bit LPDDR4, LPDDR3, DDR3 25.6 GB/sH.265, VP9 등 2160p 30fps4096x2160 60fps
Tegra X1+16 nm1267 MHz단정밀도 649 GFLOPS64bit LPDDR4X
Tegra X2 (Parker)16 nmDenver 2 + Cortex-A572 + 42.0 GHz + 2.0 GHz2 MB + 2 MBCUDA Pascal 256 코어1465 MHz단정밀도 750 GFLOPS128bit LPDDR4 58.4 GB/sH.265, VP9 등 2160p 60fps


👆
좌우로 밀어서 보기
Xavier / Orin
제조 공정아키텍처CPUGPU메모리비디오 인코딩화면 해상도모뎀
코어 수클럭연산 성능L2 캐시L3 캐시코어 수클럭연산 성능
Xavier12 nmNVIDIA Carmel Armv8.281.9GHz (Nano)
2.2 GHz (AGX)
6MB
4MBCUDA Volta 384코어 Tensor 48코어 (Nano)
1.1 GHz (Nano)
단정밀도 1410 GFLOPS128bit LPDDR4X 59.7 GB/s
H.265, VP94K 60fps3840x2160 60fps
Orin8 nmCortex-A78AE v8.2121.5GHz (Nano)
2.2 GHz (AGX)
1.5MB (Nano)
3MB (AGX)
4MB (Nano)
6MB (AGX)
CUDA Ampere 512코어 Tensor 16코어 (Nano)
625 MHz (Nano)
단정밀도 0.64 – 5.32 TFLOPS128bit LPDDR5 102.4 GB/s
H.265, VP9, AV1 등 4K 60fps3840x2160 60fps


👆
좌우로 밀어서 보기
모델
번호
CPUGPU메모리채택
프로세서코어주파수마이크로-
아키텍처
코어
구성1
주파수GFLOPS
(FP32)
GFLOPS
(FP16)
유형용량버스
대역-
사용 가능 여부
T186덴버2 +
Cortex-A57
2 + 4덴버2: 1.4–2.0 GHz
A57: 1.2–2.0 GHz
GP10B (파스칼)256:16:16 (2)854–1465 MHz437–750874–1500LPDDR48 GB128 비트59.7 GB/s

1 통합 셰이더: 텍스처 매핑 유닛 : 렌더 출력 유닛 (SM 수)

4.6. 테그라 4i (그레이)

테그라 4i는 휴대폰 및 태블릿용으로 설계된 쿼드 코어 ARM Cortex-A9 CPU 기반의 저전력 프로세서이다. 테그라 4의 변종으로, Icera i500 LTE/HSPA+ 베이스밴드 프로세서를 통합하여 통신 기능을 강화한 점이 특징이다.

2013년에 출시되었으며, 주요 특징은 다음과 같다.

* CPU: 쿼드 코어 ARM Cortex-A9 R4 (최대 2.3 GHz)
* GPU: 60개 ULP 지포스 코어 (20 버텍스 셰이더 : 40 픽셀 셰이더)
* 메모리: 32bit 싱글 채널 LPDDR3-2133
* 연산 성능: 단정밀도 36.8 GFLOPS, 배정밀도 13.8 GFLOPS
* 통신: Icera i500 LTE/HSPA+ 통합 (LTE Cat4, HSPA+, TD-HSPA, GSM/GPRS/EDGE 지원)
* 제조 공정: 28 nm HPM
* 화면 해상도: 최대 1920x1200 (LCD), 1920x1080 (HDMI)
* VFPv4 및 NEON (Advanced SIMD) 지원

테그라 4i는 테그라 4와 테그라 3 사이의 성능을 제공한다.

4.6.1. 모델

엔비디아 테그라의 모델별 상세 정보는 다음과 같다.

👆
좌우로 밀어서 보기
Tegra 250
제조 공정아키텍처CPUGPU메모리비디오 인코딩화면 해상도모뎀
코어 수클럭코어 수연산 성능
Tegra APX 2500, 2600ARM1110.6 GHzNEON 미지원 (Advanced SIMD)LPDDR-333720p@30fps854x480 (LCD)
1280x1024 (CRT)
1280x720 (HDMI)
없음
Tegra 6000.7 GHz1280x1024
Tegra 6500.8 GHzLPDDR-4001080p@24fps1680x1050
Tegra 23040 nmCortex-A921.0 GHzVFPv3-D16 (VFPv3 대비 레지스터 수 절반)
NEON 미지원 (Advanced SIMD)
8 (4 버텍스 셰이더 : 4 픽셀 셰이더)단정밀도 5.6 GFLOPS (333 MHz)싱글 채널 LPDDR2-6001080p1024x600 (LCD)
1280x1024 (CRT)
1920x1080 (HDMI)
Tegra 250싱글 채널 LPDDR2-600, 6671680x1050 (LCD)
1600x1200 (CRT)1920x1080 (HDMI)


👆
좌우로 밀어서 보기
Tegra 3 / Tegra 4
제조 공정아키텍처CPUGPU메모리비디오 인코딩화면 해상도모뎀
코어 수클럭연산 성능L2 캐시코어 수연산 성능
Tegra 340 nmCortex-A94 + 11.3 - 1.7 GHzVFPv3
NEON 지원 (Advanced SIMD)
단정밀도 27.2 GFLOPS
배정밀도 10.2 GFLOPS
1 MB12 (4 버텍스 셰이더 : 8 픽셀 셰이더)단정밀도 12.4 GFLOPS(520 MHz32bit 싱글 채널 LPDDR3-L 1600, LPDDR2-10661440p2048x1536(LCD)
1920x1200(CRT)
1920x1080(HDMI)
없음
Tegra 4i28 nmCortex-A9 R4? - 2.3 GHzVFPv4
NEON 지원 (Advanced SIMD)
단정밀도 36.8 GFLOPS
배정밀도 13.8 GFLOPS
60 (20 버텍스 셰이더 : 40 픽셀 셰이더)단정밀도 79.2 GFLOPS (660 MHz)32bit 싱글 채널 LPDDR3-21331920x1200(LCD)
1920x1080(HDMI)
LTE Cat4
HSPA+
TD-HSPA
GSM / GPRS / EDGE
Tegra 4Cortex-A15 r21.2 - 1.9 GHz단정밀도 60.8 GFLOPS
배정밀도 15.2 GFLOPS
2 MB + 0.5 MB72 (24 버텍스 셰이더 : 48 픽셀 셰이더)단정밀도 96.76 GFLOPS
(672 MHz)
32bit 듀얼 채널 LPDDR3-L, LPDDR3-18663200x2000(LCD)
3840x2160(HDMI)
없음


👆
좌우로 밀어서 보기
Tegra K1 / Tegra X1 / Tegra X2
제조 공정아키텍처CPUGPU메모리비디오 인코딩화면 해상도모뎀
코어 수클럭연산 성능L2 캐시코어 수클럭연산 성능
Tegra K128 nm (TSMC HPM)Cortex-A15 r34 + 1? - 2.3 GHz단정밀도 73.6 GFLOPS
배정밀도 18.4 GFLOPS
2 MB + 0.5 MBCUDA Kepler
Unified Shader 192 코어
950 MHz단정밀도 365 GFLOPS64bit 듀얼 채널 LPDDR3,LPDDR3-L 14.9 GB/sH.264, VP8 등 2160p 30fps3840x2160 (LCD)
4096x2160 (HDMI)
없음
Tegra K1Denver2? - 2.5 GHz단정밀도 40 GFLOPS
배정밀도 20 GFLOPS
2 MB
Tegra X120 nm (TSMC 20 SoC)Cortex-A57 + Cortex-A534 + 4Cortex-A57 1.9 GHz2 MB + 0.5 MBCUDA Maxwell 256 코어1024 MHz단정밀도 512 GFLOPS64bit LPDDR4, LPDDR3, DDR3 25.6 GB/sH.265, VP9 등 2160p 30fps4096x2160 60fps
Tegra X1+16 nm1267 MHz단정밀도 649 GFLOPS64bit LPDDR4X
Tegra X2 (Parker)16 nmDenver 2 + Cortex-A572 + 42.0 GHz + 2.0 GHz2 MB + 2 MBCUDA Pascal 256 코어1465 MHz단정밀도 750 GFLOPS128bit LPDDR4 58.4 GB/sH.265, VP9 등 2160p 60fps


👆
좌우로 밀어서 보기
Xavier / Orin
제조 공정아키텍처CPUGPU메모리비디오 인코딩화면 해상도모뎀
코어 수클럭연산 성능L2 캐시L3 캐시코어 수클럭연산 성능
Xavier12 nmNVIDIA Carmel Arm®v8.281.9GHz(Nano)
2.2 GHz(AGX)
6MB
4MBCUDA Volta 384코어 Tensor 48코어(Nano)
1.1 GHz(Nano)
단정밀도 1410 GFLOPS128bit LPDDR4X 59.7 GB/s
H.265,VP94K 60fps3840x2160 60fps
Orin8 nmCortex®-A78AE v8.2121.5GHz(Nano)
2.2 GHz(AGX)
1.5MB(Nano)
3MB(AGX)
4MB(Nano)
6MB(AGX)
CUDA Ampere 512코어 Tensor 16코어(Nano)
625 MHz(Nano)
단정밀도 0.64 – 5.32 TFLOPS128bit LPDDR5 102.4 GB/s
H.265,VP9,AV1 등 4K 60fps3840x2160 60fps


👆
좌우로 밀어서 보기
모델기기
T186엔비디아 드라이브 PX2 (변형),
ZF ProAI 1.1
T186엔비디아 젯슨 TX2
메르세데스-벤츠 MBUX (인포테인먼트 시스템)
1개의 유닛과 1개의 GPU 반도체는 2016년 10월부터 모든 테슬라(Tesla, Inc.) 차량의 "테슬라 비전" 기능에 대한 ECU의 일부
T186매직 리프 원(Magic Leap One) (혼합 환경 글래스)
스카이디오 2 (드론)


자비에르(Xavier) 테그라(Tegra) SoC는 프로페서 X의 이름을 따서 명명되었으며, 2016년 9월 28일에 발표되었고, 2019년 3월까지 출시되었다. 70억 개의 트랜지스터, 8개의 커스텀 ARMv8 코어, 512개의 CUDA 코어를 가진 볼타 GPU, DLA(Deep Learning Accelerator)라는 오픈 소스 TPU를 포함하고 있다. 칩은 8K 울트라 HD (7680×4320)를 인코딩하고 디코딩할 수 있다. 10 W, 15 W, 30 W TDP에서 작동 모드를 구성할 수 있으며, 다이 크기는 350 mm2이다. 2018년 CES에서 제조 공정이 12 nm FinFET임을 확인했다.

* CPU: 엔비디아 커스텀 카멜(Carmel) ARMv8.2-A (64비트), 8코어 10-와이드 수퍼스칼라
* GPU: 볼타 기반, 1.4 TFLOPS의 512 CUDA 코어; 유형: GV11B
* TSMC 12 nm, FinFET 공정
* 20 TOPS DL 및 160 SPECint @ 20 W; 30 TOPS DL @ 30 W (TOPS DL = Deep Learning Tera-Ops)
GPU 기반 텐서 코어를 통해 20 TOPS DL
DLA 유닛을 통해 10 TOPS DL (INT8), 5 TFLOPS (FP16) 달성
* PVA 유닛(Programmable Vision Accelerator, 스테레오 불일치/광학 흐름/이미지 처리를 위한)에서 1.6 TOPS
* ISP 유닛(이미지 신호 프로세서, 네이티브 풀 레인지 HDR 및 타일 처리 지원)에서 1.5 GPix/s
* 8k 비디오 지원을 포함한 1.2 GPix/s 인코딩 및 1.8 GPix/s 디코딩을 위한 비디오 프로세서
* 16 레인의 MIPI-CSI-3
* 1 Gbit/s 이더넷
* 10 Gbit/s 이더넷

👆
좌우로 밀어서 보기
모듈SoC 변형CPUGPU딥 러닝메모리채택TDP (W)
프로세서코어주파수마이크로-
아키텍처
코어
구성1
주파수TFLOPS
(FP32)
TFLOPS
(FP16)
TOPS유형용량버스
대역-
사용 가능성
AGX 자비에르(Xavier) 64 GB카멜(Carmel) 12 MB 캐시8최대 2.2볼타512:64 (8, 4, 1)최대 13771.412.82최대 32LPDDR4X64 GB256-비트136.5 GB/s10-30
AGX 자비에르(Xavier) 32 GB카멜(Carmel) 12 MB 캐시8최대 2.2볼타512:64 (8, 4, 1)최대 13771.412.82최대 32LPDDR4X32 GB256-비트136.5 GB/s10-30
AGX 자비에르(Xavier) 산업용카멜(Carmel) 12 MB 캐시8최대 2볼타512:64 (8, 4, 1)최대 12211.242.48최대 30LPDDR4X32 GB256-비트136.5 GB/s20-40
자비에르(Xavier) NX 16 GB카멜(Carmel) 10 MB 캐시6최대 1.9볼타384:48 (6, 3, 1)최대 11000.841.69최대 21LPDDR4X16 GB128-비트59.7 GB/s10-20
자비에르(Xavier) NX 8 GB카멜(Carmel) 10 MB 캐시6최대 1.9볼타384:48 (6, 3, 1)최대 11000.841.69최대 21LPDDR4X8 GB128-비트59.7 GB/s10-20

1 CUDA 코어 : 텐서 코어 (SM, TPC, GPC)

4.7. 테그라 K1 (로건)

테그라 K1은 2014년에 출시되었으며, 28nm 공정의 ARM v7 프로세서이다. ARM Cortex-A15(r3) 코어 4개를 탑재하고 있으며, 192코어 케플러 GPU를 사용하여 16/32비트에서 365GFLOPS의 연산 성능을 제공한다.

Direct3D 12, OpenGL ES 3.1, CUDA 6.5, OpenGL 4.4/4.5, Vulkan을 지원하며, 적응형 확장 텍스처 압축을 지원한다.

4.7.1. 모델

👆
좌우로 밀어서 보기
테그라 K1 주요 특징
구 분CPUGPU메모리비디오 인코딩화면 해상도
32비트Cortex-A15 r3, 4+1 코어, 최대 2.3 GHzCUDA Kepler 192 코어, 950 MHz, 단정밀도 365 GFLOPS64비트 듀얼 채널 LPDDR3, LPDDR3-L 14.9 GB/sH.264, VP8 등 2160p 30fps 지원3840x2160 (LCD), 4096x2160 (HDMI)
64비트Denver, 2 코어, 최대 2.5 GHzCUDA Kepler 192 코어, 950 MHz, 단정밀도 365 GFLOPS64비트 듀얼 채널 LPDDR3, LPDDR3-L 14.9 GB/sH.264, VP8 등 2160p 30fps 지원3840x2160 (LCD), 4096x2160 (HDMI)

4.8. 테그라 X1 (에리스타)

테그라 X1(코드명: 에리스타)은 4개의 ARM Cortex-A57 코어와 4개의 ARM Cortex-A53 코어를 가진 8코어 CPU 구조이다. GPU는 맥스웰 아키텍처 기반이며, 적응형 확장 텍스처 압축(ASTC)을 지원한다.

테그라 X1은 닌텐도 스위치 등 일부 기기에서 오류 주입(FI) 전압 글리칭 공격에 취약하여 임의 코드 실행 및 홈브루 소프트웨어 구현이 가능한 것으로 알려져 있다.

4.8.1. 모델

wikitext

👆
좌우로 밀어서 보기
Tegra K1 / Tegra X1 / Tegra X2
제조 공정아키텍처CPUGPU메모리비디오 인코딩화면 해상도모뎀
코어 수클럭연산 성능L2 캐시코어 수클럭연산 성능
Tegra K128nm (TSMC HPM)Cortex-A15 r34 + 1? - 2.3GHz단정밀도 73.6 GFLOPS
배정밀도 18.4 GFLOPS
2 MB + 0.5 MBCUDA Kepler
Unified Shader 192 코어
950MHz단정밀도 365 GFLOPS64bit 듀얼 채널 LPDDR3,LPDDR3-L 14.9 GB/sH.264, VP8 등 2160p 30fps3840x2160 (LCD)
4096x2160 (HDMI)
없음
Tegra K1Denver2? - 2.5GHz단정밀도 40 GFLOPS
배정밀도 20 GFLOPS
2 MB
Tegra X120nm (TSMC 20 SoC)Cortex-A57 + Cortex-A534 + 4Cortex-A57 1.9GHz2 MB + 0.5 MBCUDA Maxwell 256 코어1024MHz단정밀도 512 GFLOPS64bit LPDDR4, LPDDR3, DDR3 25.6 GB/sH.265, VP9 등 2160p 30fps4096x2160 60fps
Tegra X1+16nmCortex-A57 + Cortex-A534 + 4Cortex-A57 1.9GHz2 MB + 0.5 MBCUDA Maxwell 256 코어1267MHz단정밀도 649 GFLOPS64bit LPDDR4XH.265, VP9 등 2160p 30fps
Tegra X2 (Parker)16nmDenver 2 + Cortex-A572 + 42 + 22 MB + 2 MBCUDA Pascal 256 코어1465MHz단정밀도 750 GFLOPS128bit LPDDR4 58.4 GB/sH.265, VP9 등 2160p 60fps

4.9. 테그라 X2 (파커)

테그라 X2(파커)는 엔비디아가 개발한 모바일 시스템 온 칩(SoC)이다. 16nm 공정으로 제조되었으며, 덴버 2 듀얼 코어 CPU와 ARM Cortex-A57 쿼드 코어 CPU를 결합하여 총 6개의 CPU 코어를 갖추고 있다. 또한, 파스칼 아키텍처 기반의 256개 CUDA 코어를 가진 GPU를 탑재하여 뛰어난 그래픽 성능을 제공한다.

CPU는 2.0 GHz로 작동하는 덴버 2 코어 2개와 2.0 GHz로 작동하는 Cortex-A57 코어 4개로 구성된다. GPU는 1465 MHz로 작동하며, 단정밀도 연산 성능은 750 GFLOPS, 반정밀도 연산 성능은 1.5 TFLOPS이다. 128bit LPDDR4 메모리를 사용하며, 메모리 대역폭은 58.4 GB/s이다. 비디오 인코딩은 H.265, VP9 등 2160p 60fps를 지원하며, 화면 해상도는 4096x2160 60fps까지 지원한다.

4.9.1. 모델

👆
좌우로 밀어서 보기
Tegra K1 / Tegra X1 / Tegra X2
제조 공정아키텍처CPUGPU메모리비디오 인코딩화면 해상도모뎀
코어 수클럭연산 성능L2 캐시코어 수클럭연산 성능
Tegra K128nm (TSMC HPM)Cortex-A15 r34 + 1? - 2.3 GHz단정밀도 73.6 GFLOPS
배정밀도 18.4 GFLOPS
2 MB + 0.5 MBCUDA Kepler
Unified Shader 192 코어
950 MHz단정밀도 365 GFLOPS64bit 듀얼 채널 LPDDR3,LPDDR3-L 14.9 GB/sH.264, VP8 등 2160p 30fps3840x2160 (LCD)
4096x2160 (HDMI)
없음
Tegra K1Denver2? - 2.5 GHz단정밀도 40 GFLOPS
배정밀도 20 GFLOPS
2 MB
Tegra X120nm (TSMC 20 SoC)Cortex-A57 + Cortex-A534 + 4Cortex-A57 1.9 GHz2 MB + 0.5 MBCUDA Maxwell 256 코어1024 MHz단정밀도 512 GFLOPS64bit LPDDR4, LPDDR3, DDR3 25.6 GB/sH.265, VP9 등 2160p 30fps4096x2160 60fps
Tegra X1+16nm1267 MHz단정밀도 649 GFLOPS64bit LPDDR4X
Tegra X2 (Parker)16nmDenver 2 + Cortex-A572 + 42.0 GHz + 2.0 GHz2 MB + 2 MBCUDA Pascal 256 코어1465 MHz단정밀도 750 GFLOPS128bit LPDDR4 58.4 GB/sH.265, VP9 등 2160p 60fps

👆
좌우로 밀어서 보기
Xavier / Orin
제조 공정아키텍처CPUGPU메모리비디오 인코딩화면 해상도모뎀
코어 수클럭연산 성능L2 캐시L3 캐시코어 수클럭연산 성능
Xavier12nmNVIDIA Carmel Arm®v8.281.9GHz(Nano)
2.2 GHz(AGX)
6MB
4MBCUDA Volta 384코어 Tensor 48코어(Nano)
1.1 GHz(Nano)
단정밀도 1410 GFLOPS128bit LPDDR4X 59.7 GB/s
H.265,VP94K 60fps3840x2160 60fps
Orin8nmCortex®-A78AE v8.2121.5GHz(Nano)
2.2 GHz(AGX)
1.5MB(Nano)
3MB(AGX)
4MB(Nano)
6MB(AGX)
CUDA Ampere 512코어 Tensor 16코어(Nano)
625 MHz(Nano)
단정밀도 0.64 – 5.32 TFLOPS128bit LPDDR5 102.4 GB/s
H.265,VP9,AV1 등 4K 60fps3840x2160 60fps

4.10. 자비에 (Xavier)

자비에(Xavier) 테그라 SoC는 만화 캐릭터인 프로페서 X의 이름을 따서 명명되었으며, 2016년 9월 28일에 발표되었고, 2019년 3월까지 출시되었다.

이 칩은 70억 개의 트랜지스터, 8개의 커스텀 ARMv8 코어, 512개의 CUDA 코어를 가진 볼타 GPU, DLA(Deep Learning Accelerator)라는 오픈 소스 TPU를 포함하고 있다. 8K 울트라 HD (7680×4320)를 인코딩하고 디코딩할 수 있다. 사용자는 필요에 따라 10W, 15W, 30W TDP에서 작동 모드를 구성할 수 있으며, 다이 크기는 350 mm2이다. 엔비디아는 2018년 CES에서 제조 공정이 12 nm FinFET임을 확인했다.

* CPU: 엔비디아 커스텀 카멜(Carmel) ARMv8.2-A (64비트), 8코어 10-와이드 수퍼스칼라
* GPU: 볼타 기반, 1.4 TFLOPS의 512 CUDA 코어; 유형: GV11B
* TSMC 12 nm, FinFET 공정
* 20 TOPS DL 및 160 SPECint @ 20 W; 30 TOPS DL @ 30 W (TOPS DL = Deep Learning Tera-Ops)
* GPU 기반 텐서 코어를 통해 20 TOPS DL
* DLA 유닛을 통해 10 TOPS DL (INT8), 5 TFLOPS (FP16) 달성
* PVA 유닛(Programmable Vision Accelerator, 스테레오 불일치/광학 흐름/이미지 처리를 위한)에서 1.6 TOPS
* ISP 유닛(이미지 신호 프로세서, 네이티브 풀 레인지 HDR 및 타일 처리 지원)에서 1.5 GPix/s
* 8k 비디오 지원을 포함한 1.2 GPix/s 인코딩 및 1.8 GPix/s 디코딩을 위한 비디오 프로세서
* 16 레인의 MIPI-CSI-3
* 1 Gbit/s 이더넷
* 10 Gbit/s 이더넷

4.10.1. 모델

👆
좌우로 밀어서 보기
모듈
(모델)
SoC 변형CPUGPU딥 러닝메모리채택TDP (W)
프로세서코어주파수
(GHz)
마이크로-
아키텍처
코어
구성1
주파수
(MHz)
TFLOPS
(FP32)
TFLOPS
(FP16)
TOPS
(INT8)
유형용량버스
대역폭
(GB/s)
AGX 자비에르(Xavier) 64 GB카멜(Carmel) 12 MB 캐시8최대 2.2볼타512:64 (8, 4, 1)최대 13771.412.82최대 32LPDDR4X64 GB256-비트136.5
AGX 자비에르(Xavier) 32 GB카멜(Carmel) 12 MB 캐시8최대 2.2볼타512:64 (8, 4, 1)최대 13771.412.82최대 32LPDDR4X32 GB256-비트136.5
AGX 자비에르(Xavier) 산업용카멜(Carmel) 12 MB 캐시8최대 2볼타512:64 (8, 4, 1)최대 12211.242.48최대 30LPDDR4X32 GB256-비트136.5
자비에르(Xavier) NX 16 GB카멜(Carmel) 10 MB 캐시6최대 1.9볼타384:48 (6, 3, 1)최대 11000.841.69최대 21LPDDR4X16 GB128-비트59.7
자비에르(Xavier) NX 8 GB카멜(Carmel) 10 MB 캐시6최대 1.9볼타384:48 (6, 3, 1)최대 11000.841.69최대 21LPDDR4X8 GB128-비트59.7

4.11. 오린 (Orin)

엔비디아는 2018년 3월 27일에 코드명 오린(Orin)이라는 차세대 SoC를 발표했다. 이 칩은 170억 개의 트랜지스터를 탑재하고, 12개의 ARM 헤라클레스 코어를 사용하며, 65W에서 200 INT8 TOPS의 성능을 발휘한다.

오린은 Xavier의 6배에 달하는 처리 성능을 제공한다. 저전력 모델인 Nano, NX, 그리고 최대 70W 소비 전력을 가진 고성능 AGX 모델 등 총 3가지 시리즈로 9개 모델이 있다.

4.11.1. 모델

👆
좌우로 밀어서 보기
엔비디아 테그라 모델
모델명제조 공정CPU 아키텍처CPU 코어 수CPU 클럭 (GHz)CPU 연산 성능CPU L2 캐시CPU L3 캐시GPU 코어 수GPU 클럭 (MHz)GPU 연산 성능메모리비디오 인코딩화면 해상도모뎀
테그라 APX 2500, 2600ARM1110.6NEON 미지원LPDDR-333720p@30fps854x480 (LCD)
1280x1024 (CRT)
1280x720 (HDMI)
없음
테그라 600ARM1110.7NEON 미지원LPDDR-333720p@30fps1280x1024없음
테그라 650ARM1110.8NEON 미지원LPDDR-4001080p@24fps1680x1050없음
테그라 23040 nmCortex-A921.0VFPv3-D16
NEON 미지원
8단정밀도 5.6 GFLOPS싱글 채널 LPDDR2-6001080p1024x600 (LCD)
1280x1024 (CRT)
1920x1080 (HDMI)
없음
테그라 25040 nmCortex-A921.0VFPv3-D16
NEON 미지원
8단정밀도 5.6 GFLOPS싱글 채널 LPDDR2-600, 6671080p1680x1050 (LCD)
1600x1200 (CRT)1920x1080 (HDMI)
없음
테그라 340 nmCortex-A94 + 11.3 - 1.7VFPv3
NEON 지원
1 MB12단정밀도 12.4 GFLOPS32bit 싱글 채널 LPDDR3-L 1600, LPDDR2-10661440p2048x1536(LCD)
1920x1200(CRT)
1920x1080(HDMI)
없음
테그라 4i28 nmCortex-A9 R44 + 1? - 2.3VFPv4
NEON 지원
1 MB60단정밀도 79.2 GFLOPS32bit 싱글 채널 LPDDR3-21331440p1920x1200(LCD)
1920x1080(HDMI)
LTE Cat4
HSPA+
TD-HSPA
GSM / GPRS / EDGE
테그라 428 nmCortex-A15 r24 + 11.2 - 1.9VFPv4
NEON 지원
2 MB + 0.5 MB72단정밀도 96.76 GFLOPS32bit 듀얼 채널 LPDDR3-L, LPDDR3-18661440p3200x2000(LCD)
3840x2160(HDMI)
없음
테그라 K1 (32비트)28 nmCortex-A15 r34 + 1? - 2.32 MB + 0.5 MBCUDA Kepler
Unified Shader 192 코어
950단정밀도 365 GFLOPS64bit 듀얼 채널 LPDDR3,LPDDR3-L 14.9 GB/sH.264, VP8 등 2160p 30fps3840x2160 (LCD)
4096x2160 (HDMI)
없음
테그라 K1 (64비트)28 nmDenver2? - 2.52 MBCUDA Kepler
Unified Shader 192 코어
950단정밀도 365 GFLOPS64bit 듀얼 채널 LPDDR3,LPDDR3-L 14.9 GB/sH.264, VP8 등 2160p 30fps3840x2160 (LCD)
4096x2160 (HDMI)
없음
테그라 X120 nmCortex-A57 + Cortex-A534 + 41.92 MB + 0.5 MBCUDA Maxwell 256 코어1024단정밀도 512 GFLOPS64bit LPDDR4, LPDDR3, DDR3 25.6 GB/sH.265, VP9 등 2160p 30fps4096x2160 60fps없음
테그라 X1+16 nmCortex-A57 + Cortex-A534 + 41.92 MB + 0.5 MBCUDA Maxwell 256 코어1267단정밀도 649 GFLOPS64bit LPDDR4XH.265, VP9 등 2160p 30fps4096x2160 60fps
테그라 X2 (Parker)16 nmDenver 2 + Cortex-A572 + 42.0 + 2.02 MB + 2 MBCUDA Pascal 256 코어1465단정밀도 750 GFLOPS128bit LPDDR4 58.4 GB/sH.265, VP9 등 2160p 60fps4096x2160 60fps
Xavier12 nmNVIDIA Carmel Arm v8.281.9 (Nano)
2.2 (AGX)
6MB / 8MB4MBCUDA Volta 384코어 Tensor 48코어 (Nano)
Volta 512코어 Tensor 64코어 (AGX)
1100 (Nano)
1377 (AGX)
단정밀도 1410 GFLOPS128bit LPDDR4X 59.7 GB/s
256bit LPDDR4X 136.5GB/s
H.265,VP94K 60fps3840x2160 60fps
Orin8 nmCortex-A78AE v8.2121.5 (Nano)
2.2 (AGX)
1.5MB (Nano)
3MB (AGX)
4MB (Nano)
6MB (AGX)
CUDA Ampere 512코어 Tensor 16코어 (Nano)
Ampere 2048코어 Tensor 64코어 (AGX)
625 (Nano)
1300 (AGX)
단정밀도 0.64 – 5.32 TFLOPS128bit LPDDR5 102.4 GB/s
256bit LPDDR5 204.8 GB/s
H.265,VP9,AV1 등 4K 60fps3840x2160 60fps

4.12. 그레이스 (Grace)

그레이스 (Grace) CPU는 엔비디아가 개발한 ARM Neoverse CPU 플랫폼으로, 대규모 AI 및 HPC 애플리케이션을 대상으로 한다. 2022년 3월 22일에는 그레이스 CPU와 Hopper 기반 GPU를 결합한 자체적인 HPC 플랫폼인 Grace Hopper Superchip이 발표되었다.

엔비디아는 Grace CPU를 기반으로 한 여러 제품을 제공하는데, NVIDIA OVX 플랫폼은 Grace Superchip (한 보드에 두 개의 Grace 다이)과 데스크톱 NVIDIA GPU를 서버 폼 팩터로 결합한 형태이며, NVIDIA HGX 플랫폼은 Grace Superchip 또는 Grace Hopper Superchip을 사용한다.

단일 Grace CPU는 T241로도 알려져 있으며, GPU를 포함하지 않음에도 불구하고 Tegra SoC 브랜딩에 속한다.

👆
좌우로 밀어서 보기
모델
번호
CPU메모리채택
프로세서코어주파수캐시TFLOPS
(FP64)
유형용량버스
대역폭출시일
T241Grace72개 ARM Neoverse V2 코어 (ARMv9)?L1: 코어당 64 KB I-캐시 + 64 KB D-캐시3.551LPDDR5X ECC최대 480 GB1?500 GB/s2023년 하반기

1전체 Grace Superchip 사양에서 절반으로 줄어든 수치

4.12.1. 모델

👆
좌우로 밀어서 보기
테그라 모델별 특징
모델제조 공정CPU 아키텍처CPU 코어 수CPU 클럭CPU 연산 성능GPU메모리비디오 인코딩화면 해상도모뎀
테그라 APX 2500, 2600ARM1110.6 GHzNEON 미지원LPDDR-333720p@30fps854x480 (LCD)없음
테그라 600ARM1110.7 GHzNEON 미지원LPDDR-333720p@30fps1280x1024없음
테그라 650ARM1110.8 GHzNEON 미지원LPDDR-4001080p@24fps1680x1050없음
테그라 23040 nmCortex-A921.0 GHzVFPv3-D16, NEON 미지원8 (버텍스 셰이더: 4 픽셀 셰이더: 4)싱글 채널 LPDDR2-6001080p1024x600 (LCD)없음
테그라 25040 nmCortex-A921.0 GHzVFPv3-D16, NEON 미지원8 (버텍스 셰이더: 4 픽셀 셰이더: 4)싱글 채널 LPDDR2-600, 6671080p1680x1050 (LCD)없음
테그라 340 nmCortex-A94 + 11.3 - 1.7 GHzVFPv3, NEON 지원12 (버텍스 셰이더: 4 픽셀 셰이더: 8)32bit 싱글 채널 LPDDR3-L 1600, LPDDR2-10661440p2048x1536(LCD)없음
테그라 4i28 nmCortex-A9 R44 + 1? - 2.3 GHzVFPv4, NEON 지원60 (버텍스 셰이더: 20 픽셀 셰이더: 40)32bit 싱글 채널 LPDDR3-21331440p1920x1200(LCD)LTE Cat4
테그라 428 nmCortex-A15 r24 + 11.2 - 1.9 GHzVFPv4, NEON 지원72 (버텍스 셰이더: 24 픽셀 셰이더: 48)32bit 듀얼 채널 LPDDR3-L, LPDDR3-18661440p3200x2000(LCD)없음
테그라 K1 (32비트)28 nmCortex-A15 r34 + 1? - 2.3 GHzCUDA Kepler64bit 듀얼 채널 LPDDR3,LPDDR3-L 14.9 GB/sH.264, VP8 등 2160p 30fps3840x2160 (LCD)없음
테그라 K1 (64비트)28 nmDenver2? - 2.5 GHzCUDA Kepler64bit 듀얼 채널 LPDDR3,LPDDR3-L 14.9 GB/sH.264, VP8 등 2160p 30fps3840x2160 (LCD)없음
테그라 X120 nmCortex-A57 + Cortex-A534 + 4Cortex-A57 1.9 GHzCUDA Maxwell 256 코어64bit LPDDR4, LPDDR3, DDR3 25.6 GB/sH.265, VP9 등 2160p 30fps4096x2160 60fps없음
테그라 X1+16 nmCortex-A57 + Cortex-A534 + 4Cortex-A57 1.9 GHzCUDA Maxwell 256 코어64bit LPDDR4XH.265, VP9 등 2160p 30fps4096x2160 60fps없음
테그라 X2 (Parker)16 nmDenver 2 + Cortex-A572 + 42.0 GHz + 2.0 GHzCUDA Pascal 256 코어128bit LPDDR4 58.4 GB/sH.265, VP9 등 2160p 60fps4096x2160 60fps없음
Xavier12 nmNVIDIA Carmel Arm v8.281.9GHz(Nano)CUDA Volta 384코어 Tensor 48코어(Nano)128bit LPDDR4X 59.7 GB/sH.265,VP94K 60fps3840x2160 60fps
Orin8 nmCortex-A78AE v8.2121.5GHz(Nano)CUDA Ampere 512코어 Tensor 16코어(Nano)128bit LPDDR5 102.4 GB/sH.265,VP9,AV1 등 4K 60fps3840x2160 60fps

4.13. 아틀란 (Atlan)

Atlan영어은 2021년 4월 12일에 발표되었으나, 2022년 9월 20일에 개발 중단이 발표되었다.

이 칩은 그레이스 넥스트(Grace Next) CPU, 에이다 러브레이스(Ada Lovelace) GPU, 블루필드(Bluefield) DPU, 기타 가속기, 보안 엔진, 기능 안전 섬, 온칩 메모리, 외부 메모리 인터페이스, 고속 I/O 인터페이스를 포함할 예정이었다.

4.14. 토르 (Thor)

엔비디아 토르(Thor)는 2022년 9월 20일에 발표되었으며, 취소된 아틀란(Atlan)을 대체한다. CPU는 Arm Neoverse V3AE, GPU는 블랙웰을 사용한다.

4.14.1. 모델

엔비디아 테그라의 모델별 주요 특징은 다음과 같다.

👆
좌우로 밀어서 보기
Tegra 250
제조 공정아키텍처CPUGPU메모리비디오 인코딩화면 해상도모뎀
코어 수클럭코어 수연산 성능
Tegra APX 2500, 2600ARM1110.6 GHzNEON 미지원LPDDR-333720p@30fps854x480 (LCD)
1280x1024 (CRT)
1280x720 (HDMI)
없음
Tegra 6000.7 GHz1280x1024
Tegra 6500.8 GHzLPDDR-4001080p@24fps1680x1050
Tegra 23040 nmCortex-A921.0 GHzVFPv3-D16
NEON 미지원
8단정밀도 5.6 GFLOPS (333 MHz)싱글 채널 LPDDR2-6001080p1024x600 (LCD)
1280x1024 (CRT)
1920x1080 (HDMI)
Tegra 250싱글 채널 LPDDR2-600, 6671680x1050 (LCD)
1600x1200 (CRT)1920x1080 (HDMI)


👆
좌우로 밀어서 보기
Tegra 3 / Tegra 4
제조 공정아키텍처CPUGPU메모리비디오 인코딩화면 해상도모뎀
코어 수클럭연산 성능L2 캐시코어 수연산 성능
Tegra 340 nmCortex-A94 + 11.3 - 1.7 GHzVFPv3
NEON 지원
단정밀도 27.2 GFLOPS
배정밀도 10.2 GFLOPS
1 MB12단정밀도 12.4 GFLOPS (520MHz)32bit 싱글 채널 LPDDR3-L 1600, LPDDR2-10661440p2048x1536(LCD)
1920x1200(CRT)
1920x1080(HDMI)
없음
Tegra 4i28 nmCortex-A9 R4? - 2.3 GHzVFPv4
NEON 지원
단정밀도 36.8 GFLOPS
배정밀도 13.8 GFLOPS
60단정밀도 79.2 GFLOPS (660MHz)32bit 싱글 채널 LPDDR3-21331920x1200(LCD)
1920x1080(HDMI)
LTE Cat4
HSPA+
TD-HSPA
GSM / GPRS / EDGE
Tegra 4Cortex-A15 r21.2 - 1.9 GHz단정밀도 60.8 GFLOPS
배정밀도 15.2 GFLOPS
2 MB + 0.5 MB72단정밀도 96.76 GFLOPS
(672MHz)
32bit 듀얼 채널 LPDDR3-L, LPDDR3-18663200x2000(LCD)
3840x2160(HDMI)
없음


👆
좌우로 밀어서 보기
Tegra K1 / Tegra X1 / Tegra X2
제조 공정아키텍처CPUGPU메모리비디오 인코딩화면 해상도모뎀
코어 수클럭연산 성능L2 캐시코어 수클럭연산 성능
Tegra K1
(32비트)
28 nmCortex-A15 r34 + 1? - 2.3 GHz단정밀도 73.6 GFLOPS
배정밀도 18.4 GFLOPS
2 MB + 0.5 MBCUDA Kepler
Unified Shader 192 코어
950MHz단정밀도 365 GFLOPS64bit 듀얼 채널 LPDDR3,LPDDR3-L 14.9GB/sH.264, VP8 등 2160p 30fps3840x2160 (LCD)
4096x2160 (HDMI)
없음
Tegra K1
(64비트)
Denver2? - 2.5 GHz단정밀도 40 GFLOPS
배정밀도 20 GFLOPS
2 MB
Tegra X120 nmCortex-A57 + Cortex-A534 + 4Cortex-A57 1.9 GHz2 MB + 0.5 MBCUDA Maxwell 256 코어1024MHz단정밀도 512 GFLOPS64bit LPDDR4, LPDDR3, DDR3 25.6GB/sH.265, VP9 등 2160p 30fps4096x2160 60fps
Tegra X1+16 nm1267MHz단정밀도 649 GFLOPS64bit LPDDR4X
Tegra X2 (Parker)16 nmDenver 2 + Cortex-A572 + 42.0 GHz + 2.0 GHz2 MB + 2 MBCUDA Pascal 256 코어1465MHz단정밀도 750 GFLOPS128bit LPDDR4 58.4GB/sH.265, VP9 등 2160p 60fps


👆
좌우로 밀어서 보기
Xavier / Orin
제조 공정아키텍처CPUGPU메모리비디오 인코딩화면 해상도모뎀
코어 수클럭연산 성능L2 캐시L3 캐시코어 수클럭연산 성능
Xavier12 nmNVIDIA Carmel Arm®v8.281.9GHz(Nano)
2.2 GHz(AGX)
6MB4MBCUDA Volta 384코어 Tensor 48코어(Nano)
1. 1 GHz(Nano)
단정밀도 1410 GFLOPS128bit LPDDR4X 59.7GB/s
H.265,VP94K 60fps3840x2160 60fps
Orin8 nmCortex®-A78AE v8.2121.5GHz(Nano)
2.2 GHz(AGX)
1.5MB(Nano)
3MB(AGX)
4MB(Nano)
6MB(AGX)
CUDA Ampere 512코어 Tensor 16코어(Nano)
625MHz(Nano)
단정밀도 0.64 – 5.32 TFLOPS128bit LPDDR5 102.4GB/s
H.265,VP9,AV1 등 4K 60fps3840x2160 60fps

5. 경쟁 제품

엔비디아 테그라(Tegra)와 경쟁하는 제품들은 다음과 같다:

👆
좌우로 밀어서 보기
제조사제품
올위너A-시리즈
애플애플 실리콘
인텔아톰
삼성전자엑시노스
프리스케일 반도체i.MX
AMD재규어, 푸마
하이실리콘K3Vx/Kirin
미디어텍MTxxxx
ST-에릭슨노바소어
캐비엄OCTEON
텍사스 인스트루먼트OMAP / 시타라 ARM 프로세서
퀄컴퀄컴 스냅드래곤
르네사스R-Car
락칩RK3xxx
브로드컴비디오코어


모바일 SoC 시장에서 엔비디아 테그라의 주요 경쟁 제품은 퀄컴스냅드래곤TI의 OMAP 등이 있다.