맨위로가기

넷버스트

"오늘의AI위키"는 AI 기술로 일관성 있고 체계적인 최신 지식을 제공하는 혁신 플랫폼입니다.
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.

1. 개요

넷버스트는 인텔이 개발한 마이크로아키텍처로, 하이퍼 스레딩, 하이퍼 파이프라인 기술, 고속 실행 엔진, 실행 추적 캐시, 재생 시스템 등의 기술적 특징을 갖추고 있다. 넷버스트는 파이프라인 단계를 늘려 클럭 속도를 높이는 전략을 사용했지만, 긴 파이프라인으로 인해 클럭당 명령어 처리 성능(IPC)이 낮아지고, 발열 및 소비 전력 문제가 발생하여 성능 향상에 어려움을 겪었다. 넷버스트 기반 칩으로는 펜티엄 4, 펜티엄 D, 제온 등이 있으며, 인텔은 넷버스트의 후속 제품 개발을 중단하고 코어 마이크로아키텍처로 대체했다.

더 읽어볼만한 페이지

  • 인텔 마이크로아키텍처 - 그레이스몬트 (마이크로아키텍처)
    그레이스몬트는 인텔 7 제조 공정을 기반으로 하여 향상된 명령어 처리 능력, 확장된 캐시 메모리, 개선된 분기 예측 기능 등을 제공하는 4세대 저전력 아톰 마이크로아키텍처이며, 앨더 레이크와 랩터 레이크 하이브리드 프로세서의 효율 코어 및 앨더 레이크-N 라인업의 코어 클러스터로 사용된다.
  • 인텔 마이크로아키텍처 - 인텔 Xe
    인텔 Xe는 저전력부터 고성능 컴퓨팅까지 다양한 시장을 목표로 하는 인텔의 GPU 아키텍처 제품군으로, Xe-LP, Xe-HPG, Xe-HP, Xe-HPC 등의 하위 아키텍처를 가지며 외장 그래픽 카드인 인텔 아크 시리즈와 내장 그래픽, 데이터 센터용 GPU 등에 활용된다.
  • 인텔의 마이크로프로세서 - 인텔 80386
    인텔 80386은 1985년 출시된 x86 아키텍처의 32비트 마이크로프로세서로, 온칩 메모리 관리 장치, 3단계 파이프라인, 세 가지 동작 모드를 제공하며, 개인용 컴퓨터와 임베디드 시스템에 널리 사용되었지만 현재는 생산 및 지원이 중단되었고, 32비트 명령어 집합은 현대 x86 아키텍처의 기반이 되었다.
  • 인텔의 마이크로프로세서 - 인텔 4004
    인텔 4004는 1971년 인텔에서 출시된 세계 최초의 상용 마이크로프로세서 중 하나이며, 4비트 아키텍처를 기반으로 계산기 라인에 탑재하기 위해 개발되었고, 컴퓨터 소형화와 개인용 컴퓨터 시대에 기여했다.
  • 인텔 x86 마이크로프로세서 - 인텔 80386
    인텔 80386은 1985년 출시된 x86 아키텍처의 32비트 마이크로프로세서로, 온칩 메모리 관리 장치, 3단계 파이프라인, 세 가지 동작 모드를 제공하며, 개인용 컴퓨터와 임베디드 시스템에 널리 사용되었지만 현재는 생산 및 지원이 중단되었고, 32비트 명령어 집합은 현대 x86 아키텍처의 기반이 되었다.
  • 인텔 x86 마이크로프로세서 - 인텔 4004
    인텔 4004는 1971년 인텔에서 출시된 세계 최초의 상용 마이크로프로세서 중 하나이며, 4비트 아키텍처를 기반으로 계산기 라인에 탑재하기 위해 개발되었고, 컴퓨터 소형화와 개인용 컴퓨터 시대에 기여했다.
넷버스트 - [IT 관련 정보]에 관한 문서
일반 정보
모델 정보
모델셀러론
모델1셀러론 D
모델2펜티엄 4
모델3펜티엄 D
모델4제온
코어 정보
코어 수1-2 (하이퍼스레딩으로 2-4 스레드)
L1 캐시코어당 8 KB ~ 16 KB
L2 캐시128 KB ~ 4096 KB
L3 캐시4 MB ~ 16 MB (공유)
FSB 정보
FSB 최소 속도100 MT/s
FSB 최대 속도1066 MT/s
제조 공정
최소 공정65 nm
최대 공정180 nm
트랜지스터 정보
트랜지스터 (180nm)4200만개 (B2, C1, D0, E0)
트랜지스터 (130nm)5500만개 (B0, C1, D1, M0)
트랜지스터 (90nm)1억 2500만개 (C0, D0, E0, G1)
트랜지스터 (90nm)1억 6900만개 (M0, N0, R0)
트랜지스터 (90nm)2억 3000만개 (A0, B0)
트랜지스터 (65nm)1억 8800만개 (B1, C1, D0)
트랜지스터 (65nm)3억 7600만개 (B1, C1, D0)
트랜지스터 (65nm)3억 2800만개 (B0)
클럭 속도
클럭 속도 범위1.3 GHz ~ 3.8 GHz
소켓 정보
이전 아키텍처

2. 기술적 특징

펜티엄 4 HT 익스트림 에디션, 제온31시더 밀(65 nm)셀러론 D, 펜티엄 4 HT31스미스필드(90 nm)펜티엄 D, 제온31프레슬러(65 nm)펜티엄 D, 제온31



인텔은 2002년 1월에 ''윌라메트'' 코어를 대체하는 ''노스우드'' 코어를 출시했다. ''노스우드''는 더 커진 캐시 크기, 130nm 제조 공정, 그리고 하이퍼 스레딩을 통해 성능을 향상시켰다. 2004년 2월에는 ''프레스콧'' 코어가 출시되었는데, 이는 90nm 공정, 더 커진 캐시, 31단계의 명령어 파이프라인, 개선된 분기 예측기, SSE3 명령어, 그리고 x86-64 명령어 지원 등을 특징으로 한다. 그러나 ''프레스콧''은 전력 소비와 발열 문제가 심각하여, 인텔 싱글 코어 프로세서 중 가장 뜨겁고 전력 소모가 많은 프로세서가 되었다.

인텔은 넷버스트 마이크로아키텍처 기반의 듀얼 코어 프로세서인 펜티엄 D도 출시했다. 최초의 펜티엄 D 코어는 ''스미스필드''였으며, 이후 ''프레슬러''로 발전했다.

2. 1. 하이퍼 파이프라인 기술

넷버스트 마이크로아키텍처는 명령어 파이프라인 단계 수가 이전의 펜티엄 III보다 크게 증가했다. 펜티엄 III는 파이프라인이 10단계였지만, 넷버스트의 윌라멧(Willamette)과 노스우드(Northwood) 코어는 20단계, 프레스콧(Prescott) 코어는 31단계에 달했다.[3]

파이프라인 단계 수가 증가하면 동작 클럭 주파수를 높이기 쉽지만, 조건 분기 명령 예측이 실패하면 파이프라인이 멈춰 CPU 동작 밀도가 낮아지는 단점이 있다. 이 때문에 넷버스트 마이크로아키텍처는 클럭당 처리 성능이 P6 마이크로아키텍처나 AMD-K7 등 기존 아키텍처보다 낮았다.[3] 인텔은 이 문제를 해결하기 위해 래피드 실행 엔진(Rapid Execution Engine)을 개발하고, 분기 예측 실패를 펜티엄 III에 비해 33% 줄였다고 주장하는 분기 예측 기술에 많은 투자를 했다.[3]

하지만 실제로는 긴 파이프라인으로 인해 클럭당 명령어 수(IPC)가 낮아져 효율성이 떨어졌다. 이는 예상보다 큰 전력 소비와 발열 증가로 인해 성능을 상쇄할 만큼 충분히 높은 클럭 속도에 도달하지 못했기 때문이다.[3]

그러나 기존의 조건 분기를 많이 사용하는 프로그램은 큰 성능 향상이 필요하지 않았고, 대신 "스트리밍 SIMD 확장 명령어2 (SSE2)" 등 새롭게 구현된 명령어를 사용함으로써 동작 클럭에 비례하여 처리 능력이 향상되는 애플리케이션이 주류가 될 것이라는 예상이 있었다. 또한, ALU 중 2개는 클럭 주파수의 2배로 동작하는 등 연산 능력을 강화했다.

2. 2. 고속 실행 엔진

넷버스트 마이크로아키텍처의 고속 실행 엔진은 CPU 코어의 두 산술 논리 장치(ALU)를 더블 펌핑하여 실제 코어 클럭 주파수의 두 배로 작동시키는 기술이다. 예를 들어 3.8GHz 프로세서에서 ALU는 효과적으로 7.6GHz로 작동한다. 이 방식은 IPC(Instruction Per Cycle, 사이클당 명령어 수)가 낮은 것을 보완하고 CPU의 정수 성능을 향상시킨다. 인텔은 고속 배럴 시프터를 CPU 코어와 동일한 주파수로 작동하는 시프트/회전 실행 유닛으로 대체했지만, 이로 인해 특정 명령어의 속도가 이전보다 느려지는 단점이 발생했다.[1]

2. 3. 실행 추적 캐시

인텔은 CPU의 L1 캐시 내에 실행 트레이스 캐시를 통합했다. 이 캐시는 디코딩된 마이크로 오퍼레이션을 저장하여, 새로운 명령을 실행할 때 CPU가 명령을 다시 가져와 디코딩하는 대신 트레이스 캐시에서 디코딩된 마이크로 오퍼레이션에 직접 접근하여 상당한 시간을 절약한다. 더욱이, 마이크로 오퍼레이션은 예측된 실행 경로로 캐싱되므로 CPU가 캐시에서 명령을 가져올 때 이미 올바른 실행 순서로 존재한다.[4] 인텔은 이후 샌디 브릿지와 함께 마이크로 오퍼레이션 캐시 (UOP 캐시)라고 하는 유사하지만 더 간단한 개념을 도입했다.

넷버스트 마이크로아키텍처에서 명령어는 명령어 해석(디코딩)되어 더 세세한 조작의 집합인 μOPs로 변환된 상태로 L1 캐시에 저장된다. 이 명령어를 저장하는 L1 캐시를 트레이스 캐시라고 부른다. 디코더는 넷버스트 마이크로아키텍처의 유연성과 확장성의 핵심이며 마이크로 코드로 기능 변경 및 확장이 가능하다. 이 디코더는 동시에 1 명령어까지의 x86명령어를 μOPs로 변환할 수 있지만, P6 마이크로아키텍처가 동시에 3 명령어까지 변환이 가능했던 것과 비교하면 떨어진다. 그러나 명령어 실행 시에 트레이스 캐시에 목적의 명령어가 저장되어 있으면 명령어 실행 시간의 약 1/3을 차지하는 디코딩을 생략할 수 있게 된다.

2. 4. 쿼드 펌프 프론트 사이드 버스 (FSB)

프런트 사이드 버스(FSB)는 노스우드(Northwood)와 윌라메트(Willamette) 코어에서 클럭 사이클당 4비트를 전송하며 100 MHz로 작동하여 400 MHz의 유효 속도를 가진다. 노스우드 코어의 후기 개정판과 펜티엄 D 및 파생 제품은 800 MHz 프런트 사이드 버스(200 MHz 쿼드 펌프)를 갖는다.

2. 5. 하이퍼스레딩

펜티엄 4 HT 익스트림 에디션, 제온31시더 밀(65 nm)셀러론 D, 펜티엄 4 HT31스미스필드(90 nm)펜티엄 D, 제온31프레슬러(65 nm)펜티엄 D, 제온31




2. 6. 리플레이 시스템

리플레이 시스템은 인텔 펜티엄 4 프로세서의 하위 시스템으로, 프로세서 스케줄러에 의해 잘못 실행되도록 전송된 연산을 포착한다. 리플레이 시스템에 의해 포착된 연산은 올바른 실행에 필요한 조건이 충족될 때까지 루프에서 다시 실행된다.[1]

2. 7. 분기 예측 힌트

인텔 넷버스트 아키텍처는 코드에 분기 예측 힌트를 삽입하여 정적 예측 수행 여부를 알릴 수 있게 하였으나, 이 기능은 이후 인텔 프로세서에서 폐기되었다.[5][6] 인텔에 따르면, 넷버스트의 분기 예측 알고리즘은 P6 아키텍처의 알고리즘보다 33% 더 뛰어나다.

3. 문제점 및 한계

넷버스트 마이크로아키텍처는 높은 클럭 속도를 목표로 설계되었지만, 몇 가지 문제점과 한계에 직면했다.

넷버스트는 펜티엄 4에 채택되면서, 극단적으로 작은 L1 캐시, 비교적 큰 L2 캐시, 대역폭이 넓은 FSB 등 기존 프로세서와 다른 특징을 가졌다. L1 캐시는 명령어 해석(디코딩)되어 μOPs로 변환된 상태로 저장되었고, 이를 트레이스 캐시라고 불렀다. 디코더는 넷버스트의 유연성과 확장성의 핵심으로, HTT, SSE3, Intel 64, Intel VT 등을 추가하는데 활용되었다.

일반 소비자들은 동작 클럭이 CPU 성능을 나타낸다고 오해했지만, "고클럭 = 고성능"이라고 단정할 수는 없었다. 높은 클럭은 발열과 소비 전력을 증가시켜 불만을 야기했고, 기존 P6 아키텍처용으로 컴파일된 애플리케이션 실행 시 성능이 떨어지는 문제가 발생했다.

3. 1. 낮은 클럭당 명령어 처리 성능(IPC)

2000년 인텔은 펜티엄 4에서 넷버스트 마이크로아키텍처를 채택하면서, 명령어 파이프라인 단계 수를 크게 늘렸다. 펜티엄 III가 10단계였던 것에 비해, 펜티엄 4는 20단계(Prescott에서는 31단계)였다. 파이프라인 단계 수 증가는 동작 클럭 주파수를 높이기 쉽지만, 조건 분기 명령 예측이 실패하면 파이프라인이 멈춰 CPU 동작 밀도가 낮아지는 단점이 있다. 따라서 넷버스트 마이크로아키텍처는 클럭당 명령어 처리 성능(IPC)이 P6 마이크로아키텍처나 AMD-K7 등 기존 아키텍처보다 낮다.

그러나 인텔은 조건 분기를 많이 쓰는 기존 프로그램보다 SSE2 등 새 명령어를 활용해 동작 클럭에 비례하여 처리 능력이 향상되는 애플리케이션이 주류가 될 것으로 예상했다. 또한, ALU 중 2개는 클럭 주파수의 2배로 동작하는 등 연산 능력을 강화했다.

넷버스트 아키텍처는 P6 아키텍처보다 IPC가 낮기 때문에, P6 아키텍처용으로 만들어진 프로그램을 실행했을 때 동일 클럭의 P6 프로세서보다 성능이 떨어졌다. 하지만 넷버스트 아키텍처용으로 컴파일된 애플리케이션은 P6 아키텍처용보다 더 빠르게 처리할 수 있었다(특히 SSE 명령어를 많이 사용하는 경우).

3. 2. 발열 및 소비 전력 문제

넷버스트 마이크로아키텍처는 성능 향상을 목표로 설계되었지만, 엔지니어들은 성능을 확장하는 과정에서 여러 문제에 직면했다. 인텔은 당초 10 GHz의 클럭 속도를 목표로 했으나,[7] 클럭 속도가 증가함에 따라 전력 소모를 허용 가능한 수준으로 유지하는 것이 점점 더 어려워졌다. 2004년 11월, 인텔은 3.8 GHz의 속도 장벽에 도달했지만, 이마저도 달성하기 어려웠다. 결국 인텔은 2006년에 넷버스트를 포기하고, 펜티엄 프로의 P6 코어에서 영감을 얻은 코어 마이크로아키텍처를 개발했다. 이 아키텍처는 튜알라틴 펜티엄 III-S와 펜티엄 M을 기반으로 했다.

일반적으로 발열 및 소비 전력은 동작 클럭에 비례하여 증가한다. 2000년대 초반까지는 제조 공정을 미세화하여 동작 전압을 낮추고 발열 및 소비 전력을 억제할 수 있었다. 그러나 미세화가 고도화되면서 '''누설 전류'''라는 문제가 발생했다.

누설 전류는 모든 반도체에서 발생하며, 회로 동작에 악영향을 미치는 요소로 제거 대상이다. 특히, 집적도가 매우 높은 마이크로프로세서에서는 누설 전류가 실제 동작에 의한 소비 전력과 큰 차이가 없을 정도로 증가하여 문제가 되었다. 인텔은 이 문제로 인해 큰 어려움을 겪었다.

130nm 공정에서는 누설 전류 증가보다 전압 감소에 의한 절전 효과가 더 컸지만, 90nm 공정에서는 누설 전류가 급격히 증가했다. 동작 클럭을 높여 성능 향상을 꾀한 펜티엄 4에서는 이 문제가 두드러지게 나타났다. AMD애슬론 64에서도 비슷한 문제가 발생했지만, 애슬론 64는 클럭당 처리 능력을 높이는 방식을 따랐고, SOI 기술을 채용하여 영향을 크게 억제했다. 펜티엄 4에도 누설 전류 억제 기술이 채용되었지만, 인텔은 변형 실리콘 기술에 머물렀다. 그 결과, 소비 전력이 펜티엄 4의 단점으로 부각되었다.

넷버스트 마이크로아키텍처는 파이프라인 단계를 늘려 분기 예측 실패 시의 페널티가 증가하여 클럭 주파수당 성능이 저하되더라도, 클럭 주파수 향상을 통해 전체 성능을 향상시킨다는 이론[11]에 기반했다. 이는 반도체 공정 미세화에 따라 동작 주파수는 향상되고 소비 전력은 감소한다는 스케일링 법칙이 계속 성립한다는 전제하에 설계된 것이다.

3. 3. 개발 중단

넷버스트 마이크로아키텍처는 엔지니어들이 성능을 확장하는 과정에서 어려움을 겪게 했다. 인텔은 이 마이크로아키텍처를 통해 10 GHz의 클럭 속도를 달성할 계획이었지만,[7] 클럭 속도가 증가하면서 전력 소모를 허용 가능한 한계 내로 유지하는 데 점점 더 많은 문제에 직면했다. 2004년 11월, 인텔은 3.8 GHz의 속도 장벽에 도달했지만, 그마저도 달성하는 데 어려움을 겪었다. 결국, 인텔은 열 문제로 인해 더 이상 감당할 수 없게 되자 2006년에 넷버스트를 포기하고, 펜티엄 프로의 P6 코어에서 영감을 얻어 튜알라틴 펜티엄 III-S, 그리고 가장 직접적으로는 펜티엄 M을 기반으로 한 코어 마이크로아키텍처를 개발했다.[8][9]

2008년 8월 8일은 인텔 넷버스트 기반 프로세서의 종말을 알렸다.[10] 넷버스트가 포기된 이유는 높은 클럭 속도로 인한 심각한 발열 문제였다. 일부 코어 및 네할렘 기반 프로세서가 더 높은 TDP를 가지지만, 대부분의 프로세서는 멀티 코어이므로 각 코어가 최대 TDP의 일부만 방출하며, 가장 높은 클럭의 코어 기반 싱글 코어 프로세서는 최대 27W의 열을 방출한다. 가장 빠른 클럭의 데스크탑 펜티엄 4 프로세서(싱글 코어)는 115W의 TDP를 가졌고, 가장 빠른 클럭의 모바일 버전은 88W였다.

결과적으로 10GHz에 도달할 예정이었던 동작 클럭 향상에 따른 성능 향상은 단념할 수밖에 없었고, 4GHz 제품은 예고만으로 끝났다. 또한, 모바일 용도에서는 절대 성능이 높지 않아, 당초 펜티엄 4보다 격하된 위치에 있던 펜티엄 M을 펜티엄 4보다 상위 제품으로 판매하게 되었다.

CPU의 성능 향상은 클럭 수 향상에서 처리 효율 개선 및 듀얼 멀티코어화로 큰 전환점을 맞이하게 되었다. 따라서 인텔은 Core 마이크로 아키텍처인 Core 시리즈 개발로 전환하여 "넷버스트 마이크로 아키텍처"의 개발은 2007년에 사실상 종료되었다.

4. 넷버스트 기반 칩

5. 후속 제품 및 로드맵

인텔은 40~50개의 파이프라인 단계를 가진 테자스(Tejas)와 제이호크(Jayhawk)라는 넷버스트 기반 후속 제품을 개발했지만, 2006년 7월에 출시된 코어 마이크로아키텍처로 넷버스트를 대체하기로 결정했다.[8][9] 이 후속 제품들은 펜티엄 프로(P6 마이크로아키텍처)에서 직접 파생되었다. 2008년 8월 8일은 인텔 넷버스트 기반 프로세서의 종말을 알렸다.[10]

넷버스트가 포기된 이유는 높은 클럭 속도로 인한 심각한 발열 문제 때문이었다. 일부 코어 및 네할렘 기반 프로세서가 더 높은 TDP를 가지지만, 대부분의 프로세서는 멀티 코어이므로 각 코어가 최대 TDP의 일부만 방출하며, 가장 높은 클럭의 코어 기반 싱글 코어 프로세서는 최대 27W의 열을 방출한다. 가장 빠른 클럭의 데스크탑 펜티엄 4 프로세서(싱글 코어)는 115W의 TDP를 가졌고, 가장 빠른 클럭의 모바일 버전은 88W였다. 그러나 새로운 스테핑의 도입으로 일부 모델의 TDP가 결국 낮아졌다.

코어 마이크로아키텍처의 후속 제품인 네할렘 마이크로아키텍처는 2000년으로 거슬러 올라가는 인텔의 로드맵에 따르면 넷버스트의 진화 버전이었다. 네할렘은 3.06GHz ''노스우드''(Northwood) 코어에서 처음 도입된 하이퍼 스레딩 기술과 펜티엄 4 익스트림 에디션에서 사용된 ''갤러틴''(Gallatin) 코어에서 처음 구현된 L3 캐시를 포함하여 넷버스트의 특정 기능을 재구현했다.

6. 대한민국에 미친 영향

(이전 출력이 없으므로, 수정할 내용이 없습니다. 원본 소스와 함께 이전 출력을 제공해주시면 수정하여 출력하겠습니다.)

참조

[1] 웹사이트 The Intel Pentium 4 Processor https://pdfs.semanti[...] Intel 2002-03-01 # Spring 2002를 3월 1일로 변환. 정확한 날짜가 불분명하므로 임의 설정.
[2] 웹사이트 Replay: Unknown Features of the NetBurst Core http://www.xbitlabs.[...] 2016-03-06
[3] 웹사이트 The Trace Cache Branch Prediction Unit https://www.tomshard[...] Tom's Hardware 2000-11-20
[4] 웹사이트 Entering The Execution Pipeline - Pentium 4's Trace Cache, Continued https://www.tomshard[...] Tom's Hardware 2000-11-20
[5] 웹사이트 The microarchitecture of Intel, AMD and VIA CPUs http://www.agner.org[...] 2016-12-01
[6] 웹사이트 Demystifying Intel Branch Predictors http://www.ece.uah.e[...]
[7] 뉴스 The future of Intel's manufacturing processes https://www.anandtec[...]
[8] 웹사이트 Intel says Adios to Tejas and Jayhawk chips https://www.theregis[...]
[9] 웹사이트 Intel cancels Tejas and Jayhawk https://www.zdnet.co[...]
[10] 웹사이트 The Era of Intel's NetBurst Micro-Architecture Comes to End. http://www.xbitlabs.[...] 2007-05-21
[11] 논문 Increasing Processor Performance by Implementing Deeper Pipelines http://ieeexplore.ie[...] 2002
[12] 웹인용 The Intel Pentium 4 Processor https://pdfs.semanti[...] Intel 2002-03-01 # Spring 2002를 3월 1일로 변환. 정확한 날짜가 불분명하므로 임의 설정.
[13] 웹인용 Replay: Unknown Features of the NetBurst Core http://www.xbitlabs.[...] 2016-03-06



본 사이트는 AI가 위키백과와 뉴스 기사,정부 간행물,학술 논문등을 바탕으로 정보를 가공하여 제공하는 백과사전형 서비스입니다.
모든 문서는 AI에 의해 자동 생성되며, CC BY-SA 4.0 라이선스에 따라 이용할 수 있습니다.
하지만, 위키백과나 뉴스 기사 자체에 오류, 부정확한 정보, 또는 가짜 뉴스가 포함될 수 있으며, AI는 이러한 내용을 완벽하게 걸러내지 못할 수 있습니다.
따라서 제공되는 정보에 일부 오류나 편향이 있을 수 있으므로, 중요한 정보는 반드시 다른 출처를 통해 교차 검증하시기 바랍니다.

문의하기 : help@durumis.com