Big.LITTLE
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.
1. 개요
Big.LITTLE은 전력 소비를 줄이면서 성능을 최적화하기 위해 설계된 프로세서 아키텍처이다. 이 기술은 고성능 'big' 코어와 저전력 'LITTLE' 코어를 함께 사용하여, 작업 부하에 따라 코어를 전환한다. 클러스터 마이그레이션, 인-커널 스위처, 이기종 간 다중 처리(HMP)의 세 가지 주요 구현 모델이 있으며, HMP가 가장 강력한 사용 모델이다. Big.LITTLE은 다양한 SoC에 적용되었으며, ARM은 이 기술의 후속으로 DynamIQ를 발표했다.
더 읽어볼만한 페이지
- 이기종 컴퓨팅 - 이기종 시스템 아키텍처
이기종 시스템 아키텍처(HSA)는 CPU, GPU, DSP 등 다양한 처리 장치를 효율적으로 활용하기 위해 컴퓨팅 장치를 위한 통합 가상 주소 공간을 제공하여 GPU가 CPU와 메모리를 공유하며 데이터를 교환하도록 함으로써 이기종 컴퓨팅 환경의 성능과 전력 효율성을 향상시키는 시스템 아키텍처이다. - 이기종 컴퓨팅 - 코프로세서
코프로세서는 주 프로세서를 보조하여 특정 작업의 효율을 높이는 특수 목적 프로세서로, 주 프로세서의 제어하에 제한된 기능을 수행하며, 부동 소수점 연산, 그래픽 처리, 인공신경망 연산 등 다양한 종류가 있다. - ARM 아키텍처 - XScale
XScale은 인텔이 개발한 32비트 ARM 아키텍처 기반의 프로세서 제품군으로, 스마트폰, PDA, 라우터 등 다양한 기기에 사용되었다. - ARM 아키텍처 - 스펙터 (버그)
스펙터는 2017년에 발견된 CPU 보안 취약점으로, 추측 실행의 부작용을 악용하여 다른 프로그램의 메모리 영역에 접근하게 하며, 인텔, AMD, ARM 등 다양한 제조사의 프로세서에 영향을 미친다.
Big.LITTLE | |
---|---|
개요 | |
유형 | 이기종 컴퓨팅 아키텍처 |
개발 | ARM |
상세 정보 | |
특징 | 고성능 코어와 저전력 코어의 조합 작업 부하에 따라 코어 전환 전력 효율성 향상 |
작동 방식 | 작업 부하 모니터링 필요에 따라 적절한 코어 활성화/비활성화 최적의 성능 및 전력 소비 유지 |
기술적 측면 | |
코어 구성 예시 | Cortex-A7 + Cortex-A15 Cortex-A53 + Cortex-A57 Cortex-A55 + Cortex-A76 |
스케줄링 방식 | 클러스터 마이그레이션 (Cluster Migration) 글로벌 태스크 스케줄링 (Global Task Scheduling, GTS) 이기종 시스템 아키텍처 (Heterogeneous System Architecture, HSA) |
장단점 | |
장점 | 전력 효율성 향상 배터리 수명 연장 발열 감소 성능 향상 (특정 작업 부하) |
단점 | 소프트웨어 최적화 필요 스케줄링 복잡성 증가 코어 간 전환 오버헤드 발생 가능성 |
활용 분야 | |
모바일 기기 | 스마트폰, 태블릿 컴퓨터 |
임베디드 시스템 | IoT 기기, 웨어러블 기기 |
그 외 | 저전력 서버 |
관련 기술 | |
ARM Cortex-A 시리즈 | ARM Cortex-A7 ARM Cortex-A15 ARM Cortex-A53 ARM Cortex-A57 ARM Cortex-A55 ARM Cortex-A76 |
이기종 컴퓨팅 | HSA (Heterogeneous System Architecture) |
전력 관리 | DVFS (Dynamic Voltage and Frequency Scaling) |
기타 | |
big.LITTLE Global Task Scheduling (GTS) | CPU 코어 간 작업 부하를 지능적으로 분산하여 전력 효율성을 최적화함 |
클러스터 마이그레이션 (Cluster Migration) | 작업 부하를 한 클러스터에서 다른 클러스터로 이동시켜 전력 소비를 줄이는 기술 |
2. big.LITTLE이 해결하는 문제
주어진 CMOS 로직 라이브러리의 경우, 활성 전력은 초당 로직 스위칭이 증가함에 따라 증가하며, 누설 전류는 트랜지스터 수에 따라 증가한다. 따라서 빠르게 실행되도록 설계된 CPU는 전력 절약을 위해 설계된 CPU와 다른 특성을 가진다. 매우 빠른 아웃오브오더 CPU가 매우 낮은 속도로 유휴 상태일 때, 누설 전류가 훨씬 적은 CPU(트랜지스터 수가 적음)가 동일한 작업을 수행할 수 있다. 예를 들어, 더 작은(트랜지스터 수가 적은) 메모리 캐시를 사용하거나, 아웃오브오더 실행을 제거하는 것과 같은 더 간단한 마이크로아키텍처를 사용할 수 있다. big.LITTLE은 동일한 시스템에서 전력과 속도를 모두 최적화하는 방법이다.
big.LITTLE 디자인에서 서로 다른 프로세서 코어를 배치하는 세 가지 방법은 커널에 구현된 스케줄러에 따라 달라진다.[4][5]
3. 실행 상태 마이그레이션
3. 1. 클러스터 마이그레이션 (Clustered Switching)
클러스터 모델 방식은 프로세서를 "big" 또는 "LITTLE" 코어의 동일한 크기 클러스터로 배열하는 최초이자 가장 간단한 구현 방식이다. 운영 체제 스케줄러는 한 번에 하나의 클러스터만 볼 수 있으며, 전체 프로세서의 부하가 낮음에서 높음으로 변경될 때 시스템은 다른 클러스터로 전환된다. 그런 다음 모든 관련 데이터는 공통 L2 캐시를 통해 전달되고, 활성 코어 클러스터는 전원이 꺼지고 다른 클러스터가 활성화된다. CCI(Cache Coherent Interconnect)가 사용된다. 이 모델은 삼성 Exynos 5 Octa (5410)에 구현되었다.[6]
3. 2. 인-커널 스위처 (CPU 마이그레이션, In-Kernel Switcher, IKS)
인-커널 스위처(IKS)를 통한 CPU 마이그레이션은 'big' 코어와 'LITTLE' 코어를 짝지어 사용하며, 하나의 칩에 여러 개의 동일한 쌍이 있을 수 있다. 각 쌍은 '가상 코어'로 작동하며, 한 번에 하나의 실제 코어만 완전히 전원이 켜져 실행된다. 'big' 코어는 수요가 높을 때 사용하고, 'LITTLE' 코어는 수요가 낮을 때 사용된다.
가상 코어의 수요가 변동(높음에서 낮음 사이)하면, 들어오는 코어의 전원이 켜지고, 실행 상태가 이전되며, 나가는 코어는 종료되고, 새로운 코어에서 처리가 계속된다. 스위칭은 cpufreq 프레임워크를 통해 수행된다. 완전한 big.LITTLE IKS 구현은 리눅스 3.11에 추가되었다. big.LITTLE IKS는 클러스터 마이그레이션의 개선된 형태이며, 주요 차이점은 각 쌍이 스케줄러에 표시된다는 것이다.
더 복잡한 배열은 'big' 코어와 'LITTLE' 코어의 비대칭 그룹화를 포함한다. 단일 칩은 하나 또는 두 개의 'big' 코어와 더 많은 'LITTLE' 코어를 가질 수 있으며, 그 반대의 경우도 가능하다. 엔비디아는 테그라 3 SoC의 저전력 '컴패니언 코어'를 통해 이와 유사한 것을 만들었다.[16]
3. 3. 이기종 간 다중 처리 (전역 태스크 스케줄링, Heterogeneous Multi-Processing, HMP)
big.LITTLE 아키텍처의 가장 강력한 사용 모델은 이종 멀티 프로세싱 (HMP)으로, 모든 물리적 코어를 동시에 사용할 수 있게 해준다. 이 경우 스레드는 높은 우선순위 또는 계산 집약적인 작업은 "빅" 코어에, 우선순위가 낮거나 계산 집약도가 낮은 스레드 (예: 백그라운드 작업)는 "LITTLE" 코어에서 수행될 수 있다.[7]
이 모델은 삼성의 엑시노스 시리즈 (5420, 5422, 5430)를 시작으로 구현되었으며,[8] 애플 A 시리즈 프로세서에서는 애플 A11부터 구현되었다.[9]
4. 스케줄링
big.LITTLE 아키텍처는 운영체제의 기존 동적 전압 및 주파수 스케일링(DVFS) 기능을 활용한다. 리눅스의 `cpufreq`와 같은 커널 내 DVFS 지원은 주파수/전압 목록을 보고 하드웨어에서처럼 적절하게 전환한다. 로우엔드 슬롯은 'LITTLE' 코어를, 하이엔드 슬롯은 'big' 코어를 활성화한다. 2012년부터 리눅스의 "데드라인" CPU 스케줄러가 이러한 솔루션을 제공했다.[10]
또는, 모든 코어를 커널 스케줄러에 노출시켜 각 프로세스/스레드의 실행 위치를 결정할 수 있다. 이는 짝을 이루지 않은 배열에 필요하지만, 짝을 이룬 코어에서도 사용 가능하다. 하지만 이는 커널 스케줄러에 문제를 야기하는데, 기존에는 (SMP) 시스템의 모든 코어가 동일하다고 가정했기 때문이다. 2019년 리눅스 5.0에 추가된 ''에너지 인식 스케줄링''은 코어를 다르게 고려하는 스케줄러의 한 예이다.[11][12]
4. 1. 전역 태스크 스케줄링의 이점
전역 태스크 스케줄링(Global Task Scheduling)은 다음과 같은 이점을 제공한다.- 코어 간 마이그레이션 작업 부하를 유연하게 제어할 수 있다. 스케줄러가 태스크를 코어 간에 직접 이동시킴으로써 커널 오버헤드를 줄이고 전력을 절약할 수 있다.
- 스케줄러 내 구현 및 교환 결정이 IKS에 구현된 cpufreq 프레임워크보다 빠르다.
- 2개의 Cortex-A15 코어와 4개의 Cortex-A7 코어와 같은 비대칭 SoC를 쉽게 지원한다.
- IKS와 비교하여 SoC의 최대 성능 처리량이 향상되어 모든 코어를 동시에 사용할 수 있다.
이기종 멀티프로세싱(heterogeneous multi-processing)은 big.LITTLE 아키텍처에서 가장 강력한 모델이다. 이 모델에서는 모든 코어를 동시에 사용할 수 있다. 고 우선순위 및 고 계산량 스레드는 "big" 코어에 할당하고, 저 우선순위 및 저 계산량 스레드는 "LITTLE" 코어에 할당하여 프로세서의 성능을 최대한 끌어낼 수 있다.
예를 들어 옥타 코어 프로세서의 경우, 상황에 따라 1개에서 8개의 코어가 실행되며, 이는 24가지[17]의 경우의 수로 증가한다. 상황에 따라 더욱 유연하게 실행할 수 있다.[18]
5. 구현 상황
SoC | 제조 공정 | 빅 코어 | 리틀 코어 | GPU | 메모리 인터페이스 | 무선 네트워크 기술 | 사용 가능 일자 | 활용 디바이스 |
---|---|---|---|---|---|---|---|---|
HiSilicon K3V3 | 28nm | 1.8 GHz 듀얼 코어 Cortex-A15 | 1.2 GHz 듀얼 코어 Cortex-A7 | Mali-T658 | 2013년 하반기 | |||
삼성 엑시노스 5 옥타 (5410 모델)[25][26] | 28nm | 1.6-1.8 GHz 쿼드 코어 Cortex-A15 | 1.2 GHz 쿼드 코어 Cortex-A7 | PowerVR SGX544MP3 | 32비트 듀얼 채널 800MHz LPDDR3 (12.8GB/sec) | 2013년 2분기 | 삼성 갤럭시 S4 (GT-I9500 / SHV-E300 / SCH-I959 / GT-I9502 모델에 한함. 이외의 모델은 퀄컴사의 AP를 사용함.) | |
삼성 엑시노스 5 옥타 (5420 모델)[27] | 28nm | 1.8-2.0 GHz 쿼드 코어 Cortex-A15 | 1.3 GHz 쿼드 코어 Cortex-A7 | Mali-T628MP6 | 32비트 듀얼 채널 933MHz LPDDR3e (14.9GB/sec) | 2013년 4분기 | 삼성 갤럭시 노트 3 | |
삼성 엑시노스 5 옥타 (5422 모델) | 2.1 GHz 쿼드 코어 Cortex-A15 | 1.5 GHz 쿼드 코어 Cortex-A7 | Mali-T628MP6 | 삼성 갤럭시 S5 | ||||
Renesas Mobile MP6530[28] | 28nm | 2 GHz 듀얼 코어 Cortex-A15 | 1 GHz 듀얼 코어 Cortex-A7 | PowerVR SGX544 | 듀얼 채널 LPDDR3 | LTE CAT4 |
6. 후속 기술
ARM은 2017년 5월, big.LITTLE의 후속 기술로 DynamIQ를 발표했다.[13] DynamIQ는 멀티 코어 프로세서를 설계할 때 더 많은 유연성과 확장성을 제공한다. big.LITTLE과 달리, DynamIQ는 Armv8.2 CPU의 경우 클러스터 내 최대 코어 수를 8개, Armv9은 12개, Armv9.2는 14개로 늘리고[14] 단일 클러스터 내에서 다양한 코어 설계를 허용하며, 최대 32개의 클러스터를 지원한다. 또한, 이 기술은 코어별로 더욱 세분화된 전압 제어와 더 빠른 L2 캐시 속도를 제공한다. 그러나 DynamIQ는 이전 ARM 설계와 호환되지 않으며, 초기에는 Cortex-A75 및 Cortex-A55 CPU 코어와 후속 제품만 지원한다.
참조
[1]
웹사이트
big.LITTLE technology
https://web.archive.[...]
ARM.com
2012-10-17
[2]
웹사이트
ARM's new Cortex-A12 is ready to power 2014's $200 midrange smartphones
https://www.theverge[...]
2014-04
[3]
웹사이트
ARM Cortex A17: An Evolved Cortex A12 for the Mainstream in 2015
http://www.anandtech[...]
AnandTech
2014-04
[4]
웹사이트
Ten Things to Know About big.LITTLE
https://web.archive.[...]
ARM Holdings
2013-09-17
[5]
웹사이트
big.LITTLE Software Update
https://web.archive.[...]
Linaro
2013-09-17
[6]
웹사이트
Benchmarking ARM's big-little architecture
http://www.embedded.[...]
2013-09-17
[7]
간행물
Big.LITTLE Processing with ARM Cortex-A15 & Cortex-A7
https://web.archive.[...]
ARM Holdings
2013-09-17
[8]
웹사이트
Samsung Unveils New Products from its System LSI Business at Mobile World Congress
https://web.archive.[...]
Samsung Tomorrow
2013-02-26
[9]
뉴스
The future is here: iPhone X
https://www.apple.co[...]
2018-02-25
[10]
웹사이트
A big.LITTLE scheduler update
https://lwn.net/Arti[...]
2012-06-12
[11]
웹사이트
Energy Aware Scheduling merged in Linux 5.0
https://community.ar[...]
2019-02-25
[12]
웹사이트
Energy Aware Scheduling
https://www.kernel.o[...]
[13]
뉴스
Exploring Dynamiq and ARM's New CPUs
http://www.anandtech[...]
Anandtech
2017-05-29
[14]
웹사이트
DynamIQ – Arm®
https://www.arm.com/[...]
2023-10-18
[15]
웹사이트
Benchmarking ARM's big-little architecture
http://www.embedded.[...]
2013-09-17
[16]
문서
低消費電力4コア、高性能1コア低消費電力3コア、高性能2コア低消費電力2コア、高性能3コア低消費電力1コア、高性能4コアの5通り。
[17]
문서
低消費電力1コア、高性能1コア、低消費電力2コア、高性能1コア低消費電力1コア、高性能2コア、低消費電力3コア、高性能1コア低消費電力2コア、高性能2コア低消費電力1コア、高性能3コア、低消費電力4コア、高性能1コア低消費電力3コア、高性能2コア低消費電力2コア、高性能3コア低消費電力1コア、高性能4コア、高性能1コア低消費電力4コア、高性能2コア低消費電力3コア、高性能3コア低消費電力2コア、高性能4コア低消費電力1コア、高性能2コア低消費電力4コア、高性能3コア低消費電力3コア、高性能4コア低消費電力2コア、高性能3コア低消費電力4コア、高性能4コア低消費電力3コア、高性能4コア低消費電力4コアの24通り。
[18]
뉴스
The future is here: iPhone X
https://www.apple.co[...]
2018-02-25
[19]
웹인용
What Is ARM big.LITTLE?
http://www.ubergizmo[...]
UberGizmo.com
2015-08-27
[20]
웹인용
big.LITTLE technology
http://www.arm.com/p[...]
ARM.com
2013-10-09
[21]
보도자료 인용
ARM Unveils its Most Energy Efficient Application Processor Ever; Redefines Traditional Power And Performance Relationship With big.LITTLE Processing
http://www.arm.com/a[...]
ARM
2012-10-31
[22]
보도자료 인용
ARM Launches Cortex-A50 Series, the World’s Most Energy-Efficient 64-bit Processors
http://www.arm.com/a[...]
ARM
2012-10-31
[23]
웹인용
ARM's new Cortex-A12 is ready to power 2014's $200 midrange smartphones
http://www.theverge.[...]
The Verge
2014-04
[24]
웹인용
ARM Cortex A17: An Evolved Cortex A12 for the Mainstream in 2015
http://www.anandtech[...]
AnandTech
2015-08-27
[25]
웹인용
Samsung’s new eight-core Exynos 5 Octa SoC promises not to hog battery
http://arstechnica.c[...]
Ars Technica
2013-01-10
[26]
웹인용
Samsung announces eight-core Exynos 5 'Octa' chip at CES
http://www.engadget.[...]
Engadget
2013-01-09
[27]
인용
Samsung Primes Exynos 5 Octa for ARM big.LITTLE Technology with Heterogeneous Multi-Processing Capability
http://www.samsung.c[...]
Samsung Electronics
2013-09-10
[28]
인용
MP6530
http://renesasmobile[...]
Renesas Mobile
2012-12
본 사이트는 AI가 위키백과와 뉴스 기사,정부 간행물,학술 논문등을 바탕으로 정보를 가공하여 제공하는 백과사전형 서비스입니다.
모든 문서는 AI에 의해 자동 생성되며, CC BY-SA 4.0 라이선스에 따라 이용할 수 있습니다.
하지만, 위키백과나 뉴스 기사 자체에 오류, 부정확한 정보, 또는 가짜 뉴스가 포함될 수 있으며, AI는 이러한 내용을 완벽하게 걸러내지 못할 수 있습니다.
따라서 제공되는 정보에 일부 오류나 편향이 있을 수 있으므로, 중요한 정보는 반드시 다른 출처를 통해 교차 검증하시기 바랍니다.
문의하기 : help@durumis.com