GPU 클러스터

"오늘의AI위키"는 AI 기술로 일관성 있고 체계적인 최신 지식을 제공하는 혁신 플랫폼입니다.
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.

1. 개요

GPU 클러스터는 여러 개의 그래픽 처리 장치(GPU)를 연결하여 고성능 컴퓨팅을 구현하는 시스템이다. 하드웨어적으로는 컴퓨터 노드, GPU, 그리고 노드 간의 빠른 데이터 전송을 위한 상호 연결이 필요하며, 이기종 및 동기종 GPU로 분류된다. 소프트웨어적으로는 운영 체제, GPU 드라이버, 클러스터 API 등이 사용된다. 알고리즘 매핑은 기존 컴퓨터 클러스터와 유사하게 이루어지며, 텍스처 분할 등의 기법이 활용된다.

GPU 클러스터

유형	컴퓨터 클러스터
용도	병렬 처리
구성 요소	여러 개의 GPU 고속 상호 연결 CPU 메모리 스토리지

아키텍처

일반적인 아키텍처	각 노드는 하나 이상의 GPU를 가진다. 노드는 이더넷, 인피니밴드 또는 다른 고속 상호 연결을 통해 연결된다.
주요 이점	병렬 처리를 통해 단일 컴퓨터보다 훨씬 빠르게 작업을 완료할 수 있다. 더 큰 모델과 데이터 세트로 작업할 수 있다. 비용 효율성

사용 사례

과학 연구	분자 모델링 기후 모델링 우주론
기계 학습	딥 러닝 모델 훈련 컴퓨터 비전 자연어 처리
기타	금융 모델링 의료 영상 비디오 게임

소프트웨어 및 라이브러리

중요한 라이브러리	CUDA OpenCL TensorFlow PyTorch
프로그래밍	C++ Python Fortran

📚 더 읽어볼만한 페이지

클러스터 컴퓨팅 - 슈퍼컴퓨터
슈퍼컴퓨터는 일반 컴퓨터보다 훨씬 높은 성능을 가진 컴퓨터로, 복잡한 계산과 시뮬레이션을 수행하며, 프로세서, 메모리, 스토리지, 네트워크 등으로 구성되어 병렬 처리를 통해 높은 성능을 구현하고, 군사, 기상 예측, 과학 기술 분야, 인공지능 등 다양한 분야에서 활용되고 있다.
클러스터 컴퓨팅 - 컴퓨터 클러스터
GPGPU - 인텔 Xe
인텔 Xe는 저전력부터 고성능 컴퓨팅까지 다양한 시장을 목표로 하는 인텔의 GPU 아키텍처 제품군으로, Xe-LP, Xe-HPG, Xe-HP, Xe-HPC 등의 하위 아키텍처를 가지며 외장 그래픽 카드인 인텔 아크 시리즈와 내장 그래픽, 데이터 센터용 GPU 등에 활용된다.
GPGPU - 테라스케일 (마이크로아키텍처)
테라스케일은 AMD가 개발한 GPU 마이크로아키텍처로, 셰이더 처리량 증가를 위해 통합 셰이더 모델을 사용하며, VLIW 아키텍처를 기반으로 라데온 HD 2000, 3000, 4000, 5000, 6900 시리즈에 적용되었다가 그래픽스 코어 넥스트 아키텍처로 대체되었다.
그래픽 하드웨어 - 그래픽 처리 장치
그래픽 처리 장치(GPU)는 컴퓨터 그래픽 렌더링 및 표시를 가속화하는 전용 프로세서로, 아케이드 게임기에서 시작하여 개인용 컴퓨터의 초기 그래픽 디스플레이 프로세서, 하드웨어 가속 3D 그래픽을 거쳐 인공지능 및 딥러닝 분야에서도 활용되며 다양한 형태로 컴퓨터, 게임 콘솔, 모바일 기기 등 광범위한 분야에서 사용된다.
그래픽 하드웨어 - 매트록스 G200
매트록스 G200은 1990년대 후반 매트록스가 출시한 고급 2D 그래픽 가속기 시리즈로, 듀얼버스 아키텍처, 32비트 색상 지원, 트리리니어 밉맵 필터링 등의 혁신적인 기술을 통해 2D 그래픽 분야에서 강점을 유지하고 저전력 설계를 통해 시스템 안정성과 소음 감소에 기여했다.

1. 개요
2. 하드웨어
- 2.1. GPU 종류
  - 2.1.1. 이기종 (Heterogeneous)
  - 2.1.2. 동기종 (Homogeneous)
- 2.2. 기타 하드웨어
  - 2.2.1. 상호 연결 (Interconnect)
  - 2.2.2. 공급 업체
3. 소프트웨어
4. 알고리즘 매핑
5. 참고 항목

2. 하드웨어

GPU 클러스터는 여러 대의 컴퓨터 노드와 다수의 GPU를 고속 네트워크로 연결하여 구성된다. 클러스터의 성능과 특성은 사용되는 GPU의 종류와 성능, 그리고 노드 간의 데이터를 효율적으로 전송하는 상호 연결 기술에 크게 의존한다. 또한, 이러한 시스템을 구축하고 제공하는 전문 공급 업체들도 존재한다. 구체적인 하드웨어 구성 요소와 특징은 하위 섹션에서 자세히 다룬다.

2.1. GPU 종류

GPU 클러스터는 구성하는 GPU의 종류에 따라 이기종({{lang|eng|Heterogeneous|헤테로지니어스}})과 동기종({{lang|eng|Homogeneous|호모지니어스}}) 두 가지로 나뉜다. 이 분류는 클러스터에서 소프트웨어를 개발하는 방식에 영향을 미친다. 이는 GPU 종류별로 활용 가능한 기능이 다르기 때문이다. 각 방식에 대한 자세한 내용은 하위 문단에서 설명한다.

2.1.1. 이기종 (Heterogeneous)

주요 IHV(AMD, NVIDIA 등)의 하드웨어를 함께 사용하거나, 같은 제조사의 GPU라도 서로 다른 모델(예: 8800GT와 8800GTX 혼합)을 사용하는 경우 이기종(Heterogeneous) GPU 클러스터로 분류된다.

서로 다른 종류의 GPU는 각기 다른 기능을 가지고 있기 때문에, 이러한 이기종 구성은 클러스터 상에서의 소프트웨어 개발 방식에 큰 영향을 미친다. 즉, 다양한 GPU의 기능을 활용할 수 있다는 장점이 있지만, 각기 다른 하드웨어 특성을 모두 고려해야 하므로 소프트웨어 개발 및 최적화 과정이 더 복잡해질 수 있다.

2.1.2. 동기종 (Homogeneous)

동기종(Homogeneous^영어) 클러스터는 클러스터를 구성하는 모든 GPU가 동일한 하드웨어 종류, 제조사, 모델인 경우를 의미한다. 예를 들어, 모든 GPU가 동일한 메모리 용량을 가진 엔비디아의 8800GT 모델 수백 개로 이루어진 클러스터가 동기종 클러스터에 해당한다.

모든 GPU가 동일하기 때문에 소프트웨어 개발 및 최적화가 이기종 클러스터에 비해 상대적으로 용이하다는 장점이 있다. 다만, 사용하는 GPU가 한 종류로 고정되므로 해당 모델이 제공하는 기능으로 제한될 수 있다. 클러스터를 구성하는 GPU의 종류는 활용 가능한 기능이 다르기 때문에 소프트웨어 개발 방식에 큰 영향을 미친다.

2.2. 기타 하드웨어

(내용 없음)

2.2.1. 상호 연결 (Interconnect)

컴퓨터 노드와 각 GPU 외에도, 노드 간에 데이터를 전송하기 위해서는 충분히 빠른 상호 연결 기술이 필요하다. 사용되는 상호 연결 기술의 종류는 주로 클러스터를 구성하는 노드의 수에 따라 달라진다. 대표적인 상호 연결 기술로는 기가비트 이더넷과 인피니밴드가 있다.

2.2.2. 공급 업체

엔비디아는 Tesla 20 시리즈 GPGPU를 사용하여 완벽하게 구성된 GPU 클러스터를 구축하고 제공할 수 있는 역량을 갖춘 전용 TPP(Tesla Preferred Partner) 목록을 제공한다. AMAX Information Technologies^영어, 델, 휴렛 팩커드, 실리콘 그래픽스 등은 GPU 클러스터와 시스템의 완벽한 라인업을 제공하는 대표적인 기업들이다.

3. 소프트웨어

여러 대의 GPU 장착 컴퓨터를 하나의 시스템처럼 작동시키는 데 필요한 주요 소프트웨어는 다음과 같다.

# 운영 체제
# 각 클러스터 노드에 설치된 GPU 종류에 맞는 GPU 드라이버.
# 클러스터링 API. 대표적인 예로 메시지 전달 인터페이스(MPI)가 있다.
# [http://www.MOSIX.org/txt_vcl.html VirtualCL(VCL) 클러스터 플랫폼]. 이는 OpenCL을 위한 래퍼(wrapper)로, 대부분의 애플리케이션이 코드를 수정하지 않고도 클러스터 내의 여러 OpenCL 장치를 마치 로컬 컴퓨터의 장치처럼 투명하게 활용할 수 있도록 지원한다. AMAX Information Technologies 등에서 개발하였다.

4. 알고리즘 매핑

GPU 클러스터에서 알고리즘을 실행하기 위해 매핑하는 것은 기존 컴퓨터 클러스터에서 알고리즘을 매핑하는 방식과 유사하다. 예를 들어, 기존 클러스터에서는 램에 있는 배열 조각을 여러 노드에 분산시키지만, GPU 클러스터에서는 텍스처를 여러 노드에 나누어 분산시킨다.

5. 참고 항목

* [https://ieeexplore.ieee.org/document/1392977 고성능 컴퓨팅을 위한 GPU 클러스터, SC 2004]
* Are Magnus Bruaset, Aslak Tveito. 병렬 컴퓨터에서 편미분 방정식의 수치 해법. Birkhäuser, 2006. ISBN 3-540-29076-1.
* [https://web.archive.org/web/20111101193720/http://www.iacat.uiuc.edu/resources/cluster/ NCSA의 가속기 클러스터]
* [http://www.ncsa.illinois.edu/~kindr/papers/ppac09_paper.pdf 고성능 컴퓨팅을 위한 GPU 클러스터]
* [https://web.archive.org/web/20100209093751/http://www.cse.scitech.ac.uk/disco/cseht/cseht.shtml STFC Daresbury Laboratory의 GPU 클러스터]
* [http://www.gputemp.com GPU 코어 온도 모니터링]
* 고성능 컴퓨팅