2026.03.19
3.0천
0
0
IT 뉴스

NVIDIA Kyber 아키텍처: 144 GPU 수직 랙으로 AI 데이터센터 재설계

NVIDIA가 GTC 2026에서 차세대 랙 설계 Kyber를 공개했다. 단일 랙에 144개 GPU를 수직 배치하고 케이블 없는 설계로 설치 시간을 대폭 단축하며, 8랙 연결 시 NVL1152 구성으로 15 엑사플롭스를 달성한다.

#NVIDIA#Kyber#GTC 2026#NVL144#데이터센터
NVIDIA Kyber 아키텍처: 144 GPU 수직 랙으로 AI 데이터센터 재설계
AI 핵심 요약

NVIDIA가 GTC 2026에서 차세대 랙 설계 Kyber를 공개했다. 단일 랙에 144개 GPU를 수직 배치하고 케이블 없는 설계로 설치 시간을 대폭 단축하며, 8랙 연결 시 NVL1152 구성으로 15 엑사플롭스를 달성한다.

핵심 요약

NVIDIA가 2026년 3월 17일 GTC 2026 키노트에서 차세대 MGX NVL 랙 아키텍처 'Kyber'를 공개했다. Kyber는 기존 Vera Rubin NVL72의 GPU 수를 두 배로 늘려 단일 랙에 144개 GPU를 수용하며, 수직 블레이드 구조와 케이블 없는 설계로 AI 데이터센터의 밀도와 효율성을 근본적으로 재정의한다.

Kyber의 핵심 설계 철학: 수직 혁명

Kyber 랙은 기존 수평 서버 트레이 대신 수직 레이어 구조를 채택했다. 전면에는 4개의 Rubin Ultra GPU와 2개의 Vera CPU가 탑재된 컴퓨트 블레이드가 배치되고, 중간에는 미드플레인, 후면에는 NVLink 백플레인이 위치한다. 이 구조는 더 많은 컴퓨트와 네트워킹을 동일 공간에 집적할 수 있게 해준다.

가장 주목할 점은 케이블을 완전히 제거한 설계다. 컴퓨트 블레이드가 미드플레인에 직접 연결되는 방식으로, 기존 데이터센터에서 배선 작업에 소요되던 시간을 대폭 줄였다. 냉각 방식도 100% 액체 냉각을 채택해 팬이 전혀 없다.

성능 사양: NVL144에서 NVL1152까지

단일 Kyber 랙(NVL144)은 15 FP4 엑사플롭스의 AI 연산 성능을 제공한다. 이를 8개 연결하면 NVL1152 슈퍼컴퓨터가 구성되며, 랙 간 연결은 직접 광학 인터커넥트를 활용한다.

구성GPU 수성능연결 방식
NVL72 (Vera Rubin)72기준NVLink
NVL144 (Kyber)14415 엑사플롭스NVLink + 미드플레인
NVL576576확장 구성광학 인터커넥트
NVL1152 (8x Kyber)1,152최대 구성직접 광학 인터커넥트

Vera Rubin POD 전체로 보면 7개 칩, 5개 랙 유형, 40개 랙, 1.2 쿼드릴리언 트랜지스터, 약 20,000개 NVIDIA 다이, 1,152개 Rubin GPU, 60 엑사플롭스의 연산 능력, 10PB/s의 스케일업 대역폭을 갖춘다.

Vera Rubin과의 관계

Kyber는 Vera Rubin Ultra와 함께 최초 도입된다. 기존 Vera Rubin 플랫폼은 NVL72 구성이 기본이었지만, Kyber를 통해 NVL72, NVL144, NVL576 세 가지 스케일업 옵션을 선택할 수 있게 됐다. 이는 워크로드 규모에 따라 유연한 인프라 구성을 가능하게 한다.

Rubin GPU 자체는 FP4 기준 50 페타플롭스, Rubin Ultra는 100 페타플롭스의 성능을 제공한다. 단일 랙에서 7억 토큰/초의 출력이 가능한데, 이전 세대가 1GW 데이터센터 전체에서 2,200만 토큰/초를 처리하던 것과 비교하면 도약적인 발전이다.

Feynman 아키텍처로의 연결

NVIDIA는 Kyber를 단순한 현재 제품이 아닌 미래 아키텍처의 토대로 제시했다. Jensen Huang은 'Kyber가 Feynman을 사용한 차세대 극대 규모 AI 컴퓨팅의 기초를 제공한다'고 밝혔다. Feynman은 Rosa CPU와 적층형 GPU, 광학 NVLink를 포함하는 차차세대 아키텍처로, Kyber 랙 설계 위에 구축될 예정이다.

시장 영향과 전망

Kyber의 등장은 AI 데이터센터 설계의 패러다임을 바꿀 수 있다. 케이블 없는 수직 구조는 구축 시간과 유지보수 비용을 크게 줄이고, 밀도 향상은 동일 공간에서 더 많은 연산 능력을 제공한다. Jensen Huang이 Blackwell과 Vera Rubin의 구매 주문이 2027년까지 1조 달러에 달할 것으로 전망한 만큼, Kyber 기반 시스템에 대한 수요도 상당할 것으로 예상된다.

2027년 출하 예정인 Vera Rubin Ultra에 최초 탑재되므로, 실제 고객 배치까지는 시간이 남아 있다. 하지만 이미 GTC 현장에서 주요 클라우드 파트너(AWS, Azure, Oracle)와의 협력이 발표된 만큼, 클라우드 인프라에서의 도입은 빠르게 진행될 전망이다.

장점

  • 단일 랙 144 GPU로 업계 최고 밀도 달성
  • 케이블 없는 설계로 데이터센터 구축 시간 및 비용 절감
  • 100% 액체 냉각으로 전력 효율 극대화
  • NVL72부터 NVL1152까지 유연한 확장 옵션
  • Feynman까지의 장기 로드맵으로 투자 안정성 확보

단점/한계

  • 2027년 Vera Rubin Ultra 출하까지 실제 배치에 시간 소요
  • 완전 액체 냉각 인프라 구축을 위한 추가 데이터센터 설비 투자 필요
  • 극도의 고밀도 설계로 인한 유지보수 접근성 우려

댓글0

주요 기능/특징

1. 수직 블레이드 구조: 기존 수평 트레이 대신 수직 레이어로 밀도 극대화, 단일 랙 144 GPU 수용 2. 케이블 없는(Cable-Free) 설계: 컴퓨트 블레이드가 미드플레인에 직접 연결, 설치 시간 대폭 단축 3. 100% 액체 냉각: 팬 없는 완전 액체 냉각 방식으로 전력 효율 극대화 4. NVL1152 확장: 8개 Kyber 랙 연결로 1,152 GPU 슈퍼컴퓨터 구성, 직접 광학 인터커넥트 사용 5. Feynman 아키텍처 기반: 차차세대 아키텍처의 물리적 토대로 설계, 장기적 호환성 확보

핵심 인사이트

  • 단일 랙당 GPU 수를 72에서 144로 두 배 늘려 데이터센터 공간 효율이 크게 향상된다
  • 케이블 없는 수직 설계는 데이터센터 구축 및 유지보수 패러다임을 근본적으로 변화시킨다
  • 100% 액체 냉각 채택은 고밀도 AI 연산에서 열 관리 문제를 해결하는 업계 표준이 될 수 있다
  • NVL1152까지의 확장 경로는 초대형 AI 모델 훈련에 유연한 인프라 옵션을 제공한다
  • 단일 랙에서 7억 토큰/초 출력은 이전 세대 대비 30배 이상의 추론 성능 향상이다
  • Feynman 아키텍처와의 연계는 2028년 이후까지의 하드웨어 로드맵 안정성을 보여준다
  • AWS, Azure, Oracle 등 주요 클라우드 파트너와의 즉각적 협력은 빠른 시장 확산을 시사한다
  • 1조 달러 규모의 Blackwell/Vera Rubin 주문 전망은 AI 인프라 투자의 지속적 성장을 반영한다

이 리뷰가 유용했나요?

공유하기