Taalas, 1690억 원 투자 유치: Nvidia에 도전하는 모델 맞춤형 AI 칩 스타트업
토론토 기반 AI 칩 스타트업 Taalas가 1억 6900만 달러 투자를 유치했다. Llama 3.1 8B 전용 칩으로 Nvidia H200 대비 73배 빠른 토큰 생성 속도와 1/10 전력 소비를 달성하며, 모델별 맞춤 칩 시장에 도전한다.
토론토 기반 AI 칩 스타트업 Taalas가 1억 6900만 달러 투자를 유치했다. Llama 3.1 8B 전용 칩으로 Nvidia H200 대비 73배 빠른 토큰 생성 속도와 1/10 전력 소비를 달성하며, 모델별 맞춤 칩 시장에 도전한다.
Taalas: 모델 맞춤형 AI 칩이라는 새로운 접근
2026년 2월 19일, 토론토 기반 AI 칩 스타트업 Taalas Inc.가 1억 6900만 달러(약 2460억 원) 규모의 투자를 유치했다. Quiet Capital, Fidelity, 반도체 업계 저명 투자자 Pierre Lamond가 참여했으며, 누적 외부 투자 규모는 2억 달러를 넘어섰다. Taalas의 핵심 전략은 범용 GPU가 아닌 특정 AI 모델에 최적화된 맞춤형 칩을 개발하는 것이다.
핵심 기술: 모델별 맞춤 설계의 효율성
Taalas의 첫 번째 제품은 Meta의 오픈소스 모델 Llama 3.1 8B에 최적화된 프로세서다. 공식 발표에 따르면, 이 칩은 초당 17,000개 출력 토큰을 생성할 수 있다. 이는 Nvidia H200 GPU 대비 73배 빠른 수치이며, 전력 소비는 H200의 1/10 수준에 불과하다.
이러한 성능은 칩 설계 방식의 근본적 차이에서 비롯된다. 범용 GPU는 다양한 작업을 처리하기 위해 범용성을 갖추지만, 그만큼 특정 작업에서의 효율성은 떨어진다. Taalas는 약 100개 레이어로 구성된 칩의 대부분을 미리 제작한 뒤, 마지막 2개 금속 레이어만 모델에 맞게 커스터마이징한다. 이 방식은 TSMC 제조 공정에서 약 2개월 만에 모델별 맞춤 칩 제작을 가능하게 한다.
범용 GPU의 한계를 겨냥한 전략
Taalas가 주목하는 것은 범용 GPU의 구조적 비효율이다. 기존 GPU 기반 AI 추론에서는 고정 폭 메모리 모듈 구조로 인한 처리 지연, 불필요한 보조 부품의 전력 소비 등이 발생한다. Taalas의 모델 맞춤형 설계는 이러한 오버헤드를 제거해 동일 작업을 훨씬 적은 자원으로 수행할 수 있다.
특히 AI 추론(Inference) 비용이 AI 산업 전체 비용에서 차지하는 비중이 커지면서, 추론 효율성에 특화된 칩에 대한 수요는 증가하고 있다. OpenAI가 Cerebras와 파트너십을 맺고 Codex-Spark의 초저지연 추론을 실현한 것도 같은 맥락이다.
제품 로드맵과 시장 전망
Taalas는 현재 Llama 20B 파라미터 모델용 칩을 개발 중이며, 2026년 여름 출시를 목표로 하고 있다. 또한 차세대 HC2 프로세서를 통해 더 큰 프론티어 모델 실행 능력을 확보할 계획이다.
물론 Taalas의 접근 방식에는 한계도 존재한다. 모델별 맞춤 칩은 해당 모델에서만 최적 성능을 발휘하므로, 모델이 업데이트되거나 교체될 때 칩의 활용도가 떨어질 수 있다. AI 모델의 업데이트 주기가 빨라지는 현재 상황에서 이는 사업적 리스크다.
경쟁 환경: Nvidia 독점에 도전하는 칩 스타트업들
AI 칩 시장은 Nvidia가 약 80% 이상의 시장 점유율을 보유한 독점적 구조다. 그러나 Cerebras, Groq, Taalas 등 특화 칩 스타트업들이 각기 다른 각도에서 Nvidia의 지배력에 도전하고 있다. Cerebras는 웨이퍼 스케일 칩으로 초저지연 추론을, Groq는 LPU(Language Processing Unit)로 빠른 추론을, Taalas는 모델 맞춤형 칩으로 극한의 효율성을 추구한다.
결론
Taalas의 1억 6900만 달러 투자 유치는 AI 칩 시장이 범용 GPU 중심에서 용도별 특화 칩으로 다변화되고 있음을 보여주는 신호다. 초당 17,000 토큰, H200 대비 73배 속도라는 수치는 특정 모델에 한정되지만, 모델 맞춤형 칩이라는 접근 자체가 AI 추론 비용 절감이라는 산업적 과제에 새로운 해법을 제시한다. 대규모 AI 추론 인프라를 운영하는 기업이나, 특정 오픈소스 모델을 대량 배포하는 서비스 사업자에게 주목할 만한 옵션이 될 것이다.
장점
- Nvidia H200 대비 73배 빠른 토큰 생성 속도와 1/10 수준의 전력 소비로 AI 추론 비용을 극적으로 절감
- 100개 레이어 중 2개만 커스터마이징하는 혁신적 설계로 맞춤형 칩 제작 비용과 시간 절감
- Fidelity, Quiet Capital 등 주요 투자자 참여로 총 2억 달러 이상의 안정적 자금 확보
- 오픈소스 모델 생태계를 타겟으로 한 명확한 시장 포지셔닝
단점/한계
- 특정 모델에 최적화된 칩이므로 모델 업데이트 시 칩의 활용도가 감소하는 리스크
- Nvidia의 압도적 시장 지배력과 생태계 장벽을 넘기 위한 장기적 전략 필요
- 아직 첫 제품 단계로, 대량 생산 및 상용화까지의 검증이 남아 있음
참고 자료
댓글0개
주요 기능/특징
Taalas는 특정 AI 모델에 최적화된 맞춤형 칩을 개발하는 토론토 기반 스타트업이다. 첫 제품은 Llama 3.1 8B 전용 프로세서로, 초당 17,000 토큰 생성, Nvidia H200 대비 73배 속도, 1/10 전력 소비를 달성했다. 약 100개 레이어 중 2개만 모델별로 커스터마이징하는 방식으로 TSMC에서 약 2개월 내 제작이 가능하다.
핵심 인사이트
- 모델 맞춤형 칩은 범용 GPU의 구조적 오버헤드를 제거해 동일 작업을 73배 빠르게, 1/10 전력으로 수행할 수 있다.
- AI 추론 비용이 전체 AI 인프라 비용에서 차지하는 비중이 커지면서, 추론 특화 칩에 대한 시장 수요가 급증하고 있다.
- 100개 레이어 중 2개만 커스터마이징하는 설계 방식은 맞춤형 칩의 생산 비용과 납기를 획기적으로 단축한다.
- Cerebras, Groq, Taalas 등 특화 칩 스타트업들이 각기 다른 전략으로 Nvidia의 GPU 독점에 도전하고 있다.
- 오픈소스 모델(Llama) 전용 칩이라는 전략은 오픈소스 AI 생태계의 성장과 맞물려 시장 기회를 확대한다.
- 모델 업데이트 주기가 빨라지는 환경에서 모델 맞춤형 칩의 수명 주기 관리가 핵심 사업 리스크로 작용한다.
이 리뷰가 유용했나요?
공유하기
관련 AI 리뷰
테네시주 AI 정신건강법 서명: AI 챗봇의 치료사 사칭을 금지하다
테네시주가 AI 시스템의 정신건강 전문가 사칭을 금지하는 SB1580 법안에 서명했다. 7월 1일 시행되며 위반 시 건당 $5,000 벌금과 사적 소송권이 부여된다. 미국 최초의 AI 정신건강 규제법이다.
Q1 2026 VC $3,000억 역대 최대: AI가 전체 투자의 81%를 집어삼켰다
2026년 1분기 글로벌 벤처캐피털 투자가 $3,000억으로 역대 최고를 기록했다. AI 스타트업이 $2,420억(81%)을 차지하며, OpenAI($1,220억)와 Anthropic($300억)이 대형 라운드를 이끌었다.
OpenAI, 테크 팟캐스트 TBPN 인수: AI 기업이 미디어에 진출하는 이유
OpenAI가 실리콘밸리 인기 테크 팟캐스트 TBPN을 인수했다. AI 기업의 첫 미디어 인수로, AI 서사 주도권 확보를 위한 새로운 전략이다. 편집 독립성 유지를 약속했지만, 이해 충돌 우려도 제기된다.
젠슨 황 "AGI 달성했다" 선언: $4조 기업 CEO의 발언이 촉발한 정의 논쟁
NVIDIA CEO 젠슨 황이 Lex Fridman 팟캐스트에서 "AGI를 달성했다"고 선언했다. Google DeepMind의 인지 프레임워크는 이에 반박하며, AGI 정의를 둘러싼 업계 논쟁이 격화되고 있다.
