"엔비디아랑 경쟁이 되겠느냐"에 대한 리벨리온의 대답 [J커브]

“지금 우리는 J커브 초입에 들어선 것 같습니다.”

인공지능 반도체 설계(팹리스) 기업 ‘리벨리온’의 창업자 박성현 대표(CEO)는 EO와의 인터뷰에서 이렇게 말했다. 생성형 인공지능 서비스들이 폭발적으로 커지면서, 인공지능(AI) 반도체에 관한 수요가 엄청나게 커지고 있다고. 2020년 설립 이후 5년 만에 기업 가치 2조 유니콘 기업이 된 리벨리온이 날개를 달고 성장할 일만 남았다고.

박 대표의 설렘에는 나름의 근거가 있다. 400조에서 1,000조. 감이 안 올만큼 큰 이 숫자들은 다름 아니라 ‘데이터 센터 시장 크기’다. 2026년 400조 원 이상으로 예상되는 데이터 센터 마켓은 2034년 1,300조 원 규모로 치솟는다. AI 수요를 드러내는 대표적인 트렌드다. 그야말로 큰 시장, 큰 기회. 창업자 입장에선 큰 꿈을 꾸지 않을 수 없는 타이밍이다.

하지만 큰 시장과 기회에 뛰어드는 기업으로 비단 리벨리온만 있는 게 아니다.

일단 “없어서 큰 일”이라는 말이 나올 정도로 AI 인프라의 근간이 된 그래픽처리장치(GPU), 그걸 설계하는 엔비디아의 존재감이 상당하다. 사실상 시장의 80% 이상을 장악하고 있다는 분석이 나올 만큼 독점적인 위치를 확보한 상태다. 여기서 나오는 매출 규모는 약 276조 원. 엔비디아 전체 매출의 약 90%를 차지할 만큼 비중이 크기에, 엔비디아는 결코 물러서지 않을 것이다.

(참고 : Data Center Market Size, Share & Forecast Report, 2034 )
(참고 : Nvidia’s Long-Term Growth Potential in a Maturing AI Era: Sustaining Dominance Amid Intensifying Competition)
(참고 : ③ 엔비디아는 계속 승승장구할까? - 비즈니스 모델과 AI )

엔비디아 앞에서 리벨리온은 언더독(Underdog)이다. 이기기 쉽지 않은 게임에 뛰어든 스타트업이다. 다윗과 골리앗의 싸움이다. 박 대표 또한 “5년, 10년 뒤에 맞아 죽더라도 엔비디아와 경쟁해보는 게 우리 팀의 비전”이라고 말한 바 있다. 그래서 물어볼 수밖에 없다.

“AI에 굳이 GPU가 아니라 리벨리온의 칩을 써야 하는가?”

이 질문은 J커브 문턱에 다다른 리벨리온에게 긴장감과 기대감을 모두 심어주는 문장이다. 과연 리벨리온은 이 질문에 답할 준비가 돼 있을까. 데이터 센터를 포함한 AI 기업들이 대세가 아닌 신예의 손을 들어준다면 그 이유는 무엇일까. 이번 글은 ‘엔비디아 천하’로 불리는 AI 반도체 시장과 거기에 도전장을 내미는 리벨리온의 성장 곡선에 대해 다뤄봤다.

[아티클 한 눈에 보기]

GPU가 모두 커버하지 못할 만큼 커진 시장
굳이 ‘추론 칩’이 따로 필요한가
엄청난 경쟁이 리벨리온을 기다리고 있다
앞으로 J커브를 그리며 도약하려면

GPU가 모두 커버하지 못할 만큼 커진 시장

리벨리온의 AI 반도체를 이해하려면 먼저 ‘AI 반도체’가 정확히 무엇인지 짚어야 한다.

AI 칩은 방대한 양의 데이터를 빠르게 불러들여 대규모 연산을 처리하는 반도체를 의미한다. 이른바 ‘AI 전용 가속기’라고 불리는 이유다. 이 반도체가 인공지능의 ‘성능’과 ‘효율’을 모두 높이는 데 집중하기 때문이다.

인공지능이 엄청난 양의 데이터를 ‘먹이’로 삼아 학습한다는 건 잘 알려진 사실이다. 그래서 GPU는 인공지능과 잘 맞았다. 데이터를 한 번에 대량으로 처리하는 ‘병렬 처리 방식’의 반도체이기 때문에 AI 모델이 조 단위(Trillion) 규모의 데이터를 소화하는 근간이 됐다.

이러한 특징을 잘 보여주는 예시로 2009년 엔비디아 행사에서 선보인 ‘페인트 볼 시연’ 영상을 확인할 수 있다.

당시 행사 현장에서 GPU와 CPU의 연산 방식이 어떻게 다른지 보여주는 퍼포먼스가 준비됐다. 바로 페인트 볼을 쏘는 물감총을 준비한 것이다.

컴퓨터의 핵심 하드웨어인 CPU(중앙 처리 장치)는 하나의 물감 총으로 비유됐다. 물감 총을 한 발씩 캔버스에 쏘는 식으로 그림을 완성할 수 있다. 다만 속도는 느릴 수밖에 없다. 그야말로 ‘한 발씩’ 물감을 칠하기 때문이다.

반면 GPU는 여러 물감 총을 한꺼번에 쏘는 방식에 비유됐다. 한 번에 여러 페인트 볼을 쏠 수 있으니 타다닥. 물감을 쏘자마자 그림 한 장이 완성된다. 여러 물감 총을 ‘병렬로’ 배치해서, 여러 데이터를 한 번에 처리해 그 결과를 보여주기 때문에 이미지 및 영상 작업을 처리하는 데 최적이라는 설명이다.

(참고 : 인공지능 시대의 게임체인저: AI 반도체)

이런 구조에서 인공지능은 다량의 데이터를 통해 모델 성능을 키울 수 있다. 인공지능에게 엄청난 양의 ‘강아지 이미지’ 데이터를 입력해서 ‘강아지 이미지의 패턴은 대략 이렇구나’ 훈련시킬 때, 이를 감당할 수 있는 인프라로 GPU가 각광받은 셈이다.

하지만 2022년 11월, 챗GPT가 일반 대중에게 공개되면서 인공지능에게는 또다른 도전 과제가 생겼다. 이제는 ‘미리 학습한 적 없는’ 데이터를 마주했을 때도 제 기능을 해야 하는 상황이 펼쳐졌다. 미리 훈련한 모델로 새로운 데이터를 이해해야 하는 ‘추론’의 중요성이 커진 것이다. 처음 접하는 데이터를 보고도 ‘강아지구나’ 파악하고 대응할 수 있는 AI가 훨씬 유용해진 상황이다.

“AI 추론은 인공지능의 '실행' 부분입니다. 학습된 모델이 학습을 멈추고 작동하기 시작하여 지식을 실제 결과로 전환하는 순간입니다.”

“AI에 새로운 기술을 가르치는 것이 학습이라면, 추론은 AI가 실제로 해당 기술을 사용하여 작업을 수행하는 것이라고 생각하면 됩니다. 사진이나 텍스트와 같은 새로운 데이터를 입력받아 예측과 같은 즉각적인 출력을 생성하거나 사진을 생성하거나 의사 결정을 내립니다.”

“이러한 부분에서 AI가 비즈니스 가치를 제공합니다. AI를 사용해 빌드하는 모든 사람에게 추론을 빠르고 확장 가능하며 비용 효율적으로 만드는 방법을 이해하는 것은 성공적인 솔루션을 만드는 데 핵심입니다.”

- 구글 클라우드 블로그 중에서

실제로 딜로이트 보고서에 따르면, 2026년 AI 컴퓨터 연산 작업의 3분의 2는 ‘추론’에 해당할 것이라는 예측이 나왔다. 시장조사업체 IDC 또한 2025년 말부터 추론에 관한 AI 인프라 투자 비중이 학습을 위한 투자 비중을 넘어설 것이라 전망했다. 앞으로는 ‘얼마나 많은 데이터를 학습했느냐’만큼, 그보다도 ‘그렇게 훈련시킨 AI 모델을 실제로, 효율적으로 써먹을 수 있느냐’가 중요해진다는 관측이다.

“초거대 언어모델을 만드는 기업들이 주목을 받고 있지만, 실제 가치는 AI 모델을 올바른 데이터, 즉 민감하고 가치가 높으며 핵심 비즈니스 정보와 연결해서 (맥락을 만들고 실제로 ‘일할 수 있는’ 추론) 능력에 있다.”

- 오라클 공동창업자, 래리 앨리슨

“(새로운 데이터에서 맥락을 파악할 수 있는) 추론의 품질이 곧 제품의 품질이다. 추론은 제품의 반응 속도, 응답 정확도, 그리고 매일 운영되는 데 드는 비용까지 좌우한다.”

- 벤토ML 창업자, 차오유 양 CEO

(참고 : Forget AI Training: AI Inference Is the Real Money Maker in 2026)
(참고 : 칼럼 | AI의 중심, 학습에서 추론으로 변화하는 이유 | CIO)

굳이 ‘추론 칩’이 따로 필요한가

인공지능 학습을 넘어 ‘추론’이 중요해진 지금. 리벨리온은 이 지점에 출사표를 던지고 있다. 게임, 동영상 등 다양한 분야에서 범용적으로 쓰이는 엔비디아의 GPU와 달리 AI 추론에 최적화한 반도체를 설계하는 전략이다. 엔비디아가 아직 다 커버하지 못하는, 그러면서도 빠르게 커지고 있는 시장에 먼저 깃발을 꽂으려는 모양새다.

박성현 대표는 AI 반도체에 관해 이렇게 설명한다.

“AI는 알고리즘 고유의 패턴들이 있습니다. 만약 100가지 계산 패턴이 있을 때 AI 알고리즘에 쓰이는 건 소수인 5~6가지에 불과하죠.”

“저희가 만드는 AI 반도체는 이 5~6가지를 다른 반도체보다 잘하자는 목적으로 만드는 겁니다. 마치 특정 음식만큼은 다른 곳보다 빠르고 맛있게 만드는 음식점과도 같죠.”

“기존에 여러 업무를 처리하는 데 GPU(그래픽카드)가 쓰였다면, AI 반도체는 그 가운데 특정 업무를 더 빠르고 에너지 효율적으로 처리할 수 있는 서브셋 구조의 칩입니다.”

- 리벨리온, 박성현 대표

(참고 : [이슈체크] 5년차 스타트업, AI반도체 판 흔든다-박성현 리벨리온 인터뷰(1))

이 설명은 왜 ‘추론 칩’이 필요한지, 어째서 엔비디아의 GPU에 대항하는 ‘추론 칩’들이 등장하고 있는지 쉽게 짚어준다.

GPU는 이름부터 ‘그래픽 처리’ 장치다. 90년대 당시 컴퓨터 그래픽, 특히 PC 게임이 3D로 지평을 넓히면서 CPU만으로 연산을 감당할 수 없게 됐고, 이를 기회로 보고 ‘3D 가속기’를 내놓은 여러 업체 중 하나가 엔비디아였다. 처음에는 1인자가 아니었지만, ‘지포스’와 함께 GPU라는 개념을 제시하면서 빠르게 시장을 개척했다.

이후 동영상 편집, 엑셀 스프레드 시트 처리, 암호화폐 채굴(연산 작업), 머신러닝 등 다양한 분야에 활용되면서 ‘범용성’을 띄게 됐다.

(참고 : [창간 30주년 특집 커버스토리②] 26주년 맞은 지포스... 'GPU' 탄생이 바꾼 컴퓨터의 미래)

초창기 엔비디아는 컴퓨터의 모든 연산을 다 하던 CPU 대신 ‘3D 그래픽 처리’를 GPU가, 전문적으로 처리할 수 있다는 걸 강점으로 내세웠다. 이같은 발전 과정은 지금의 추론향 AI 반도체들과 닮았다. 여러 연산 처리에 쓰이는 GPU를 대신해 ‘AI 추론’을 전문적으로 처리하는 방향으로 차별점을 내세우고 있기 때문이다.

“AI 반도체는 특정 업무를 더 빠르고 에너지 효율적으로 처리할 수 있다”는 박 대표의 설명과 일맥상통하는 대목이다.

(1) AI 추론에 최적화하고, 전력은 덜 쓰고

추론에 특화한 AI 반도체는 실용적이다. AI를 실제로 활용하는 데 필요해서뿐 아니라 AI를 사용하는 데 드는 비용을 줄일 수 있기 때문에 경제적이다.

AI 인프라를 만들고 유지하는 데 드는 대표적인 비용은 ‘전력’이다. 폭증하는 AI 사용량을 떠받치기 위해 전기를 어마어마하게 써야 한다. 국제에너지기구(IEA)는 전 세계 데이터센터 전력 소비량은 2024년 415TWh에서 2030년 최대 1000TWh로 증가할 것으로 보고 있다. 그 원인으로 AI 확산을 손꼽는다.

특히나 AI 추론에 드는 고성능 서버는 기존 클라우드 서버보다 전력을 더 많이 쓰는 것으로 알려져 있다. 심지어 추론에 쓰이는 전력이 비추론 모델의 것보다 100배 이상 많다는 연구도 있다. 추론 기능은 갈수록 중요해지는데, 이를 통해 정확한 결과값을 출력하기 위해 더 많은 에너지를 써야 하는 실정이다.

(참고 : AI 확산에 데이터센터 전력수요 ‘2배 이상’ 급증…IEA “전력 병목 선제 대응 시급”)
(참고 : "AI 추론 모델, 비추론 모델보다 100배 더 많은 전력 사용")

이에 따라 ‘비용을 줄일 수 있는’, AI에 최적화한 효율적인 인프라의 필요성이 대두됐다.

일례로, 클라우드 회사 중에서도 AI에 특화한 클라우드 서비스에 집중하는 ‘네오클라우드’ 업체들이 늘고 있다. 기존 클라우드 업체가 스트리밍, IoT 등 종합적으로 IT 인프라 서비스를 제공할 때, “우리는 한 놈(AI 연산)만 팬다”며 뾰족하게 시장을 파고든다. 불필요한 소프트웨어 구성을 과감히 덜어내 오직 AI 모델 학습이나 추론에만 초점을 맞추거나, 친환경 에너지를 써서 에너지 비용을 낮추는 식이다.

“기존 클라우드 서비스 제공 업체는 구조적으로 (이런 접근법을) 따라 할 수가 없어요. AWS가 수백 개의 서비스를 동시에 제공하는 건, 그 모든 서비스를 하나의 복잡한 네트워킹 구조 위에 얹어 놓았기 때문이에요. 이 구조를 허물지 않으면 AI 전용으로 최적화할 수 없고, 허물면 기존 사업 전체가 흔들려요. 이게 대기업의 딜레마예요.”

- 뉴스레터 : 비주류VC

(참고 : AI가 창조한 새로운 구름 트렌드 : 네오클라우드)

리벨리온은 AI 반도체를 설계해서 아예 GPU보다 효율적인 AI 인프라를 선보이겠다고 나선 셈이다. 실제로 엔비디아 칩과 (곧 양산을 앞둔) 자사의 AI 칩을 비교할 때 성능뿐 아니라 “전력”에 관한 언급이 있는 이유도 이 때문이다. 연산 능력은 비슷하면서도 메모리 용량을 소폭 높은, 그리고 전력 소모는 줄여 결과적으로 ‘비용 효율적인’ AI 칩으로 승부한다는 포지션이다.

(참고 : 'AI 추론칩' 강자 리벨리온, 글로벌 실전 테스트 돌입)

(2) 엔비디아의 해자, ‘쿠다’의 틈새를 노려라

더군다나 AI 추론 영역에서는 엔비디아가 아직 해자(Moat, 성벽을 둘러친 도랑)를 완전히 구축하지 못했다. 바로 복잡한 GPU 코딩을 무료로, 좀 더 손쉽게 할 수 있도록 돕는 쿠다(CUDA)에 관한 지점이다.

엔비디아는 단지 반도체만 설계하는 게 아니다. GPU를 활용해 프로그래밍을 할 수 있도록 지원하는 플랫폼도 제공한다. 그게 CUDA다. CUDA에서 코딩을 해서 GPU에서 프로그램을 돌릴 수 있는 구조다. 이 덕분에 접근성이 좋아지면서 GPU는 ‘그래픽 처리’ 장치에서 ‘병렬 연산 처리’ 장치로 발돋움할 수 있었다.

2006년부터 명맥을 이어온 CUDA는 현재 대체재를 찾기 어려운 진입장벽이 됐다. 십수년 째 개발자들이 CUDA와 GPU로 AI 관련 프로그래밍을 하다 보니 노하우와 사용자가 모두 축적됐기 때문이다. 다른 플랫폼으로 갈아타려면 전환 비용이 들 수밖에 없다.

엔비디아 입장에선 내 성 안에 들어온 사람이 나가지 않는, 성 밖의 경쟁자가 침범할 수 없는 성벽(방어막)을 얻은 격이다.

그렇게 CUDA는 400만 명 이상의 개발자가 쓰는 소프트웨어가 됐다. 하지만 AI 추론으로 포커스를 좁히면 이야기가 달라진다. 기존 유저를 꽉 잡아두는 락인(Lock-in) 효과를 보여줬던 CUDA의 영향력이 이 영역에서는 비교적 약하다는 평가를 받기 때문이다. 또한 이미 개발된 AI 모델을 활용하는 단계에서 하드웨어의 중요도가 올라가면서 CUDA의 입지가 흔들릴 수 있다는 분석도 나온다.

“추론의 경우, CUDA에 대한 의존성이 상대적으로 떨어진다. 학습된 모델을 구동시키고 결과를 뽑아내는 것이 핵심이기에, 복잡한 코드를 구현할 필요가 없다. 즉, HW 제작사 입장에서 추상화 레이어(CUDA)를 제공하는 데 품이 덜 든다.”
“또한 추론에서는 성능뿐 아니라 TCO(Total Cost of Ownership: 생애 주기 소유 비용. 이에는 전력 소모, 가격, 부피 등 여러 요소가 포함된다)의 중요성이 높아지기에, 엔비디아 칩이 일부 약점을 지닌다. 이런 틈새를 발견하고, 엔비디아에 대항하는 플레이어들이 등장하고 있다. 마치 과거의 GPU 시장을 보는 듯하다: AI HW 가속기 춘추전국 시대이다.”

- 뉴스레터 : 핀포인트

(참고 : 엔비디아가 '넘사벽'인 이유...“다들 '쿠다'만 찾아”)
(참고 : AI칩이 쏟아져도... NVIDIA 무기 CUDA가 무엇이길래 압도적인가 | 다른 GPU/AI가속기 성능 좋아도 대체가 불가능한 현 상황)
(참고 : 리벨리온: 국내 1위 AI 팹리스 분석 리포트)
(참고 : 추론 시장에서 CUDA는 ‘지원’이 아니라 ‘부담’이다)

리벨리온도 이 포인트에 주목한다. 물론 AI 인프라에서 GPU는 부동의 1위지만, 앞으로 더 커질 AI 추론 시장에서는 왕좌에 도전할 여지가 있다는 관점이다. AI 추론에 딱 맞는, 그래서 효율적인 AI 반도체를 설계해 아직 GPU가 아우르지 못하는 시장에서 점유율을 키우려는 것이다.

엄청난 경쟁이 리벨리온을 기다리고 있다

리벨리온의 엣지는 시장의 응답을 받고 있다. 2023년 당시 27억여 원이었던 연간 매출은 2025년 약 350억 원으로 10배 넘게 커졌다. 기존에 개발한 추론 칩 1세대 제품이 SK텔레콤, KT클라우드, LG전자 등 굵직한 대기업의 AI 서비스를 위해 쓰이면서 딥테크 스타트업으로는 꽤 이례적으로 시장성을 겸비한 모습을 보여줬다.

이처럼 선명한 성장 곡선은 역설적으로 ‘엄청난 경쟁’이 코앞에, 혹은 이미 벌어지고 있다는 의미로도 해석할 수 있다.

(1) 엔비디아 “우리 제품을 넘어서는 건 오로지 신제품뿐”

가장 무서운 경쟁사는 아무래도 엔비디아다. 지난 16일(현지시각) ‘GTC 2026’ 컨퍼런스에서 젠슨 황 CEO는 ‘추론 칩’을 공개했다. 실리콘밸리 AI 반도체 설계 스타트업인 그록(Groq)에 약 170억 달러(한화 25조 원)를 지불하고 기술 라이선스를 사들여, AI 추론에 특화한 칩을 처음 공개한 것이다.

그록은 리벨리온과 마찬가지로 추론에 방점을 둔 반도체로 엔비디아와 겨루려 했던 딥테크 스타트업이었다. 구글에서 AI 연삽을 위한 칩 TPU(텐서) 시리즈를 만드는 데 일조했던 엔지니어, 조나단 로스가 창업한 회사로, 2016년부터 이 분야에 집중해왔다. GPU와 다른 칩 구조로 스포트라이트를 받았던 곳이다.

20조 단위 계약. 엔비디아 역사상 최대 규모의 거래액을 이끌어낸 그록의 주요 경영진이 엔비디아에 합류해 엔비디아 제품과 그록의 칩 설계를 통합하는 작업을 맡게 됐다. 사실상 ‘인수’에 가까운 결정이다. 그만큼 엔비디아가 GPU의 약점을 인지하고, 경쟁자들이 추론 시장에 뛰어들고 있다는 점을 파악하고 있다는 걸 알 수 있다.

엔비디아의 이런 행보는 엔비디아가 자신들의 약점을 이해하고 있으며, 강점에 안주하지 않으려 한다는 신호다. “자사 제품은 자사 신제품으로 대체해야 한다”는 젠슨 황 CEO의 말처럼, AI 시장의 무게중심이 추론으로 이동하는 걸 놓치지 않고 과감한 의사결정을 내린 것. 비유하자면, 스타트업 리벨리온은 그냥 골리앗과 싸우는 게 아니다. ‘민첩한’ 골리앗에 맞서 경쟁하고 있는 격이다.

“기술 산업에 종사한다면 스스로 끊임없이 혁신해야 합니다. 그렇지 않는다면 서서히 죽어가는 것과 다름없습니다. 엔비디아는 분명 엄청난 수익을 내며 성공적으로 제품을 만들고 있지만, 어떻게 그 제품을 ‘자사 신제품’으로 대체(Cannibalize)할 것인가 문제가 남아있습니다.
만약 우리가 과거의 제품을 넘어서지 못한다면 다른 누군가에게 대체될 테니까요. 시장의 리더가 되고 싶다면 주도적으로 내 제품을, 아이디어를 뛰어넘어야 합니다.”
- 엔비디아 공동창업자 : 젠슨 황 대표

*첨언 : 다만 엔비디아의 ‘반독점 규제 해당 여부’는 변수로 작용한다. 최근 미국 의회에선 엔비디아가 그록을 실질적으로 인수하는 행위가 ‘시장 독과점’에 해당한다는 주장이 나오며 관련 조사에 들어갈 조짐을 보이고 있다.

(참고 : [단독] 리벨리온, 작년 매출 전년比 3.4배 성장한 350억원… “국가대표 팹리스 발돋움”)
(참고 : Nvidia prepares AI ‘inference’ chip launch to counter rising challengers)
(참고 : AI 반도체 절대강자 엔비디아에 도전하는 Groq 이야기)
(참고 : 미 의회, 엔비디아 그록 인수 제동…반독재·독과점 조사 착수)

(2) 클라우드 빅테크 기업 “자체 반도체 칩 만들겠다”

글로벌 경제지 FT는 엔비디아의 그록 인수를 두고 “세계에서 가장 가치 있는 기업인 엔비디아가 구글과 같은 고객사들이 자체 AI 칩을 개발하면서 스타트업 기업들의 도전에 직면하고 있는 상황에서 내린 선택”이라고 짚었다.

말인즉슨, 엔비디아의 GPU와 AI 반도체를 쓰는 핵심 고객인 빅테크 기업들이 고객에 머무르지 않고 라이벌이 되려는 채비를 한다는 뜻이다. 이는 AI 반도체로 경쟁력을 살리려는 리벨리온에게 하나의 골리앗이 아닌, 여러 골리앗이 서있다는 의미기도 하다.

앞서 그록을 소개하며 언급한 구글의 TPU는 자체 인공지능 연산에 최적화한 주문형 칩(ASIC)이다. 구글이 제미나이나 나노바나나 같이 성능 좋은 인공지능 서비스를 깜짝 공개할 수 있었던 배경에 이러한 자체 하드웨어 역량, 거기에 더해 클라우드 인프라까지 갖췄다는 강점이 깔려있다.

작년 연말 구글 클라우드 팀은 7세대 TPU ‘아이언우드’를 출시한 바 있다. 이때 AI 추론 성능을 극대화하는 서비스 구성을 선보여 이목이 쏠렸다. 시장 흐름에 발빠르게 대처하는 모습이다. 여기에 부응하듯 앤트로픽 같은 AI 서비스 기업이나 메타(페이스북) 같은 라이벌 빅테크 기업이 TPU를 공급받고 있다.

구글 클라우드는 엔비디아 GPU의 최대 고객이면서도 동시에 GPU를 대체하는 AI 반도체 경쟁자로 떠오르고 있다.

(참고 : Google launches Ironwood TPU to challenge Nvidia in AI inference market)
(참고 : 메타, AI 학습에 TPU도 쓴다…자체 칩 전략은 폐기)

전통적인 클라우드 강자인 아마존 AWS도 엔비디아와 비슷하게, 1세대 AI 반도체 스타트업 세레브라스 시스템즈(세레브라스)와 손을 잡았다.

2015년에 설립된 세레브라스는 한 변의 길이가 22cm에 달하는, 거대한 정사각형 모양의 칩을 개발해 화제가 됐던 스타트업이다. 지난 2월에는 시리즈 H 투자를 유치하며 기업 가치 33조 원을 돌파했고, 여러 미국 국가기관에 이어 오픈AI와도 전략적 제휴를 맺었다. 2024년에 철회했던 IPO 소식을 다시 전하며, 2026년이 AI 반도체에 힘이 실리는 해임을 증명하고 있다.

가장 규모 있는 AI 반도체 스타트업이 아마존과 협력한다는 점은 이 시장에서 합종연횡이 이어질 것으로 예고와 같다. AI 반도체 효율에서 엔비디아의 (GPU가 아닌) AI 반도체 제품 성능보다 더 좋은 성적을 거둔 소기업이 2010년부터 엔비디아와 협력해온 AWS와 동맹을 맺어 새 시장의 파이를 가져오는 모양새. 이처럼 치열한 각축전이 벌어지는 한복판에 리벨리온이 있다.

(참고 : 아마존, 세레브라스 '거대' AI칩 도입…추론단계 분리해 효율화)
(참고 : 과학계 이어 오픈AI까지 사로잡은 美 세레브라스, AI 반도체 업계 신화 쓸까)

앞으로 J커브를 그리며 도약하려면

쉽지 않은 판에 들어선 리벨리온. 하지만 리벨리온 팀은 자신감을 드러낸다. 올해 코스닥 상장을 목표로 본격적으로 사전 작업에 들어갔고, 나스닥 상장까지도 염두에 두고 있다. 이익을 내는 상황이 아님에도, 공모를 통해 자금력을 확보해서 사업을 더 본격적으로 키우겠다는 승부수다. 여기에 힘을 실듯 6000억 원 규모의 프리IPO(상장 전 지분 투자)가 이뤄지고 있다.

"리벨리온의 제품이 모두 추론향으로 설계돼 고객사의 데이터센터 프레임에 바로 적용될 수 있어 기업이 스스로 AI 인프라를 컨트롤 할 수 있다. 또한 오픈소스를 활용할 수 있는 부문을 자사 제품에 대거 도입해 사용하기 쉬운 데다 적은 에너지로 구현해 전력 효율성이 굉장히 높다는 강점이 있다."

- 리벨리온, 박성현 대표

(참고 : 설립 5년 만에 기업가치 2조원 회사로 성장한 리벨리온…비결은)

J커브에 대한 리벨리온의 자신감은 현실이 될 수 있을까? “그냥 GPU 쓰면 되잖아요”라는 질문에 기꺼이 대안을 제시하기 위해선 현재 리벨리온의 강점을 살리고, 약점을 보완하는 복잡한 셈법을 풀어야 한다.

(1) 투자사를 핵심 고객이자 전략적 파트너로

리벨리온은 ‘상용화 레퍼런스’를 강점 중 하나로 꼽는다. 2023년부터 SK텔레콤 등 유수 대기업 서비스에 AI 인프라를 제공한 대규모 상용화 경험치가 있다는 것이다. 여기에 더해 2025년 SK텔레콤의 AI 반도체 계열사 사피온코리아를 인수합병하는 등 적극적으로 네트워크를 넓히며 차별화를 모색해왔다.

(참고 : 韓 AI 반도체 '유니콘' 탄생…리벨리온·사피온 합병법인 출범)

이러한 상용화 경험은 투자사이면서 핵심 고객인 국내 대기업과의 긴밀한 협업 관계에서 비롯됐다. 이는 투자 관계로도 연계돼 있다. 예컨대, 삼성전자는 설계부터 칩 제조까지 함께 하며 리벨리온의 전략적 파트너 역할을 톡톡히 하고 있다. 그 연장선상에서 지난해 말 시리즈C 투자에는 삼성벤처투자와 삼성증권이 신규 투자자로 합류했다.

그래서 리벨리온에 투자한 반도체 유관 기업은 향후 리벨리온이 외연을 넓히는 네트워크라고 볼 수 있다. 대표적인 팹리스 기업 암(Arm)이 리벨리온에 전략적 투자자로 합류하면서 아시아·태평양 지역 스타트업에 처음 발을 들인 것이 하나의 예시다. 향후 리벨리온이 글로벌로 무대를 넓힐 때 AI 인프라를 구축하는 파트너사로 매력적인 한 수다.

소위 “피를 섞는” 방식으로 핵심 고객을 투자사이자 전략적 파트너로 삼는 리벨리온의 성장 전략은, 마치 엔비디아가 그록을 인수하고 아마존이 세레브라스와 힘을 합치는 것처럼 유리한 고지를 점하려는 움직임이다.

“기업주주들은 리벨리온의 적극적인 구매자 역할을 해주고 있습니다. 리벨리온의 2023년 매출은 99.7%가 KT그룹에서 발생했습니다. 2024년 매출은 53.3%가 SK그룹에서, 25.8%가 KT그룹에서 나왔죠.”

“그밖에 리벨리온은 사우디아라비아의 아람코에서도 투자를 받았습니다. 아람코는 CVC(기업형 벤처캐피탈)인 와에드벤처스를 통해 리벨리온에 200억원을 투자했습니다. 지분율은 적지만 아람코의 데이터센터 사업과 맞물리면서 둘 사이 밀접한 협력이 예고된 상황입니다. 아람코 역시 지난해부터 리벨리온의 PoC(개념검증)을 진행하고 있습니다.”

- 유니콘팩토리 고석용 기자

(참고 : "대기업 투자는 약? 독?" 상반된 전략의 두 라이벌 [비하인드 칩스] - 유니콘팩토리)
(참고 : 리벨리온 vs 퓨리오사 AI, 투자 히스토리로 보는 AI 반도체 ‘빅딜’ - THE VC)
(참고 : 국내 AI 반도체 2강, 퓨리오사 vs 리벨리온)

(2) 소버린 AI 추세를 적극 활용할 수 있다면

정부가 AI 스타트업을 밀어주는 분위기도 리벨리온에 긍정적으로 작용할 수 있다. 특히나 AI 기술과 관련 인프라를 자국에서 독자적으로 운영해야 한다는 ‘소버린 AI’ 흐름은 AI 컴퓨팅 자원을 공급하려는 리벨리온을 국가 차원에서 지원하는 훈풍이 되고 있다.

실제로 국민성장펀드의 첫 직접 지분 투자처로 리벨리온이 유력하다는 이야기가 나오고 있다. 2025년 연말 공식 출범한 이 펀드는 “대한민국 경제의 재도약과 첨단 전략산업의 주도권 확보”를 위해 마련된 정책기금이다. 무려 150조 규모. 이 펀드가 주로 다루는 산업 중 인공지능과 반도체는 빠질 수 없는 이름인데, 리벨리온은 그 두 가지를 모두 갖춘 스타트업에 해당한다.

프리IPO 단계에서 국민성장펀드, 산업은행 등이 등판하면서 리벨리온은 기업 가치를 2조7000억 원으로 인정받았다. 총 6000억 원이 모여야 하는 라운드에 절반을 정부와 기관이 부담하고, 나머지는 민간 자본으로 구성하는 중이다. 미래에셋, IMM인베스트먼트 등 나머지 3000억 원을 함께 투자할 투자사들의 면면도 공개되면서 프리IPO가 순항하는 중이다.

‘거품’이라 불릴 정도로 몰아치는 AI 시장의 성장세, 그 뿐아니라 그 성장세를 내재화해야 한다는 문제의식은 미국에서 한국으로 돌아와 리벨리온을 세운 창업자들에게 희소식이다. MIT, 인텔, 스페이스X를 거쳐 모건스탠리에서 엔지니어로 일하던 박 대표가 과감히 한국행을 택한 결정이 (우연히, 그러나 꽤나 잘 어울리는) ‘소버린 AI’와 맞아떨어지며 J커브를 향한 발걸음으로 이어졌다.

“미국에서 창업했다면 여러 스타트업 중 하나였겠지만, 한국에 들어오기로 결정하면서 큰 관심을 받았습니다. 무엇보다 한국의 훌륭한 반도체 생태계를 이용할 수 있다는 생각에 변함이 없습니다.”

- 리벨리온 박성현 대표

(참고 : “한국 AI는 한국이” 소버린 AI가 스타트업에 미치는 영향)
(참고 : 매출 50억 퓨리오사…국민성장펀드 무산 위기 - 딜사이트)
(참고 : [단독] ‘국민성장펀드 지분투자 1호’ 유력 리벨리온 프리IPO에…IMM·인터베스트 합류)

(3) 소프트웨어 약점은 극복해야 할 숙제

마냥 장밋빛 미래만 예견돼 있는 건 아니다. CUDA가 엔비디아의 해자 역할을 하는 것처럼 리벨리온에게도 해자가 필요한데, 거기에 일조할 만한 소프트웨어가 아직은 부재하다는 게 업계 중론이다. 리벨리온 소개 문구에 “AI 반도체와 컴파일러(소프트웨어)를 설계한다”고 적혀있지만, 아직 소프트웨어 역량은 보강해야 한다는 후문이다.

“하드웨어의 화려한 지표 이면에는 '소프트웨어 성숙도'라는 뼈아픈 과제가 남아 있다. (...) 가장 큰 문제는 소프트웨어 최적화의 난이도다. 칩이 가진 잠재적 최고 성능을 이끌어내기 위해서는 개발자가 매우 복잡하고 까다로운 최적화 과정을 수동으로 거쳐야 한다.”

“이는 세계 개발자들이 엔비디아에 종속될 수밖에 없게 만든 '쿠다(CUDA)'의 압도적인 편의성과 극명하게 대비되는 지점이다. 결국 산업 현장에서 활용되기 위해서는 컴파일러 등 소프트웨어 스택의 자동화와 편의성 확보가 리벨 성공의 선결 과제인 셈이다.”

- 지디넷코리아 : 전화평 기자

소프트웨어 파트를 보강하기 위해 리벨리온 팀은 분주하게 움직이고 있다.

일례로, 글로벌 오픈소스 솔루션 기업 레드햇과 함께 AI 플랫폼을 공개한 것. 리벨리온 칩을 기반으로 AI 추론에 잘 맞는 하드웨어와 모델 서비스까지 제공하는 접근이다. 이번 협업으로 리벨리온은 “하드웨어부터 모델서빙까지 오픈소스를 이용하여 통합되고 검증된 추론 플랫폼을 제공해, GPU 중심의 환경을 넘어 NPU 기반 추론 인프라의 새로운 대안을 제시하겠다”고 밝힌 바 있다.

흥미롭게도, 앞서 AI 추론 시장에서 소프트웨어 영향력을 키워야 한다고 여겨졌던 엔비디아는 (AI 하드웨어 스타트업을 인수했을 뿐 아니라) 개방형 AI 모델을 고도화하는 전략을 취하고 있다. GPU에 잘 맞는 AI 모델 일부를 공짜로 풀어서 개발자나 연구자들이 쉽게 AI 애플리케이션을 (GPU를 활용해서) 만들 수 있도록 지원하는 한편, GPU 의존도는 꾸준히 높이겠다는 계산이다.

파산 위기에 직면하면서까지 CUDA를 놓지 않았던 엔비디아는 40조 원 규모에 가까운 자금을 투자해 또 다시 소프트웨어 해자를 만들려 하고 있다. AI 반도체 성능으로 엔비디아 GPU를 앞질렀다는 평가를 받는 리벨리온 입장에선 소프트웨어 분야에서도 더는 지체할 수 없는 상황. 칩 설계와 양산, 고객사 확보와 자금 마련에 더해 또다른 역량을 요구받으며 ‘왕관의 무게’를 견뎌야만 한다.

(참고 : 엔비디아, ‘오픈 웨이트 AI’에 260억 달러 투입…CUDA 생태계 방어)
(참고 : 리벨리온, 레드햇과 기업용 ‘AI 플랫폼’ 공개… “NPU 추론 인프라 대안 제시”)

‘반도체 슈퍼사이클’이라는 표현이 다시 등장할 정도로 AI와 반도체 업계 모두 들썩이고 있다. 새로운 기술 패러다임이 새로운 시장을 열고, 새로운 시장이 기업에 역사를 다시 쓸 수 있다는 기대감이다. 춘추전국시대, 요란한 거품 속에서 전에 없던 비즈니스가 탄생한다는 걸 90년대 IT 버블 이후 우리는 여러 차례 목격했다.

리벨리온은 AI와 반도체를 향한 기대감이 기우가 아니라 현실이 될 수 있다고 말한다. “J커브의 초입에 들어섰다”는 문장은 산업 추세에 따른 전망일 수도 있으나, 성장 곡선을 기어코 만들어내겠다는 의지의 표명이기도 하다. 그런 의지와 기개가 있는 창업 팀이 시대를 만났을 때 이름을 남기는 기업이 등장했다. 리벨리온은 그 이야기의 주인공이자 장본인이 되고자 한다.

“그냥 GPU를 쓰면 되지 않을까?”라는 질문은 어쩌면 우문일지 모른다. 오히려 GPU를 만드는 엔비디아가 먼저 AI 추론이라는 새로운 스테이지를 준비하는 지금, 먼저 그 지평을 넓히려는 리벨리온의 행보에 귀추가 주목된다.

김지윤 eo · 에디터

이 글을 읽고 당신이 용기를 얻기 바라요.

팔로우 🙌 커피챗

EO팀

eo studio 3달 전

김지윤 님의 아티클이 EO 뉴스레터에 실렸습니다. 이번 주 이오레터를 확인하세요!

>>> https://stib.ee/D5vL

답글