2024년 3월, 일론 머스크는 이런 예언을 한다.
“AI의 발전을 막을 것들은 충분히 예측 가능합니다. 작년에는 칩이었고 다음은 변압기일 겁니다. 2025년 3월이면 AI가 변압기를 다 써버릴 거예요.”
호기심이 마구 샘솟았다.
- 변압기가 뭐지?
- 왜 부족해지는 거지?
…
- AI와는 무슨 관계지?
이 의문의 연결고리 “?” 를 알아내기 위해 엄청난 기대와 찬사를 받고 있는 AI의 무대로 가보자.
스포트라이트가 쫘악 내리쬐는 무대 위에는 chatGPT, Gemini 같은 슈퍼모델들이 박수갈채를 받고 있다. 무수한 인파를 지나쳐서, 무대 뒤를 가리고 있는 치렁치렁한 커튼을 걷으면..
땀을 뻘뻘 흘리며 24시간 중노동하고 있는 데이터센터가 있다!
중간 다리를 알았으니, 이제 우리는 “AI와 데이터센터”, “변압기와 데이터센터” 간의 관계를 파헤쳐 일론의 예언을 좇을 것이다.
먼저, “데이터센터”에 대해 더 살펴보자.
"데이터센터" = 멈추면 디지털 세상도 멈춤
사실 우리나라 국민이라면 데이터센터를 알 수 밖에 없는 사건이 있다.
2022년 10월 SK C&C 데이터센터 화재로 인해 카카오톡, 카카오페이 등 카카오의 핵심 서비스가 마비된 사건이다. 완전 복구까지 무려 127시간 소요되었고, 디지털 인프라가 데이터센터에 얼마나 깊게 종속하고 있는지 알게 해주었다.
덕분에 우리는 데이터센터가 정확히 무엇인지는 몰라도,
“이게 멈추면 디지털 세상도 멈추는구나. 그만큼 중요하구나.” 까지는 알게 되었다.
이제 우리의 질문은,
“그래서 저 데이터센터랑 AI랑 뭔 상관인데?” 로 이어진다.
AI에겐 연산 능력이 필요해
AI의 학습과 추론은 엄청난 연산 능력을 필요로 한다. chatGPT가 자연어를 유창하게 뱉기 위해서 필요한건 숫자와 계산이다.
우리 인간이 볼 때는 왼쪽의 자연어로 보이고, AI에겐 오른쪽의 벡터로 보인다. LLM은 수백 차원의 벡터를 가지고 행렬 연산을 하며 우리의 질문에 가장 적절하다고 계산되는 결과를 뱉어낸다.
수백 차원의 벡터를 가지고 계산하는 것이 얼마나 복잡한지 실감이 안 날 것이다. 상대적으로 간단한 4x4 행렬 간의 곱셈을 보자.
4x4 행렬 곱셈만 해도 이렇게 복잡한데, 수백 차원의 벡터를 여러 개 조합하고 행렬 연산을 수행하는 과정은...🙂 하여간 엄청난 연산 능력을 필요로 하는 셈이다!
실제로 사용하는 에너지를 보면 얼마나 많은 연산을 수행하는 지 추정할 수 있다. 우리가 질문을 하나 보낼 때마다 chatGPT는 구글 검색의 열배에 해당하는 에너지를 쓴다. 이는 GPT-4 기준이므로, o1의 경우는 거기에 더하여 몇 배의 에너지를 쓰고 있을 것이다.
자 그럼 이 어마어마한 양의 연산을 누가 해줄까? NVIDIA가 난리난 이유. 그렇다, 바로 chip이다! 구체적으로는 GPU나 TPU가 이 연산을 담당한다. 그리고 이 칩들을 삼삼오오, 아니 수십만 개 모아놓은 시설이 바로 데이터센터다.
짠. 이 사진은 일론 머스크의 xAI가 세운 멤피스 데이터센터 속 사진이다. 서버랙이 줄지어 서있는 모습인데, 하나의 서버랙에는 총 64개의 Nvidia H100 GPU가 들어간다. 그리고 이 데이터센터에는 총 10만개의 H100 GPU가 배치돼있다. 우리가 “우와! AI 대박이다..” 라고 감탄하는 그 이면에는 GPU들의 열일이 있었다!
이제 AI와 데이터센터 간의 관계를 정리해보자.
AI의 이 미친 성능을 위해서는 엄청난 연산 능력이 필요하다. 이를 위해선 다음과 같은 요소들이 갖춰져야 한다.
- 연산을 할 chip💽
- 그 chip에게 줄 전기⚡
- 뜨거워진 chip을 냉각하기 위해 쓸 물💧
- 레이턴시를 줄일 초고속 네트워크🌐
이런 인프라가 싹 갖춰진 시설이 필요하고, 그걸 우리는 데이터센터라고 부르고 있는 것이다. 즉, 데이터센터를 통해야만 AI가 이토록 미친 성능을 보여줄 수 있다!
오케이. “AI가 변압기를 다 써버리는 이유”를 알아내기 위해서, 이제 딱 하나의 연결고리만 더 알아내면 된다. 바로 “변압기와 데이터센터” 간의 관계다. 그리고 그 중심엔 전기⚡가 있다!
전기의 단위
// Wh(와트시)에 대해 알고 계시다면 다음 섹션으로 넘어가시길!
전기에 대해 본격적으로 이야기하기 전에, 와트시(Wh)라는 단위에 대해서 알아야 한다. 와트(W)랑은 완전 다른 개념이다. W(와트)는 “전력”을 표기하기 위한 것이고, Wh(와트시)는 “쓴 에너지의 양”을 표기하기 위한 것이다.
위 그림을 보라. 왼쪽 수도꼭지에서는 물이 콸콸콸 나오고, 오른쪽 수도꼭지에서는 한방울씩 나온다.
각각의 수도꼭지 밑에는 바구니가 있어서, 나온 물을 다 받고 있다.
같은 시간 동안 물을 틀면 어느 쪽 바구니에 더 물이 많이 담길까?
그렇다. 왼쪽 바구니다.
이제 “물”을 에너지라고 생각해보자.
에너지를 소비하는 속도는 곧 전력이므로, 전력(W)이 높은 쪽은 왼쪽 수도꼭지다. 바구니에 담긴 물은 소비한 에너지 총량(Wh)을 의미한다. Wh는 W에 ‘에너지를 사용한 시간’을 곱하여 구하기 때문에, 같은 시간 사용했다면 왼쪽이 더 많은 에너지를 소비하는 것이다.
이제 다시 돌아가보자. “데이터센터와 변압기 간의 관계”를 이해하러!
데이터센터 = 전기 먹는 하마
데이터센터는 수십만 개의 칩을 24시간 최대 성능으로 돌려야 한다. 하이퍼스케일 데이터센터의 경우 시간당 100MWh의 에너지를 소비할 정도다. 이게 어느 정도일까?
놀라지 마시길, 우리나라 기준 178,000 가구가 소비하는 에너지와 맞먹는다..! 2023년 기준 대한민국 평균 가구원 수는 2.2명이고, 중소 도시 기준이 10만 명 이상이기 때문에 .. 하이퍼스케일의 경우 중소도시 3~4개가 쓰는 전기를 하나의 시설이, “단 하나”의 시설이 다 쓰고 있는 거다. 홀리 쉣!
자 일단 다들 놀란 마음을 진정시키고, 우리가 주의 깊게 봐야 할 것은 “그 엄청난 양의 전기가 어떻게 데이터센터로 오는가” 이다.
자 이 그림이 바로 “전기의 생애”다. 발전소에서 태어나서 우리 집까지 오는 동안 전기는 꽤 긴 여행을 한다. 그림 속에 있는 숫자가 보이시는가? 저게 바로 “전압”이다. 오늘의 주인공 변압기는 바로 이 전압을 바꿔주는 녀석이다.
그런데 잠깐!
전압?
// 전압에 대해서 잘 아는 분들은 바로 다음 섹션으로 넘어가시길.
우리는 전압에 대해 단 하나의 명제만 알면 된다.
“기기가 요구하는 전압과, 기기에 전달되는 전기의 전압이 동일해야 한다. 무조건.”
필요 전압보다 더 높더라도, 더 낮더라도 문제가 생긴다. 딱 정확한 전압이 들어가야만 한다. 그래서 우리가 쓰는 대부분의 복잡한 전자기기에는 내부에 소형 변압기 혹은 컨버터가 있다. 전자회로나 기타 전기를 쓰는 정교한 장치에 딱 필요한 전압으로 전달해주기 위해서다.
왼쪽에 스마트폰의 경우에는 보통 안에 컨버터가 들어가 있고, 오른쪽에 핸드폰 충전기에는 소형 변압기가 있어서 220V를 5V로 바꿔준다. 전자기기들마다 필요한 전압이 있기 때문에 변압기는 사실 우리 주변에 아주 흔하다.
“기기가 요구하는 전압과 기기에 전달되는 전압이 같아야 한다” 라는 포인트를 확실히 인지했다면 이제 전압의 정의를 엄밀히 얘기해보자. 수압과 비교하면 더 잘 이해할 수 있다.
우리는 수도가 연결되지 않은 수도꼭지를 가지고 수압이 어떤지 이야기하지 않는다. 수도를 연결하고 물을 틀어보고 나서야 알 수 있다. 수압은 결과이자 현상이기 때문이다. 전압은 아니다. 우리는 아직 전선을 연결하지 않은 배터리에 대해서도 1.5V니 9V니 하며 전압을 말할 수 있다. 이는 전압이 “지금 작용하고 있는 압력”이 아니라, “이만큼 압력을 줄 수 있다!” 라는 잠재적인 능력을 의미하기 때문이다. 전압을 영어로 potential difference 라고 부르는 이유이기도 하다.
“이만큼 힘을 줄 수 있어!” 라는 전압이 일치하지 않으면, 전기를 받을 대상은 생각보다 너무 강한 전기를 받아 박살나거나, 필요한 것보다 현저히 약한 힘으로 전기를 받아 이상하게 작동할 수밖에 없다.
데이터센터가 받는 전기는 “고”전압이다.
다시 전기의 생애로 돌아오자. 우리는 지금 “데이터센터와 변압기의 관계”에 대해 파헤치고 있다.
발전소에서 22000V(22kV)의 고전압으로 응애-하며 태어난 전기는 바로 변전소로 이동한다. 변전소(substation)는 전기의 전압을 바꿔주는걸 목적으로 하는 시설이며, 당연히 전압을 바꿔주는 설비인 “변압기”가 여럿 배치돼있다. 그것도 아주 대형으로. 처리해야하는 전기의 양이 상당하기 때문이다.
근데 어라? 변전소에서 22kV의 전압을 345kV로 올려 버린다. 이상하지 않은가? 실제로 쓰는 전압은 그보다 훨씬 낮은데, 왜 굳이 전압을 올릴까?
이는 매우 경제적인 선택이다. 낮은 전압의 전기는 송전하려면 전선의 굵기가 더욱 굵어져야하며, 송전 과정에서의 손실도 커진다. “송전의 경제성”을 위하여 전압을 화끈하게 올리는 것이다. 실사용을 위해서는 그보다 한참 낮은 전압이 필요하므로, 전기는 이동하면서 전압을 점차 낮추게 된다. 그렇게 결국 가정에 보급될 때는 우리가 쓰는 전압인 220V로 도착한다.
하지만 전기를 많이 쓰는 시설의 경우에는 얘기가 다르다. 송전의 효율성을 위해서, 어마어마한 양의 전기를 필요로 하는 시설에는 고압으로 전기를 보낼 수밖에 없다. 위 그림에서 보면 “공장”이 그 예시다. 이들은 15만 4천 볼트라는 초고압으로 전기를 받는다. 아마 슬슬 직감하고 있을 것이다. 데이터센터도 바로 그런 시설이고, 따라서 초고압으로 전기를 받아야 한다.
자, 데이터센터가 154kV로 전기를 받았다. 여기까지는 좋다. 아주 충분한 양의 전기를 받았고 이제 연산을 시작하면 된다. 그런데 실제로 전기를 써야 하는 우리의 chip들, GPU들은 얼마의 전압을 필요로 할까?
…
0.6V다.
154,000V의 전기를 받았는데, 0.6V가 필요한 것이다. 꺅-
그래서 일론이 이런 말을 한거다.
“If you've got 100-300 kilovolts coming out of a utility and it's got to step down all the way to 0.6 volts, that's a lot of stepping down.”
이것이 데이터센터와 변압기 간의 관계다. 저 엄청난 고압을 0.6V라는 저전압으로 쫙 낮춰주어야하기 때문에 - 구체적으로는 강압기 (step-down transformer)가 엄청나게 필요해진다.
우리는 이로써 변압기 - 데이터센터 - AI의 관계를 이해했다. 하지만 “왜 AI가 변압기를 다 써버린다는 건지"를 완벽히 이해하지는 못했다. 이제 이걸 파헤쳐보자. 먼저 변압기에 대한 수요를 파헤쳐보자.
데이터센터 하나를 지을 때 필요한 변압기 개수는?
우리는 xAI가 멤피스 데이터센터를 짓기 위해 얼마만큼의 변압기를 필요로 할지 추정해 볼거다. 단 한개의 데이터센터를 짓는데 얼마나 많은 변압기가 필요한지를 파악해보는 것이다.
200kV의 고압을 0.6V의 전압으로 낮추기 위해서는 여러 단계가 필요하다. 차근차근 조금씩 낮추어가는 것인데, 여기서 나는 의문이 들었다.
“왜 한번에 안 내리지?”
그렇지 않은가. 한번에 전압을 쫙 내리면 편하기도 하고, 딱 한 종류의 변압기만 있으면 되고..
이 의문을 해결하기 위해서는 먼저 변압기의 원리를 이해해야 한다. 원리 자체는 사실 아주 간단하다.
자 이게 변압기의 핵심 구조인 코어와 권선(코일)이다. 저 중간에 있는 네모난 물체를 “코어”라고 하며 보통 철에다가 규소를 섞은 규소강으로 만든다. 즉, 아주 강한 자성을 띠는 금속이라는 것.
그리고 코어에 주황색으로 뺑글뺑글 감겨있는 건 구리선이다. 이걸 권선 혹은 코일이라고 한다. 물리를 배운 분들에겐 아주 익숙할 것이다.
구성 요소 설명은 끝났으니, 이제 실제로 변압을 해보자.
- 교류 전류 입력 : 1차 권선 (Primary Windings)에 교류 전류를 인가한다. 이때 앙페르의 법칙에 따라 자기장이 생긴다. 만약 코어, 즉 쇳덩어리가 없었다면 자기장은 그냥 퍼져버릴 것이다. 하지만,
- 자속 전달 : 규소강은 강자성체다. 즉 엄청나게 강한 자성을 띤다. 강자성체에서 자기장은 집중되고 강화되므로 강자성체를 따라 자기장의 경로를 형성하고 효율적으로 전달해줄 수 있다. 덕분에 자기장은 2차 권선 (Secondary Windings) 까지 전달된다. 자기장이 코일에 닿는 순간!
- 전자기 유도 : 이제 그 유명한 패러데이의 전자기 유도 법칙이 나올 타이밍이다. 코일이 감겨 있는 상태에서 자기장의 변화가 생기면? “시간에 따라 변화하는 자기장이 전기를 발생시킨다”는 법칙에 따라 2차 코일에 유도 전압이 발생하고, 이에 따라 전류가 흐른다!
이 과정을 거치고 나면.. 전압이 변한다!
‘전압이 어떻게 변화하는가’는 코일을 얼마나 감았는지의 비율 (권수 비율) 에 따라 결정된다. 왼쪽 코일에 더 감겨 있으면 전압은 낮아지고, 오른쪽 코일에 더 감겨 있으면 전압은 높아진다. 비율의 차이가 클수록 변압의 폭도 크다.
추가 질문) “아니 전압을 이렇게 쉽게 올릴 수 있으면 전기 무한 증식 가능한거 아닌가?”
아쉽게도 ‘전력’은 그대로다. “전력 = 전압 x 전류” 이며, 변압 과정에서 전압이 오른 경우 그 비율에 맞춰 전류가 줄어든다.
그래서, 왜 한꺼번에 전압을 내리면 안되는 거지?
다시 돌아와서!
우리가 이 원리를 본 이유는, “왜 한꺼번에 전압을 내릴 수 없는가”를 이해하기 위함이었다.
코일을 감은 수의 비율이 곧 변압의 비율이기 때문에, 만약 10만V에서 0.6V로 한번에 전압을 낮춘다고 하면 ..
이 비율이 무려 166,670 : 1 정도 된다. 즉 1차 권선에는 수십만 번 구리선을 감고, 2차 권선에는 딱!! 한 두 번만 감아야 한다는 거다. 딱 봐도 뭔가 이건 아닌것 같지만, 과학적으로 보면 더욱 말도 안되는 일임을 알게 된다.
요게 아크라는 건데, 10만V부터 발생하는 현상이다. 이게 뭐냐면 - 전압이 엄청나게 높은 경우에, 원래 절연 성질이 있는 공기의 절연을 파괴해버리고 공기로 전류가 흐르는 거다. 멀리서 보면 그냥 멋있어 보이는 현상이지만, 실제로는 온도가 5천도에서 2만도까지 오르기 때문에 주변의 금속을 싹다 녹여버릴 수도 있고, 화재 위험, 폭발 위험, 그리고 감전 위험까지 거의 종합 재해 세트다.
이뿐만 아니라, 권선 비율의 차이가 클수록 코어 손실과 전기 저항 손실도 커지기 때문에 변압기 효율성이 극도로 낮아진다.
따라서! 한번에 전압을 낮출 순 없다. 욕심을 버리고 한 단계씩 천천히 낮추자😂
이제 그 변압의 단계를 찬찬히 보자. 멤피스 데이터센터를 만들기 위해 필요한 변압기 숫자를 추정하기 위해서!
변압의 과정 (단계별)
먼저,
- 100kV → 10kV : 지역 전력망에서 100kV 이상의 고전압 전기가 시설 외부에 위치한 변전소로 공급된다. 변전용 변압기(Substation Transformer)들이 이를 중간 전압인 10kV~20kV 로 변환한다. 이제 이 전기가 데이터센터 내부로 들어간다.
- 10kV → 480V : 데이터센터 내부에 있는 배전 변압기가 이를 480V로 변환한다. 이 전기는 전력 분배 장치 (Power Distribution Units)를 통해 서버 랙에 분배된다.
- 480V → 12V DC : 각 서버 랙에는 전원 공급 장치(PSU)가 있다. 이 장치가 입력 전압 480V를 서버 부품이 필요로 하는 전압 (예: 12V)로 변환하며, 이때 직류 전기로 변환된다.
이제 12V를 chip이 필요로 하는 저전압으로 바꾸는 과정을 보자.
멤피스 데이터센터에는 Nvidia H100 칩 10만개가 있다. 위 사진이 H100 GPU의 내부 사진인데, 흰색 글자가 가리키는 곳에 VRM (Voltage Regulator Module)이 장착돼있는걸 볼 수 있다. 얘가 12V DC를 0.8V나 1.2V로 변압한다.
(VRM이란, 전압 레귤레이터를 모듈 형태로 구현하여 chip의 회로 구조 속에 넣을 수 있도록 만든 것을 의미한다. 총 8개가 달려 있는데, 이는 모듈을 병렬로 구성하여 전력 공급 능력을 확장하기 위함이다.)
자 그러면 이 중에서 데이터센터를 짓기 위해 필요로 하는 변압기는 뭘까?
- 대형 변압기 (변전용 변압기)와 중형 변압기 (배전 변압기)
그리고, ‘변압기’는 아니지만 전압을 바꿔주는 역할을 수행하는 애들이 있었다.
- PDU 및 PSU
PDU와 PSU는 변압기가 아니므로 관심사가 아니다. 우린 주로 변전용 변압기와 배전 변압기에 중점을 두고 살펴보자.
변압의 과정을 대략적으로 살펴보았으니, 멤피스 데이터센터를 위에서 내려다 보며 확인해보자.
노란색 부분이 외부에 있는 변전소다. 여기로 지역 전력망에서 10만 볼트 이상의 고압 전기를 받는다. 이 장소에는 변전용 변압기가 여럿 위치하며 이 변압기들을 통해 중간 전압으로 변환된 전기는 시설 내부로 공급된다.
사진의 글자를 자세히 보면, 처음 건설 당시에는 8MW 정도의 전력만을 변압할 수 있었지만 몇 달 뒤 50MW 까지 늘어났고, 2025년에는 150MW의 처리 용량을 가진 엄청난 규모의 변전소를 지을 계획이라고 한다. (점선 참고)
이제 본론으로 돌아와서, 이제 본격적으로 이 데이터센터를 위해 필요한 변압기의 수를 추정해보자. 현재 위 사진에서 알 수 있듯 xAI는 2025년까지 150MW의 처리 용량을 가진 변전소를 지을 예정이다. 멤피스의 전력을 관리하는 TVA는 이미 150MW 전기 사용을 승인했다. 따라서, 우리는 150MW에 맞추어 필요 변압기 개수를 추정할 것이다.
미리 말씀드리자면, 이건 100% 정확한 추정이 아니다. 실제 수치는 중복 설계, 선호하는 변압기 크기, 지역 규정, 그리고 데이터 센터의 등급 분류 등에 따라 달라지기 때문이다.
먼저 대형 변전용 변압기부터 시작해보자.
변전용 변압기 개수를 추정해보자
멤피스에 위치한 데이터센터는 일반적으로 지역 전력 회사인 TVA로부터 전기를 공급 받는다. TVA는 이런 대형 시설에 115 kV, 161 kV, 230 kV 셋 중 하나로 전기를 공급한다. 이 고압을 12kV~20kV 사이의 중간 전압으로 변환하는 것이 이 변전용 변압기의 역할이다.
150MW라는 전력을 처리하기 위해서는 몇 개의 변전용 변압기가 필요할지 추정해보자. 일반적으로 이 정도의 대용량 전력을 다루는 시설에서는, 각각의 변압기가 대략 30~80 MVA를 커버한다. 이건 각 기업의 디자인 철학에 따라 다르다. 우리는 50MVA 인 경우와 80MVA 인 경우를 각각 생각해볼 것이다.
잠깐, MVA(메가볼트암페어)는 또 뭐야?
// MVA가 궁금하지 않다면 스킵해도 됨!
이 단위는 변압기의 용량을 나타낸다. 즉, 변압기가 처리할 수 있는 전력량을 의미한다. 굳이 MW가 아닌 MVA 를 사용하는 이유는, MW는 유효 전력만을 고려하고 MVA는 유효 전력에 무효 전력까지 더한 복합 전력을 고려하기 때문이다.
전력에는 무효 전력과 유효 전력이 있다. 무효 전력은 사실 영어로 보면 좀 더 직관적인데, Reactive Power라고 한다. 즉 실제적인 일을 하기 위해 사용되는 게 아니라, 어떠한 반응을 위해서 사용되는 전력을 의미한다. 변압기의 경우에는 ‘자기장 형성’이라는 반응을 위한 것이다. 변압을 위해서는 1차 권선에서 유도 전류를 통해 자기장을 발생시켜야 함을 기억하는가? 이 자기장을 형성하기 위해 에너지를 주고 받는 과정에서 Reactive Power가 필요하다고 이해하면 된다.
변압기는 유효 전력뿐만 아니라 이러한 무효 전력도 처리해야하기 때문에, 용량을 MW가 아닌 MVA로 표현하는 것이 더 유용한 것이다.
다시 변전용 변압기 개수를 추정해보자
데이터센터들은 보통 안정성을 위해 최소 필요 개수보다 1개 정도의 여유분을 둔다. 이를 N+1 형태의 중복 (Redundancy) 설계라고 한다. 우리는 멤피스 데이터센터가 N+1 중복 설계를 선택했다고 가정할 것이다.
150MW의 전력을 커버해야하고, 역률은 0.9라고 가정하자. 역률은 무효 전력을 고려하기 위한 factor 이며, 이를 통해 필요한 복합 전력량(MVA)을 구할 수 있다.
⇒ 150 / 0.9 = 166.7MVA 이므로 최소 166.7MVA의 처리 용량을 확보해야 한다.
변전용 변압기의 개별 처리 용량에 따라 개수는 달라진다.
- 80MVA 인 경우, 최소 3개가 필요 (총 240MVA) ⇒ 총 4개 (N+1)
- 50MVA 인 경우, 최소 4개가 필요 (총 200MVA) ⇒ 총 5개 (N+1)
“에게?” 하실 수도 있지만.. 다음 글에서 대형 변전용 변압기를 만드는 과정을 함께 보면, 이 4-5개가 얼마나 엄청난 것인지 알 수 있을 것이다😂
배전 변압기의 개수를 추정해보자
자 드디어 전기가 데이터센터 내부로 들어왔다! 이들을 맞아주는건 배전 변압기다. 얘가 이제 10만 볼트 되는 전압을 480V로 바꿔줄 것이다.
일반적으로 배전 변압기의 처리 용량은 2~5MVA 정도이므로, 우리는 4MVA로 가정해보자. 변전용 변압기와 마찬가지로 최소 166.7MVA의 처리 용량을 확보해야한다.
4로 나누어보면, 최소 42개의 배전 변압기가 필요함을 알 수 있다. 추가로 N+1의 Redundancy 전략을 채택하여 45개 정도를 배치하면 된다.
앞서 말했듯, 기타 PDU 및 Server PSU는 변압기가 아니므로 넘어가겠다.
정리해보면!
멤피스 데이터센터를 150MW의 용량으로 짓기 위해서는
- 대형 변전용 변압기 5개
- 배전 변압기 45개
가 필요하다!
이게 ‘단 하나’의 데이터센터를 짓기 위해 필요한 변압기임을 기억하자.
“수요” 가 얼마나 폭발적으로 증가하는지 알기 위해서 지금 전 세계적으로 데이터센터의 숫자가 얼마나 빠르게 늘고 있는가를 보자.
데이터센터를 미친듯이 지어라!
전 세계적으로
올해 700억 달러 규모를 형성하고 있는 데이터센터 시장은 내년 1000억 달러를 뛰어 넘을 전망이다. 해외건설협회에서는 “내년에는 계획 중인 데이터센터 프로젝트가 올해 대비 6배 이상, 공사 중인 프로젝트는 2배 이상 증가할 것으로 예상된다”고 말하고 있다. 연간 성장률을 나타내는 CAGR은 11.6%에 달할 정도다.
100MW 이상의 전력 소모를 하는 하이퍼스케일 데이터센터의 경우 2026년까지 1200개에 달할 것으로 알려져 있다. 2021년 기준으로는 700개였다.
대한민국의 경우도 마찬가지
한전의 ‘전기사용예정통지’ 제도를 통해 확인할 수 있다. 이는 데이터센터 건립을 위한 사전절차이며, 5메가와트 이상의 대규모 전기 사용자에게 전기 공급 가능 여부를 한전이 사전에 검토하는 제도다. 2023년 4월 말 기준 무려 1224건이 접수되었다.
빅테크의 폭풍 경쟁
데이터센터에 대한 수요 증가는 당연히 “AI” 때문이다. 빅테크들은 마치 이 싸움에서 지면 자신들의 위상을 잃어버릴 것처럼 모든 걸 걸고 임하고 있다. 덕분에 지금 새로 생기는 AI 데이터센터들은 기존 것과 아예 체급이 다르다.
마이크로소프트는 2023년 10월에 100억 달러 이상을 클라우드 용량을 위해 쏟아부었으며, 그들의 데이터 센터가 감당할 수 있는 규모를 2배 높이려고 계획 중이라고 말한 바 있다. 그들은 이 엄청난 대 투자로도 충분하지 않다고 여긴 것 같다. 불과 며칠 전, 마이크로소프트는 2025년에 무려 800억 달러를 AI 데이터센터에 투자하겠다고 밝혔다.
사실 우리가 방금 본 일론 머스크의 xAI가 새로 만든 멤피스데이터센터도 H100 칩 10만개를 구매하는 데에만 60억 달러를 태웠다😂
이 경쟁 덕분에 AI에 쓰이는 컴퓨팅 파워는 기하급수적으로 늘고 있는 추세다. 연구자들은 최근에 AI 모델을 훈련하기 위한 컴퓨팅 파워가 9달마다 2배가 되고 있다고 밝혔다.
이미 지어 놓은 데이터센터 규모도 커지는 중
새로 짓는 데이터센터만 AI에 집중하고 있는 건 아니다. 기존 데이터센터도 발빠르게 규모를 키우고 성능을 높이고 있다. 덕분에 데이터에 따르면, 이미 존재하는 데이터센터들의 평균 서버 랙의 밀도가 증가하고 있다. 아직 대부분의 시설은 8kW 이하의 수준이며 30kW 이상의 고밀도 랙을 운영하는 데이터 센터는 소수에 불과하지만, 더 높은 전력 밀도를 요구한 워크로드가 증가하면서 분명 더 많은 센터가 고밀도 랙을 채택할 것이다.
쓰는 전기 자체가 늘고 있다..!
데이터센터가 쓰는 전기가 크게 늘고 있다는 것도 주목해야 한다. 변압기가 감당해야 할 용량 자체가 커진다는 것은? 변압기에 대한 수요가 늘어난다는 뜻이기 때문이다. 일각에서는 다음 3년 동안 데이터센터가 소비하는 전력이 160% 증가할 것이라 예상하고 있다.
빅테크들은 왜 이렇게까지 하는가?
AI가 인류 역사상 최고의 기술 혁명이 될 것이라는 점은 확실하다. 일론 역시도 이것이 “지금까지 경험해보지 못한 혁신”이 될 거라고 말했다.
문제는 이 시장이 ‘승자독식시장’이 될 가능성이 높다는 것이다. AI는 도움은 되지만 의미는 없는, 위 표에서는 1번 영역에 해당하는 프로덕트다. 1번 영역은 대체로 승자독식시장의 범주에 들어가기 마련이다. 아마존이나 쿠팡과 같은 커머스 플랫폼이 대표적으로 이 영역에 속한다.
우리는 gpt나 cluade, gemini 중에 뭘 쓸지를 정할때 의미를 생각하지 않는다. 뭐가 더 쓸모 있는가, 즉 “뭐가 더 도움이 되는가”를 따진다. gemini를 개발한 스토리나 openAI의 브랜드 이미지를 성능보다 우선시하는 사람이 있던가? 우린 결국 “더 좋은 모델”을 쓸 뿐이다.
승자독식시장은 ‘패자’가 되면 모든 걸 잃는다는 리스크가 있는 대신, ‘승자’가 되면 엄청난 파이를 가져갈 수 있다는 이점이 있다. 이를 누구보다 잘 알고 있는 빅테크들이기에 미친 경쟁을 할 수밖에 없는 것이다. 덕분에 데이터센터도 엄청나게 짓고, 또 그 규모도 미친듯이 늘리고 있다.
“변압기”는 chip 만큼 필수적
이미 전 세계는 변압기 전쟁 중이다. 대표적으로 변압기를 생산하는 기업으로는 HD현대일렉트릭이 있는데, 현재 5년치 주문이 밀려있다. 지금도 구글, 마소, 아마존 등 유수의 빅테크들이 앞다퉈 문의를 하고 있는 상황이다. 미국 내에서도 변압기의 공급 이슈는 매우 심각하며, 위 기사에서는 이를 “critical” 하다고 표현하고 있다. 대형 변압기의 경우에는 5년까지 기다려야할 정도라고 하며, 평균 2년에서 4년의 대기는 기본이다.
정리
일론이 쏘아 올린 “AI와 변압기 간의 관계”를 이해하기 위해, 우리는 그 중간에 데이터센터를 두고 연구를 진행했다.
- AI의 연산 능력을 위해서는 데이터센터가 꼭 필요하며,
- 데이터센터의 핵심 일꾼인 GPU 들에게 알맞은 전압으로 전기를 제공하기 위해서는 변압기가 꼭 필요하다.
그리고 AI 시장에서 지배권을 얻으려는 빅테크들의 미친 경쟁으로, 데이터센터에 대한 수요는 폭발적으로 증가하고 있다. 당연히 “필수 설비”인 변압기의 수요 또한 미친듯이 늘고 있다.
우리는 이번 글에서 “수요” 측면에서 변압기 부족 현상을 바라본 셈이다.
하지만!
여전히 우리에겐 해결해야 할 질문이 하나 있다. 바로,
“아니, 그러면 변압기 생산량을 팍팍 올리면 되는거 아닌가?”
변압기가 무슨 신이 내려주는 성물도 아니고, 겨울에만 나오는 특산품도 아니고, 그냥 공장에서 찍어내면 되는 공산품 아닌가? (실제로 난 처음에 이렇게 생각했음😂)
다음 글에서 우리는 왜 변압기 공급량을 팍팍 올릴 수가 없는지, 왜 변압기 하나 사겠다는데 대기를 무려 5년까지 해야하는지 알아볼 것이다. 아주 엔지니어링적이고 복잡하지만, 그럼에도 놀랍도록 재밌으니 많은 기대 부탁드린다.
1편 끝!
긴 글 읽어주셔서 감사합니다. 새해 복 많이 받으셔요~!