이 글은 ‘튜링 포스트 코리아’에 발행된 주간 뉴스레터에서 발췌했습니다.
AI 기술, 산업, 스타트업, 그리고 사회적 영향 등에 대해 관심있으시다면 ‘튜링 포스트 코리아’ 구독 부탁드립니다.
새해맞이 준비운동: 관심을 가져야 할 핵심적인 AI 개념들
챗GPT가 2022년 11월 공개된 이후 전 세계적으로 LLM 개발 경쟁이 지금까지도 가속화되고 있죠. 지난 주 있었던 오픈AI의 o3 발표 역시 AI 커뮤니티에 큰 충격을 줬는데요. ARC-AGI 챌린지와 FrontierMath 벤치마크에서 보여준 놀라운 결과는 추론, 검색, 평가, 그리고 AGI라는 난해한 목표를 둘러싼 논쟁을 다시 불러일으키고 있습니다.
2025년에는 또 어떤 이슈들이 많은 분들의 관심을 받게 될까요? 주목하고 관심을 가져야 할 만한 몇 가지 핵심적인 주제에 대해서 이야기해 볼까 합니다:
강화 학습 (Reinforcement Learning), 실험실을 벗어나 현실로
게임, 시뮬레이션을 위한 분야로 시작했던 강화 학습이, 이제는 노이즈가 많고 복잡하고 예측하기 어려운 ‘실제 환경’에서의 자율성을 담보하기 위한 핵심 기법이 될 것인가 하는, 의미있는 전환 단계에 들어서고 있습니다.
이 전환을 부드럽게 잘 이뤄낼 것이냐 하는 문제는 생각만큼 간단하지는 않을 수 있는데요. 강화 학습의 중요 문제 중 하나인 ‘Reward Function Misspecification (보상 함수의 잘못된 설계)’ 때문에 우리가 전혀 의도하지 않은, 때로는 의도와 정반대의 행동을 유도하지 않도록 하면서, 어떻게 여러 에이전트들을 하나의 목표로 이끌어갈 수 있을까요?
Reward Engineering (보상 엔지니어링) 그 자체가 이제는 단순히 ‘결과’ 뿐이 아니라 그 결과가 어떻게 달성되는지에까지 초점을 맞추는, 섬세하고 세련된 기술이 되어가고 있습니다. 계속해서 변화하는 목표에 맞춰서 지속적으로 재조정하는 Dynamic Reward System (동적인 보상 시스템)이 바로 더 스마트하고 반응성도 높은 에이전트를 만드는 길을 열어주고 있는 겁니다.
또, 한때 체스나 바둑 같은 게임의 영역으로만 여겨졌던 ‘트리 탐색 (Tree Search)’ 기법도 나름의 새로운 르네상스를 경험하고 있는 것 같습니다. 트리 탐색 기법이 다양한 계획 수립, 의사 결정 과정에서 유용하게 적용될 수 있다는 것이 확인되면서, 강화 학습, 심지어는 AutoML과도 교집합을 만들어내고 있습니다.
‘추론 (Inference)’의 새로운 지평: 진화하는 적응형 지능으로의 길
‘추론 (Inference)’. 머신 러닝 작업의 전체 라이프사이클 관점에서, 전통적으로 ‘추론’은 모델이 예측값을 출력하거나 결정을 내리는, ‘정적인 (Static)’, 최종의 지점이었죠. 이제는 그 ‘추론’ 자체가 아주 동적인 (Dynamic) 과정으로 변했습니다.
AI가 맥락을 이해하고 상황에 맞춰 적응하면서 추론을 하는 이런 변화는 AI의 새로운 장을 열었지만, 동시에 새로운 도전도 함께 가져왔죠.
가장 큰 과제는 바로 컴퓨팅 자원을 어떻게 효율적으로 활용할 거냐와 밀접하게 관련되어 있습니다. 몇몇 거대 언어모델들은, 심지어 작은 도시 하나가 쓰는 만큼의 전력을 사용한다는 점을 생각해 보면, 실제 사용 환경에서 컴퓨팅 연산을 효율적으로 하는 건 꽤 중요한 문제라고 하겠습니다. 다행히, 경량화된 트레이닝 방법, 데이터 증강 (Data Augmentation) 기술 등이 계속 발전하면서, 과도하게 자원을 사용하지 않고도 AI의 성능과 적응력을 유지할 수 있는 길이 열리고 있습니다.
결국은, 고성능 서버에서뿐 아니라 우리가 일상적으로 사용하는 스마트폰, 웨어러블 기기, IoT 장치 등에서도 AI를 활용할 수 있게 될 겁니다. 그리고, 이런 흐름은, 자연스럽게 AI 발전의 새로운 전환점이 될 ‘연합 학습 (Federated Learning)’의 혁신으로 이어집니다.
연합 학습: ‘분산화된 지능’으로 가는 패러다임
‘연합 학습 (Federated Learning)’이 AI 분야에서 협업의 개념을 완전히 새롭게 정의하게 될 겁니다. 민감한 데이터는 로컬 저장소에 안전하게 보관하면서도 분산된 환경에서 모델 학습을 할 수 있다는 특징 덕분에, 연합 학습은 의료나 금융과 같이 프라이버시가 중요한 분야에서 필수적인 기술로 자리잡고 있습니다.
그렇지만, 그 잠재력은 이 영역들을 훨씬 뛰어넘습니다. 멀티 에이전트 시스템에서의 연합 학습은 분산된 협업을 할 수 있도록 해 주고요. 강화 학습 분야에서도 마찬가지입니다. 연합 학습 기술을 통해서 엣지 디바이스나 독립된 시스템 등 다양한 환경에서 작동하는 에이전트들이 각자 계속해서 경험을 쌓으면서도, 동시에 전체 모델의 성능 향상에 기여할 수 있습니다.
Localized Adaptability (로컬의 적응성), 그리고 Global Optimization (전체 최적화)을 결합한 연합 학습이 차세대 AI의 핵심 기술로 확실히 자리잡을 겁니다. 단순한 개인정보 보호 도구를 넘어서, 다양한, 그리고 자원이 제한된 환경에서도 AI의 가치를 발휘할 수 있게 해주는 포괄적인 프레임웍으로 자리잡고 있습니다. 특히 연합 학습은 앞으로도 계속 중요 키워드의 하나가 될 ‘AI와 블록체인의 결합’ 관점에서도 하나의 중요 기술로 각광받으리라 생각합니다.
복잡성의 시대, AI 추론 능력의 확장
*편집자 주: 영어로 ‘Inference’와 ‘Reasoning’이 모두 한글로는 ‘추론’ 외에는 적합한 단어가 없는 것 같은데요. 이 글의 맥락 안에서는, 간단하게 Reasoning은 추론 그 자체를, Inference는 추론의 과정이나 행위 전체를 이야기할 때 사용하는 단어라고 생각해 주시면 좋겠습니다.
AI 시스템이 점점 더 ‘사람과 비슷하게 보이는’ 추론 작업을 수행할 수 있게 되면서, ‘데이터 기반의 학습’과 ‘논리적인 규칙 기반 추론’을 결합한 '뉴로-심볼릭 (Neuro-Symbolic)' 접근 방법이 유망한 연구 분야로 떠올랐습니다. 이런 하이브리드형 기법은, 직관과 구조화된 논리를 함께 사용하는 사람의 사고방식과 맞닿아 있고, 더 보편적인 형태의 AI를 만들어낼 수 있는 가능성을 보여준다고 생각합니다.
동시에, ARC-AGI 챌린지 같은 새로운 벤치마크들이 AI의 추론 능력을 검증하는 시험대로 등장하고 있습니다. 단순히 AI가 뭘 할 수 있느냐를 넘어서, 추상화나 일반화를 얼마나 잘 하고, 서로 다른 다양한 영역을 넘나들면서 추론을 할 수 있나를 측정합니다. 이런 벤치마크들은, ‘AI의 발전이라는 게 단순하게 개별 작업을 뛰어나게 잘 하는 걸 넘어서 지능 그 자체에 대해 더 깊은 이해를 하게 해 주는 것이다’라는 점을 생각해 보게 해 주는 것 같습니다. ARC-AGI를 만든 Francois Chollet은 2025년에 ARC-AGI 2를 공개하겠다고 예고하고 있습니다.
ARC-AGI, 그리고 지능을 어떻게 측정할 것인가에 대한 튜링 포스트 코리아의 포스트가 궁금하시면 아래 링크를 한 번 참고해 보시기 바랍니다:
공간 지능 (Spatial Intelligence): AI가 물리적 세계를 이해하다
‘공간 지능’. 차세대 AI가 가져야 할 핵심 능력입니다. 이건 AI 시스템이 물리적인 공간, 기하학, 그리고 3차원에서 공간과 사물의 관계를 이해하고 추론할 수 있게 해주는 능력인데요. 로봇 조작, 증강 현실 등 실제 세계에서 상호 작용해야 하는 AI 시스템이라면 이런 능력이 필수적입니다.
최신의 AI 아키텍처들은 공간과 관련된 추론을 더 잘 처리하는 방향으로 진화하고 있죠. 트랜스포머가 어텐션 메커니즘을 통해서 ‘관계성’을 모델링하는데 뛰어난 성능을 보여주었고, 뉴럴 필드 (Neural Fields)라든가 그래프 신경망 (Graph Neural Networks) 등 특화된 아키텍처들은 공간적 데이터를 처리하는데 강점을 보여줍니다.
최근에 맘바 (Mamba) 같은 상태 공간 모델 (SSM; State-Space Model)들이 등장해서 공간 처리 능력을 보완해 주고 있는데요. 이런 모델은 순차적 데이터가 증가하더라도 선형적으로 확장할 수 있어서 - 즉, 연산 부담이 기하급수적으로 증가하지 않아서 - 효율적으로 데이터를 처리할 수 있습니다. 공간의 이해 능력과 결합된다면, 이런 모델이 동작을 계획한다거나, 환경을 매핑하고, 실시간으로 물체를 추적한다거나 하는 작업에 필요한 ‘시공간 추론’을 할 수 있습니다.
맘바 아키텍처에 대해서 좀 더 궁금하신 분은, 아래 포스트를 참고해 보셔도 좋겠습니다:
Topic #2: 트랜스포머의 대안으로 불리는, 'Mamba' 아키텍처는 무엇인가?
퀀텀 컴퓨팅이 열어갈 미래
자, 한편 퀀텀 컴퓨팅은 최적화라든가 시뮬레이션 분야에서 다양한 혁신의 도구가 될 거라는 기대를 일으키면서 발전하고 있죠. Variational Quantum Algorithm, 그리고 Quantum-Aware Neural Architecture는 AI와 퀀텀 시스템이 함께 진화하면서, 지금 불가능해 보이는 문제들이 해결되는 미래가 다가올 거라는 뜻이죠.
Quantum-Enhanced Reinforcement Learning 같은 새로운 분야는, 다이나믹 시스템 기반의 의사결정 방식을 혁신할 수 있고, 신약 개발, 기후 모델링, 암호학 같은 대규모의 조합을 다루는 문제를 어떻게 더 효율적으로 해결할 수 있을지 탐구하는 연구자들도 많이 생겨나고 있습니다.
퀀텀 하드웨어가 발전하고 성숙해 가면서, 아마도 연구의 초점 자체가 ‘전통적 AI’와 ‘퀀텀 알고리즘’이 상호 보완하는 ‘하이브리드 워크플로우’ 구축이라는 방향으로 이동하게 될 겁니다. 이런 방식의 결합이 완성된다면, AI가 발현할 수 있는 능력의 새로운 지평을 또 새롭게 열게 되겠죠.
전세계적으로도, 그리고 무엇보다 우리나라도 여러 가지 혼란스러운 상황이 눈 앞에 놓여 있지만, AI 영역은 거침없이 발전과 확산의 길을 걷고 있는 것만 같습니다. 우리 인류에게 ‘의미있는’, ‘긍정적인’ 사건이 가득한 2025년이 되기를 바래 봅니다!