안녕하세요, 웹 브라우저 내의 반복 업무를 자동화하는 에이전트 '제오나(Xeona)'를 만들고 있는 제오노스 김양훈입니다.
지난 글에서 저희 프로덕트가 왜 '실행 단계에서 AI를 배제(Chat2Node)'하는 구조적 결단을 내렸는지 공유했었는데요. 많은 분들이 공감해 주셔서, 오늘은 그 결단을 내리기까지 제가 겪었던 약간의 '인지 부조화'와 현타(?)에 대한 개인적인 메이커 스토리를 나눠보려 합니다.
< 학계의 시선: "더 똑똑하고 창의적인 모델을 만들자" >
저는 꽤 오랜 시간 AI와 자동화라는 주제에 빠져 살았습니다. 학부에서 Automation를 전공했고, 대학원에서는 AI 기반의 자연어 생성(NLG) 모델을 연구 주제로 박사 학위를 받았습니다. 이후 자산운용사에서 AI 기반 펀드를 만드는 일도 했었죠.
학교와 연구실에서 제가 바라보던 AI의 핵심은 ‘생성 능력과 창의성’이었습니다. 어떻게 하면 모델이 문맥을 더 깊이 이해하고, 사람처럼 자연스럽고 유려한 텍스트를 만들어낼지가 지상 과제였습니다. 즉, AI를 최대한 똑똑하게, 자율적으로 사고하도록 만드는 것이 제 연구의 목표였습니다.
< 야생의 B2B 시장: 기존 RPA의 한계, 그리고 AI 만능주의 >
그러다 현존하는 RPA(로봇 프로세스 자동화) 툴들이 시장에 충분한 효용을 주지 못하고 있다는 문제의식을 느끼고 이번 창업의 여정을 시작했습니다. 처음엔 자신만만했습니다.
"기존 RPA는 사람이 일일이 세팅해야 하니 멍청해. 내가 연구하던 최신 LLM을 붙여서, 한 마디만 하면 알아서 웹브라우저를 열고 업무를 다 처리하는 초지능 에이전트를 만들자!"
기술적으로는 꽤 멋진 그림이 그려졌습니다. AI가 사람 대신 웹 페이지의 구조를 파악하고, 스스로 다음 액션을 계획하는 모습은 제법 미래지향적이었습니다.
< 뼈아픈 깨달음: 99번의 성공보다 1번의 엉뚱한 클릭이 더 무섭다 >
하지만 실제 고객들이 웹 자동화를 필요로 하는 현장의 니즈는 저를 비롯한 연구자들의 마인드셋과는 완전히 달랐습니다.
고객이 매일 아침 사내 시스템에 접속해 엑셀 데이터를 다운받고 입력하는 업무를 맡긴다고 가정해 봅시다. 여기서 고객이 원하는 건 'AI의 뛰어난 문제 해결 능력'이 아닙니다. 비가 오나 눈이 오나, AI의 기분이 좋으나 나쁘으나 무조건 100% 동일한 버튼을 누르는 ‘통제 가능한 하네스’였습니다.
LLM이 아무리 똑똑해져도 본질적으로 확률 모델인 이상, 100번 중 1번은 엉뚱한 곳을 클릭할 수 있는 변동성을 내포하고 있습니다. 창의적인 글쓰기에서는 이 변동성이 축복이지만, 매일 돌아가는 스케줄링 자동화에서는 치명적인 버그이자 신뢰도 하락의 원인이었습니다.
< 결단: 프로덕트를 위해 기꺼이 AI를 덜어내다 >
자동화의 본질은 결국 '통제 가능성'과 ‘일관성’입니다.
이 뼈아픈 깨달음 끝에, 저는 제가 가장 오래 공부했던 AI의 자율성을 프로덕트의 핵심 작동 과정에서 기꺼이 덜어내기로 결정했습니다.
그 결과물이 지난번 공유했던 Chat2Node입니다. AI의 뛰어난 언어 능력은 초기 시나리오를 설정할 때 사용자의 허들을 낮추는 데에만 100% 활용하고, 정작 자동화가 돌아갈 때는 AI의 개입을 완전히 차단해 기계적인 일관성을 유지하는 구조입니다.
최신 기술을 듬뿍 발라 멋진 AI 에이전트를 만들고 싶었던 연구원의 에고를 버리고, 고객의 문제를 확실하게 해결하는 '도구'로서의 본질에 집중하게 된 것이 창업 후 제가 얻은 가장 큰 레슨이었습니다.
요즘 LLM API를 활용해 다양한 프로덕트를 만드시는 메이커 분들이 많을 텐데요. 기술의 화려함에 취하기보다, 우리가 푸는 문제의 본질이 '창의성'인지 '일관성'인지 한 번쯤 고민해 보는 계기가 되었으면 좋겠습니다.
저희가 AI를 덜어내고 깎아 만든 제오나의 시나리오 세팅 영상도 슬쩍 남겨둡니다. 기술이나 프로덕트에 대한 피드백은 언제나 큰 힘이 됩니다!