‘자체 개발 AI’라는 말, 어디까지 믿어야 할까

“자체 개발 모델을 사용했다.”

AI 스타트업을 소개하는 영상이나 기사에서 종종 등장하는 표현이다. 얼핏 들으면 그 회사가 모델을 처음부터 끝까지 직접 만들었다는 뜻처럼 들린다. 데이터를 모으고, 모델 구조를 설계하고, 대규모 GPU를 투입해 파운데이션 모델을 학습하고, 이후 서비스에 맞게 고도화했다는 이미지가 따라온다. 그런데 실제 AI 산업의 현장은 그렇게 단순하지 않다.

요즘 투자 현장에서는 AI 스타트업을 바라보는 하나의 이분법이 있는 것 같다. 직접 파운데이션 모델을 from scratch로 학습한 회사가 아니면, 나머지는 모두 LLM Wrapper 기업이라는 시각이다. 물론 이 구분은 어느 정도 필요하다. 단순히 GPT API를 호출해 화면만 씌운 서비스와, 독자적인 기술 자산을 쌓아가는 회사는 분명 다르다.

문제는 그 사이에 존재하는 넓은 스펙트럼이 너무 쉽게 지워진다는 점이다.

네이버도, 스타트업도 같은 질문 앞에 선다

최근에는 네이버 같은 대형 기술 기업조차 특정 영역에서는 외부 모델이나 해외 모델을 활용했다는 이야기가 나오면서, “그렇다면 어디까지를 자체 모델이라고 부를 수 있는가”라는 질문이 더 복잡해졌다.

네이버 정도의 기술력과 자본력을 가진 회사도 모든 모델을 완전히 독자적으로 확보하기 어려운 상황이라면, 그보다 훨씬 작은 스타트업이 “자체 개발 모델을 만들었다”고 말할 때 투자자들이 의문을 가지는 것은 자연스럽다.

“정말 자체 모델이 맞나?”
“그냥 오픈소스 모델을 가져다 쓴 것은 아닌가?”
“결국 GPT API를 감싼 Wrapper 아닌가?”

이 질문들은 가볍게 넘길 수 없다. 투자자는 기술의 실체를 확인해야 하고, 창업자는 자신이 만든 기술 자산을 정확히 설명해야 한다. 다만 문제는 “자체 개발 모델이냐 아니냐”라는 질문이 너무 거칠다는 데 있다.

AI 모델 개발은 0과 1로 나뉘지 않는다.

자체 모델은 하나의 상태가 아니라, 여러 층위의 축적이다

“자체 개발 모델”이라는 표현을 제대로 이해하려면 최소한 몇 가지 층위를 나눠볼 필요가 있다.

첫 번째는 완전 독자 파운데이션 모델이다. 자체 데이터와 자체 학습 인프라를 바탕으로 대규모 언어모델이나 멀티모달 모델을 처음부터 학습한 경우다. 이 수준은 당연히 기술적 난도가 높고, 자본도 많이 든다. 전 세계적으로도 가능한 기업은 많지 않다.

두 번째는 오픈소스 기반 자체 학습 모델이다. Llama, Qwen 같은 공개 모델을 기반으로 하되, 자체 데이터로 추가 학습하거나 도메인 특화 모델로 고도화하는 방식이다. 파운데이션 모델을 처음부터 만든 것은 아니지만, 특정 산업이나 업무에서는 충분히 독자적인 성능과 활용 가치를 만들 수 있다.

세 번째는 도메인 특화 파인튜닝 모델이다. 금융, 의료, 제조, 법률, 콜센터, 반도체 테스트처럼 특정 도메인의 데이터와 업무 흐름을 반영해 모델을 조정하는 경우다. 이때 중요한 것은 단순 파인튜닝 여부가 아니라, 어떤 데이터를 가지고, 어떤 태스크를 풀도록 만들었고, 기존 모델 대비 어떤 성능 개선을 입증했는가다.

네 번째는 RAG와 에이전트 구조를 포함한 서비스형 모델 시스템이다. 이 경우 모델 자체보다 더 중요한 것은 검색, 권한 관리, 지식 출처 추적, 프롬프트 체계, 툴 호출, 워크플로우 실행, 평가 자동화, 로그 기반 개선 구조다. 겉으로는 외부 LLM을 쓰더라도, 실제 서비스 품질은 이 주변 시스템에서 결정되는 경우가 많다.

다섯 번째는 평가·검증·운영 최적화 역량이다. 모델을 잘 만드는 것만큼 중요한 것은 모델이 실제 업무 환경에서 안정적으로 작동하는지 검증하는 일이다. 환각을 얼마나 줄였는지, 금칙 응답을 얼마나 잘 막는지, 지연시간과 비용을 어떻게 관리하는지, 실패 케이스를 어떻게 다시 학습 데이터로 전환하는지가 핵심 경쟁력이 될 수 있다.

이 모든 층위를 하나로 뭉뚱그려 “자체 모델이냐, Wrapper냐”로만 판단하면 실제 기술 내재화 수준을 제대로 보기 어렵다.

Wrapper라는 말이 너무 쉽게 쓰이고 있다

물론 Wrapper 기업은 존재한다. 기존 LLM API를 호출하고, 간단한 UI와 프롬프트만 얹은 뒤, 마치 독자 기술처럼 포장하는 경우도 있다. 이런 기업은 기술적 방어력이 약하고, API 제공사의 정책이나 가격 변화에 크게 흔들릴 수 있다. 하지만 모든 외부 모델 활용 기업을 Wrapper라고 부르는 것도 위험하다. 예를 들어 어떤 회사가 외부 LLM을 사용하더라도, 자체적으로 다음과 같은 자산을 가지고 있다면 이야기는 달라진다.

자체 구축한 고품질 도메인 데이터가 있는가.

모델의 답변 품질을 지속적으로 평가하는 벤치마크가 있는가.

업무 시나리오별 실패 케이스를 수집하고 개선하는 루프가 있는가.

고객사 내부 시스템과 안전하게 연동되는 실행 구조가 있는가.

권한, 보안, 감사 로그, 출처 추적을 포함한 운영 체계가 있는가.

특정 산업에서 반복적으로 검증된 레퍼런스가 있는가.

이런 요소들은 단순한 Wrapper가 만들기 어렵다. 오히려 실제 기업 현장에서 AI를 쓰게 만드는 데는 이런 시스템 통합과 운영 역량이 훨씬 중요할 때가 많다.

투자자가 봐야 할 것은 “모델의 출생지”만이 아니다

AI 스타트업을 평가할 때 “이 모델을 처음부터 직접 학습했는가”는 중요한 질문이다. 하지만 그것만으로 충분하지 않다. 더 좋은 질문은 다음과 같아야 한다. 이 회사는 어떤 문제를 풀기 위해 모델을 만들었는가.

그 문제는 범용 LLM만으로 해결하기 어려운가. 자체 데이터는 얼마나 희소하고, 지속적으로 축적되는가.

모델 성능 개선이 정량적으로 입증되는가. 서비스 운영 과정에서 발생하는 데이터가 다시 기술 자산으로 쌓이는가. 외부 모델을 바꿔도 서비스 품질을 유지할 수 있는 구조인가. 고객사가 이 회사를 단순 도구가 아니라 기술 파트너로 보는가. 이 질문들에 답할 수 있다면, 그 회사는 단순 Wrapper가 아닐 가능성이 높다. 반대로 from scratch 모델을 보유했다고 해도, 실제 고객 문제를 해결하지 못하고 운영 데이터가 쌓이지 않는다면 그것 역시 강한 사업이라고 보기 어렵다.

자체 개발 모델의 기준은 더 정교해져야 한다

이제 AI 산업에서 “자체 개발 모델”이라는 표현은 더 정교하게 쓰일 필요가 있다.

모든 회사가 독자 파운데이션 모델을 만들 필요는 없다. 오히려 많은 스타트업에게 그것은 비효율적인 전략일 수 있다. 중요한 것은 자기 회사가 어느 층위의 기술을 내재화했는지 솔직하고 구체적으로 설명하는 일이다.

“우리는 자체 파운데이션 모델을 학습했다.”

“우리는 오픈소스 모델을 기반으로 도메인 특화 학습을 수행했다.”

“우리는 외부 LLM을 사용하지만, 자체 데이터와 평가 체계, 업무 실행 엔진을 보유하고 있다.”

“우리는 특정 산업에서 모델 운영과 검증을 자동화하는 플랫폼을 만들었다.”

이 네 문장은 모두 다르다. 그리고 각각의 기술적 가치도 다르다. 중요한 것은 이것을 뭉뚱그려 말하지 않는 것이다.

생태계에 필요한 것은 더 많은 질문이다

AI 스타트업 생태계가 건강해지려면, 투자자도 창업자도 더 정교한 언어를 가져야 한다. 투자자는 “자체 모델인가요?”라는 질문에서 멈추지 말고, “어떤 수준의 자체화인가요?”라고 물어야 한다. 창업자는 “자체 개발 모델입니다”라는 표현만 반복하지 말고, 어떤 데이터, 어떤 학습, 어떤 평가, 어떤 운영 체계를 가지고 있는지 설명해야 한다. AI 기업의 기술력은 단순히 모델을 어디서 가져왔는지로만 결정되지 않는다. 데이터, 도메인 지식, 평가 체계, 운영 경험, 고객 업무에 대한 이해, 그리고 실패를 다시 개선으로 연결하는 루프가 함께 쌓일 때 비로소 기술 자산이 된다. 어쩌면 지금 필요한 질문은 이것일지도 모른다.

“당신들은 자체 모델을 만들었습니까?”

보다 더 중요한 질문.

“당신들의 AI는 시간이 지날수록 무엇을 배웁니까?”

그리고

“그 배움은 회사의 기술 자산으로 축적되고 있습니까?”

AI 스타트업을 파운데이션 모델 기업과 LLM Wrapper 기업으로만 나누는 시대는 곧 끝나야 한다. 그 사이의 넓은 회색지대에 실제 산업 AI의 대부분이 존재하기 때문이다. 그 회색지대를 제대로 읽는 눈이, 앞으로의 AI 투자와 기술 평가에서 훨씬 더 중요해질 것이다.

유니콘정글은 스타트업, AI, 투자, 조직 성장을 쉽게 해설하는 테크·스타트업 미디어입니다. 창업자와 실무자를 위한 기업 분석, 리더십, 재무, IR, 기술 트렌드 콘텐츠를 만듭니다.

유니콘정글 유니콘정글 · 전략 기획자

팔로우 🙌 커피챗

댓글이 없습니다.