#MVP검증 #사업전략 #마인드셋
소프트웨어의 ㅅ도 모르던 내가 AI 특허를 낸 이유

소프트웨어의 ㅅ, 코딩의 ㅋ도 모르던 내가 어쩌다 AI 음성인식 전처리(Pre-processing) 구조를 설계하고, 특허를 출원한 뒤 기술창업까지 하게 되었을까.

그 전까지 나는 개발자도, 공학 전공자도 아니었다. 나는 오랫동안 특수교육 현장에서 아이들을 지도하던 교육자였다. 교육 현장에서 쌓인 경험이 어떻게 AI 음성인식 전처리 엔진 특허로 이어졌는지, 그 이야기를 해보려 한다.

먼저 이 모든 것이 가능해진 데에는 시대적 흐름이 분명히 큰 몫을 했다. 예전에는 어떤 분야의 노하우가 있어도, 그것을 정리하고 구조로 만들어 실제 엔진으로 구현한다는 건 지극히 평범한 사람에게는 꿈 같은 일이었다. 하지만 지금은 다르다. 각 전문 영역에서 축적된 경험을, 내가 이해할 수 있는 언어로 끌어와 구조화하고 표현해 볼 수 있는 시대가 됐다. 내가 문해교육 프로그램에서 출발한 문제의식을 AI 음성인식 영역으로 확장하게 된 것도, 나의 타이밍과 시대의 타이밍이 절묘하게 맞물린 덕분이라고 생각한다.

 

이제 다시 교육 현장의 이야기로 돌아가 보자. 인지 발달이 느린 특수교육 대상 아동들의 문해교육을 하다 보면, 말하기·읽기·쓰기가 자연스러운 하나의 흐름으로 이어지지 않는 장면을 많이 목도하게 된다. 정상 발달 아동에게는 소리를 듣고 처리하고 인출하는 것이 하나의 자연스러운 선처럼 보이지만, 특수교육의 시선으로 보면 그 선은 사실 수많은 미세한 단계로 이루어져 있다. 인지발달이 느린 아이들에게는 불안정한 소리 인식이 부정확한 인출로 직결되고, 이는 결국 말하기·읽기·쓰기의 연쇄적인 어려움으로 이어진다.

특수교육은 일반 교육과 완전히 결이 다른 특별한 무엇이 아니다. 일반 교육이 전체적인 풍경을 담아내는 표준 해상도의 사진이라면, 특수교육은 그 풍경 속 찰나의 순간을 수만 개의 픽셀로 쪼개어 들여다보는 초고해상도 분석 작업에 가깝다. 그래서 나는 특수교육 대상 아이들의 소리인식 문제를 해결하기 위해 단계들을 “쪼개고 또 쪼개서” 처리 경로를 만들었고 이에 대한 일정한 구조와 패턴들을 모두 잡아두었다.

처음에는 이 ‘교육 방법론’을 지키고 싶었다. 그래서 이것을 특허로 권리화하여 보호해야겠다는 필요성을 느끼고 직접 작업을 시작했다. 그런데 ‘교육 방법’ 자체만으로는 제도적으로 권리화가 쉽지 않다는 것을 알게 되었고, 결국 이를 소프트웨어(SW) 구조(앱/프로그램)로 전환해야 한다는 현실을 마주하게 되었다. SW 구조 사고로의 전환은 평생 생각지도 못한 새로운 도전이었지만, 나는 결국 이 길을 선택했다. 당시에는 미처 알지 못했지만, 이 선택은 교육자였던 내 삶의 궤적을 창업가라는 전혀 새로운 방향으로 돌려놓은 중대한 분기점이 되었다.

 

교육 앱/프로그램을 설계하려면 결국 소리의 입력과 처리(인지·인출) 구조를 더 명시적으로 정의해야 했다. 앱이 아이의 서툰 발음을 듣고, 정밀한 피드백을 주게 하려면 소리의 아주 미세한 오류(디테일)까지 기계가 인식하게 만들어야 했다. 말 그대로 ‘현미경 배율’을 올려야 했다. ‘그 디테일을 어떻게 기계가 놓치지 않게 할 것인가’라는 숙제를 붙잡고 씨름하던 어느 날, 나는 순간 긴장되는 느낌이 들었다.

내가 풀고 있는 이 ‘디테일한 소리 인식’의 문제가, 생각보다 훨씬 더 큰 영역—많은 기업과 연구자들이 계속 붙잡고 있는 음성인식의 핵심 난제와 맞닿아 있다는 사실을 깨달았기 때문이다. 그 순간, 이 작업이 단순히 ‘교육 앱을 위한 기능’이 아니라는 것이 분명해졌다. 아이들의 정확한 소리 인식과 인출을 돕기 위해 붙잡았던 전처리 경로 설계가, 범용적인 음성인식 입력 안정화 문제로 확장될 수 있다는 확신이 들었다.

그래서 나는 ‘교육 앱’의 범위를 넘어, 다양한 음성인식 환경에 적용 가능한 전처리 구조를 특허로 권리화하는 방향으로 전환하기로 마음먹었다. 하지만 겁이 났다. 내가 감히 이 문제를 건드릴 수 있을까? 이 순간 나에게 필요했던 것은 연구에 대한 집요함만이 아니라, 이걸 건드려보겠다는 용기였다. 나에게 용기가 없다면, 다음 단계로 나아갈 수 없었기에 내 사고의 지평을 넓히는 과정을 거친 후에, 비로소 나는 다시 작업에 집중할 수 있었다. 기존의 좁은 시야에서 벗어나 기술적 본질을 바라보기 시작하자, 연구 아이템이 가진 범용적 가치와 확장성이 비로소 선명하게 보였다.

 

나의 발상은 음성인식 “모델” 자체를 바꾸는 것이 아니라 모델 이전에 소리 입력이 들어왔을 때, 현미경처럼 정밀한 기준점과 가이드 정보를 제공해 데이터가 방황하지 않게 하는 전처리 프레임을 만드는 것이다. 소리 입력이 들어오는 순간, 처리 가능한 길로 바로 안내되도록 “초기 방향”을 잡아주는 설계다. 쉽게 말하면, 데이터가 모델에 도달하기 전, AI가 갈피를 잡지 못하고 방황하지 않도록 미리 명확한 ‘이정표’를 깔아주는 방식이다. 이렇게 방향이 잡히자, 특허 작업은 더 이상 막연한 아이디어가 아니게 됐다. 겁도 났지만, 나는 집요하게 정리했고, 결국 39항에 달하는 거대한 청구항으로 구조를 권리화해 나갔다.

여기서 또 하나 중요한 확장이 일어났다. 나는 처음에 한국어/한글 중심으로 이 구조를 정리했는데 구조를 깊게 파고들수록, 내가 만든 것이 한국어와 한글에만 해당하는 것이 아닌 더 넓은 환경에서도 작동할 수 있는 전처리 프레임으로서의 가능성을 보았다. 그래서 나는 이 구조를 여러 언어로도 확장할 수 있도록 설계하는 방향으로 생각을 옮겼다. 언어마다 겉모습은 달라도, “통합 입력이 들어왔을 때 처리 가능한 길을 만들어 준다”는 전처리 원리는 공통으로 적용될 수 있다고 봤기 때문이다.

여기서 내가 잡은 전략은, 언어별 설정값으로 조절 가능한 형태로 파라미터화 하여 언어마다 달라지는 부분을 일일이 새로 만드는 대신 바뀌는 부분만 설정값처럼 조절할 수 있게 두고, 기본 구조는 유지하면서 여러 언어에 적용할 수 있도록 확장하는 것이었다.

이 전처리 설계는 인식의 “정확도”만의 문제 뿐 아니라 궁극적으로는 많은 AI 시스템에서 나타나는 운영 문제—특히 불필요한 재처리와 긴 탐색으로 인한 연산 자원 낭비와도 연결될 수 있다는 사실을 알게 되었다. 오인식이 늘면 재질문이 늘고, 그만큼 시스템은 더 많은 연산을 반복한다. 운영 환경에서는 이 반복이 결국 비용과 지연으로 나타난다. 더 나아가 온디바이스(on-device) 환경에서는 반복 연산과 재처리가 늘수록 배터리 전력 소모와도 연결될 수 있다. 그래서 내가 말하는 음성인식 전처리 설계는 단순히 “맞추는 것”을 넘어, 불필요한 반복 처리 자체를 줄이는 방향으로도 의미가 있다고 본다. 입력 단계에서 처리 가능한 경로와 기준점을 만들어 재처리와 지연을 줄이는 것이, 결과적으로는 자원 효율(전력/배터리 포함)에도 기여할 수 있는 구조가 될 수 있기 때문이다.

나는 음성인식 전문가가 아니었다. 하지만 오히려 그 점이 새로운 시각이 될 수 있었던 것 같다. 새로운 발명은 종종 “새로운 시각”에서 나온다는 것을 다음의 예시에서 새삼 깨달았다. Geoffrey Hinton은 학부에서 실험심리학을 공부한 뒤 인간의 뇌를 모방한 인공 신경망 연구를 개척해 오늘날 '딥러닝의 대부'라 불리는 거장이 되었고, Demis Hassabis는 구글 딥마인드의 설립자이자 CEO로 인지신경과학 배경에서 인간 인지 구조를 참고해 현대 AI의 상징이 되었다. 이런 사례들이 말해 주는 건 다른 분야에서 문제를 보는 방식이 때로는 새로운 길을 만든다는 점이다. 물론 내가 이 분들에 비할 바는 아니지만, 기술 분야라고 해서 기술적인 시각만이 정답은 아니며, 때로는 이질적인 시각이 전혀 새로운 관점을 만들어낸다는 사실을 전하고 싶다.

지금까지의 이 모든 여정을 처음부터 의도한 건 아니었지만, 지나고 보니 이 모든 것이 물 흐르듯 자연스레 이어졌다. 그리고 이 권리화의 완성은 자연스럽게 스타트업 법인 설립으로 이어졌다.

이제 나는 이 특허 기술을 세상에 드러내고, 실제로 증명해 나가야 하는 사명을 갖게 되었다. 39항의 거대한 모체 특허출원을 끝내고 거울에 비친 내 머리를 보니, 겨울이 지났는데도 하얀 눈이 녹지 않고 수북이 쌓여 있었다. 그것이 내게 지난 시간을 말해주는 것 같았다.

..

..

 

링크 복사

케일라 (주)로코그니센스랩 · CEO

AI 음성인식 전처리 엔진 개발 스타트업

댓글 0
댓글이 없습니다.
추천 아티클
케일라 (주)로코그니센스랩 · CEO

AI 음성인식 전처리 엔진 개발 스타트업

0