스모어톡은 최근 단 4인의 팀원으로 딥테크 팁스 과제에 선정되어 3년간 15억을 지원받게 되었습니다.
스모어톡이 해당 과제로 해결하고자 하는 문제에 대해 깊게 다루어보았습니다.
AI 디자인 어시스턴트, 플라멜에는 주기적으로 엄선된 컬렉션이 업로드 되고 있습니다.
드디어 선선한 바람이 불어오면서 어느새 추석이 한걸음 앞으로 다가왔기에 추석 컬렉션을 업로드 중입니다.
위의 이미지는 플라멜에서 ”매우 단순한 2D 그래픽 디자인, 하단에 전통 검은색 기와의 한국 지붕을 정면에서 본 모습 배치. 배경은 밤하늘 느낌의 보라색, 분홍색 그라데이션, 오른쪽 상단에 부분적으로 보이는 달이 따뜻한 빛을 던지고, 지붕 위에 몇 마리 새가 앉아 있어 평화로운 분위기.” 로 생성한 결과입니다.
생성을 마치고, 의문이 들었습니다.
과연 이 이미지들이 한국 전통 가옥의 지붕을 제대로 구현한 것일까?
그렇게 한중일 건축양식에 대한 조사에 돌입했습니다.
한중일의 전통적인 주택은 언뜻 유사하지만 명확한 차이를 가지고 있었습니다.
한국의 지붕은 대부분의 경우 부드러운 곡선미를 자랑한다고 합니다. 가로로 긴 형태의 지붕에서 가운데 길쭉한 가로선이 살짝 휘어있는 곡선의 형태인 것이죠. 또한, 지붕이 2단으로 나뉘면서 아래쪽도 살짝 더 휘어 지붕 끝이 부드럽게 올라가게 됩니다. 일본은 전체적으로 직선형이면서 단순하고 절제된 느낌이 나타납니다. 중국은 지붕 끝이 하늘을 향해 치솟은 날카로운 형태인 경우가 많다고 하네요.
말하자면 위의 이미지에서 1번이 일본, 2번이 한국, 4번이 중국과 가깝다고 볼 수 있습니다.
이렇게 스터디한 내용을 참고해서 더 높은 퀄리티의 새로운 리소스를 다음과 같이 구현했습니다.
이밖에 다양한 가을 컬렉션이 [플라멜]에 계속 업데이트 되고있으니 확인해보세요 🌝
이런 어려운 점, 글로벌 이미지 생성 AI 서비스에서도 마찬가지입니다.
추석 컬렉션을 만들면서 느낀 어려움은 이뿐만이 아닙니다.
사과와 배를 구현하려하는데, “한국 배” 스타일이 나타나지 않는다거나, 한국식으로 보자기를 묶은 선물을 구현하기 어렵다거나 하는 식입니다. 과일 상자에 가지런히 담겨 흰색 과일망에 하나씩 감싸져 있는 모습은 또 어떻게 표현할지 참 어렵기만 합니다.
(플라멜로 " 심플한 흰색 테이블에 사과와 한국 배가 올라가 있는 모습"을 생성한 결과)
이러한 현상은 미드져니로 만들었을때도 마찬가지입니다. 어도비 파이어플라이를 사용하면, 한국 배의 색깔 정도는 구현되지만 배의 모양은 여전히 우리에게 익숙하지 않은 모습이네요.
(상-미드져니로 "korean pear"를 생성한 결과, 하-Adobe Firefly로 "korean pear"를 생성한 결과)
스모어톡은 이 문제를 해결하고 싶어요.
스모어톡은 올 하반기 딥테크 팁스 과제에 선정되어 3년간 15억을 지원받습니다.
당시 단 4인의 팀원으로 이루어낸 기록적 성과였는데요, 여기서 진행하는 스모어톡의 R&D 과제는 바로 “동아시아향 이미지 생성형 AI 모델 개발”입니다. 해당 과제로 바로 위에서 느낀 문제점을 해결하고자 합니다.
첫째, 우리나라 특화된 요소들이 정확하게 구현되도록 합니다.
떡볶이, 라면, 과일과 같은 음식부터 시작해서 특정 장소와 행사가 그 예시입니다. 다음은 openAI의 Dall-E가 생성한 “추운 겨울, 따뜻한 마룻 바닥에서 라면 먹고 있는 한국 남자 아이” 모습입니다. 언뜻 라면 같지만, 자세히 보면 정체 모를 국수입니다. 아무리 바꿔달라고 요청해보아도 역부족입니다.
둘째, 동아시아 내에서도 한/중/일의 문화를 구분하여 반영하고자 합니다.
서양의 오리엔탈리즘을 풍자적으로 표현한 것으로 잘 알려진 LIM KIM의 Yellow라는 노래를 아시나요? 이 노래의 뮤비를 보면, 언뜻 동양풍이지만 국적 불명의 온갖 것들이 섞여 묘한 불쾌감을 느낄 수 있습니다. 현재의 이미지 생성형AI의 결과물이 바로 이런 느낌입니다. 아시아 안에서도 한중일의 차이를 우리는 느낄 수 있고, 이는 민감한 이슈로 종종 논란이 되기도 합니다. 앞으로 우리의 생활에 깊숙이 들어올 AI에서 이것은 반드시 해결되어야 하는 문제입니다.
(상-Adobe Firefly로 "한복을 입고 귀엽게 인사 하는 4살 여자 아이"를 생성한 결과, 하-Dall-E로 "서울 명동 거리, 식당이 즐비한 사진"을 생성한 결과)
셋째, 아시아에서 선호하는 스타일을 구현하고자 합니다.
미국 여행을 가서 엽서 등 문구류가 있는 곳을 둘러보면, 매우 투박한 느낌의 일러스트들이 주를 이루고 있습니다. 보통의 한국인이라면 별로 선호하지 않는 그런 스타일입니다. 현재의 이미지 생성형AI는 이런 스타일의 일러스트에 더 특화되어 있습니다. 다음은 Dall-E가 생성한 “에펠탑 앞에서 돗자리에 누워 피크닉을 즐기는 사람들” 일러스트 이미지입니다. 어떤 느낌인지 감이 오시나요? 🧐
반면 우리나라는 상당히 추상화되고, 귀여운 형태의 일러스트 스타일이 인기가 많습니다. 한국에서 인기가 많은 카카오톡 이모티콘 캐릭터를 보면 이해가 가실 것입니다. 이런 스타일은 한국 뿐만 아니라 일본, 대만 등의 지역에서도 많은 인기를 끌고있죠. 하지만 지금의 이미지 생성형AI는 아무리 추상화되고 귀여운 이미지를 만들려고 해도 반복적으로 다시 명확한 형태로 돌아가게 됩니다.
이 중요한 문제를 함께 고민하고 해결할 분들을 찾고 있어요.
이러한 문제는 단순히 다량의 데이터가 있다고해서 해결되는 문제는 아닙니다.
우선 실제 현실에 적용되기 위한 정확한 문제 정의가 필요합니다. 스모어톡은 한국에서 2년 간 이미지 생성형 AI에만 집중해 깊은 고민을 해왔습니다. 이미 50만건 이상의 유저 데이터를 확보하고 있고, 프로덕트를 통해 지속적으로 데이터를 축적하고 있습니다. 현장의 데이터를 기반으로 깊은 고민을 통해 문제를 정의하고, 연구를 설계합니다.
또한 '막대한 양의 데이터를 어떻게 분류하고 라벨링할 것이며, 모델을 어떻게 효율적으로 학습하고, 편리하게 사용할 것인가’는 현재의 AI 사회에서 최전선에 있는 생성형 AI 종합 예술이라고 할 수 있습니다. 스모어톡에는 데이터 구축, 멀티모달AI, 이미지 생성형AI를 전문으로 연구해 온 팀원들이 있습니다.
이 중요한 문제를 함께 풀어 나가는 종합 예술을 리딩하실 AI Lead, 이를 함께 구현해나가주실 AI engineer(예정), 그리고 최종적으로는 Product-Maket Fit을 찾아 MAU 100만의 프로덕트로 함께 성장시켜나가주실 Product Manager, Frontend Developer 직군을 채용하고 있습니다.
스모어톡은 적은 인원으로 빠르고 가볍게 운영되고 있습니다. 소수의 인원에게 막대한 권한과 책임이 주어지고, 적극적으로 성장을 지원합니다. 첫 공식 채용 관련 자세한 내용은 다음 채용 페이지를 참고 부탁드립니다.
마지막으로, 오늘이 백일인 너무 귀여운 조카 생각에 Adobe Firefly로 생성해본 “돌잔치에서 돌잡이를 하고 있는 1살짜리 한국 남자 아이” 이미지를 남기며 글을 마무리합니다 🪨😆