#프로덕트
똑똑한 LLM이 단순 반복 업무를 망치는 이유 (feat. AI 에이전트 일관성 문제 해결기)
안녕하세요, 웹 브라우저 내의 반복적인 업무를 자동화하는 에이전트를 만들고 있는 제오노스 팀입니다.
최근 훌륭한 AI 에이전트들이 쏟아져 나오고 있습니다. 저희 팀 역시 "사람이 하기 따분한 단순 클릭과 텍스트 입력 업무를 AI가 대신해 주면 어떨까?"라는 생각에서 프로덕트를 개발하고 있는데요. 이 과정에서 마주했던 꽤 치명적인 문제 하나와, 이를 해결하기 위해 최근 업데이트한 내용을 EO플래닛 메이커 분들과 공유해 보려 합니다.
🤔 문제: 알아서 잘 딱 깔끔하고 센스있게? (Chat2Task의 한계)
모두 아시다시피 LLM은 본질적으로 확률 기반의 모델입니다. 초기 저희 서비스는 'Chat2Task' 방식이었습니다. 사용자가 한 번에 모든 내용을 설명하면("A 사이트 로그인해서 B 데이터 다운받고 C에 입력해줘"), 에이전트가 그 의도를 파악해 매번 스스로 액션을 계획하고 알아서 실행하는 구조였습니다.
댓글이 없습니다.
추천 아티클