AI 최신 트렌드 팔로업 뉴스레터 - GenAI 서비스 최신 소식을 발빠르게 받아보세요!
BetaAI에서 새로운 시즌을 맞아 GenAI 뉴스레터를 발행합니다. GenAI 서비스나 논문들이 어마무시한 속도로 나오고 있죠? 중요한 정보만 선별해 한글로 요약된 뉴스레터를 매주 수요일에 이메일로 보내드립니다.
이번주 AI 뉴스 📰
OpenAI 파산 위기! ChatGPT 하루 비용만 $700,000!
OpenAI 재정 위기: AI 챗봇 ChatGPT의 운영 비용이 하루에 $700,000에 달해 OpenAI가 2024년에는 파산할 위기에 처해 있음.
사용자 감소 및 경쟁: ChatGPT의 사용자 수가 감소하고, 무료로 사용할 수 있는 오픈 소스 대안과 경쟁하며 수익성을 달성하지 못하고 있음.
미래에 대한 불확실성: GPU 부족 문제, 투자 손실, 품질 저하 등으로 인해 OpenAI는 빠르게 수익 창출 방안을 찾아야 하며, 그렇지 않으면 큰 위기에 직면할 수 있음.
Google과 Universal Music, AI로 생성된 노래의 목소리 라이선싱 협상
AI 음악 협상의 새 시대: Google과 Universal Music이 아티스트의 목소리와 멜로디를 AI로 생성된 노래에 라이선싱하는 방안에 대해 협상 중.
딥페이크 음악의 성장과 문제점: 팬들이 아티스트의 목소리를 모방하여 AI로 노래를 만드는 트렌드가 확산되면서 지식 재산권 문제가 부각되고 있음.
음악 산업의 새로운 도전: 이 협상은 음악 산업이 AI와 깊페이크 기술의 성장과 관련된 지식 재산권 문제에 어떻게 대응해야 할지에 대한 중요한 질문을 제기하고 있음.
Zoom 오디오로 키 입력 감지, 연구자들 93% 정확도 달성
데이터 공격의 새로운 시대: 세 연구자가 키 입력의 소리를 기반으로 90% 이상의 정확도로 원격 키스트로크를 해석할 수 있는 딥러닝 모델을 개발했다고 주장함.
공격법의 진화: 이전 시도보다 높은 정확도로 키 입력을 감지하며, MacBook Pro와 같은 노트북을 사용하여 두 가지 테스트를 통해 93% 이상의 정확도를 달성함.
보호 조치: 공격을 방어하기 위한 대책으로는 타이핑 스타일 변경, 무작위 패스워드 사용, 거짓 키스트로크 추가, 생체 인식 도구 사용 등이 제안됨.
이번주 AI 논문 📰
모델 소개: Shepherd는 응답을 비평하고 세밀화를 제안하는 언어 모델로, 다양한 오류를 식별하고 수정을 위한 제안을 할 수 있는 능력을 확장합니다.
핵심 접근법: 고품질의 피드백 데이터셋을 커뮤니티 피드백과 인간 주석에서 정제합니다.
성능과 규모: Shepherd는 작은 규모(7B 매개변수)임에도 ChatGPT와 같은 기존 모델과 동등하거나 선호되는 비평을 제공합니다.
평가: GPT-4로 평가할 때 Shepherd는 경쟁 대안과 비교하여 평균 53-87%의 승률을 달성하며, 인간 평가에서는 다른 모델을 엄격히 능가하고 평균적으로 ChatGPT와 밀접하게 묶습니다.
JEN-1: 텍스트로 안내되는 보편적 음악 생성을 위한 새로운 모델
JEN-1 모델 소개: 텍스트 설명을 기반으로 음악을 차례대로 생성하거나 전체 구조를 한 번에 예측하는 새로운 음악 생성 모델입니다.
다양한 음악 작업: 텍스트로 음악을 안내하거나, 기존 음악에 덧붙이거나 이어서 만드는 다양한 작업을 수행합니다.
뛰어난 성능: 기존 방법보다 음악의 질과 텍스트와 음악의 일치도가 높으며, 계산도 효율적으로 수행됩니다.
FocalFormer3D: 3D 객체 감지에서 어려운 사례에 집중하기
문제점 및 해결책 제시: 자율 주행에서 중요한 객체를 감지하지 못하는 문제를 해결하기 위해 "Hard Instance Probing (HIP)"이라는 방법을 사용하여 모델이 어려운 사례에 집중하게 합니다.
FocalFormer3D의 동작: 어려운 객체를 찾아내고 분류하는 데 탁월한 도구로, 많은 후보 중에서 실제 객체를 효율적으로 구별합니다.
우수한 성능: nuScenes와 Waymo 데이터셋에서 테스트한 결과, FocalFormer3D는 감지와 추적 능력에서 뛰어난 성능을 보이며, 특정 리더보드에서 1위를 차지했습니다.
이번주 AI 프로덕트 📦
Generative Agents: 인간 행동의 실감나는 대화형 모방, 컴퓨터가 만든 새로운 세계
Generative Agents 소개: 인간의 일상 행동과 사회적 상호작용을 실감나게 재현
사용자와의 상호작용: 'The Sims' 게임처럼 샌드박스 환경에서 자연어로 에이전트와 소통 가능
인간 행동 시뮬레이션: 인간 행동의 신뢰성 있는 시뮬레이션을 가능하게 하는 새로운 구조와 상호작용 패턴 소개
MetaGPT: 소프트웨어 회사 전체를 대체하는 멀티 에이전트 프레임워크
기능 소개: MetaGPT는 단 한 줄의 요구 사항에서 사용자 스토리, 경쟁 분석, 요구 사항, 데이터 구조, API, 문서 등을 출력합니다.
팀 구성: Product Manager, Architect, Project Manager, Engineer들이 포함하며, 신중하게 조정된 SOP (Standard Operating Procedure)와 함께 소프트웨어 회사의 전체 프로세스를 제공합니다.
비용: 분석과 디자인을 포함한 한 예제를 생성하는 데 약 $0.2 (GPT-4 API 요금)이 들며, 전체 프로젝트는 약 $2.0입니다.







