#모집/홍보 #트렌드 #기타
8월 셋째 주 AI 뉴스

AI 최신 트렌드 팔로업 뉴스레터 - GenAI 서비스 최신 소식을 발빠르게 받아보세요!

BetaAI에서 새로운 시즌을 맞아 GenAI 뉴스레터를 발행합니다. GenAI 서비스나 논문들이 어마무시한 속도로 나오고 있죠? 중요한 정보만 선별해 한글로 요약된 뉴스레터를 매주 수요일에 이메일로 보내드립니다.  

👉 뉴스레터 신청하기


이번주 AI 뉴스 📰

 

 

OpenAI 파산 위기! ChatGPT 하루 비용만 $700,000!

OpenAI 재정 위기: AI 챗봇 ChatGPT의 운영 비용이 하루에 $700,000에 달해 OpenAI가 2024년에는 파산할 위기에 처해 있음.

사용자 감소 및 경쟁: ChatGPT의 사용자 수가 감소하고, 무료로 사용할 수 있는 오픈 소스 대안과 경쟁하며 수익성을 달성하지 못하고 있음.

미래에 대한 불확실성: GPU 부족 문제, 투자 손실, 품질 저하 등으로 인해 OpenAI는 빠르게 수익 창출 방안을 찾아야 하며, 그렇지 않으면 큰 위기에 직면할 수 있음.

 

Google과 Universal Music, AI로 생성된 노래의 목소리 라이선싱 협상

AI 음악 협상의 새 시대: Google과 Universal Music이 아티스트의 목소리와 멜로디를 AI로 생성된 노래에 라이선싱하는 방안에 대해 협상 중.

딥페이크 음악의 성장과 문제점: 팬들이 아티스트의 목소리를 모방하여 AI로 노래를 만드는 트렌드가 확산되면서 지식 재산권 문제가 부각되고 있음.

음악 산업의 새로운 도전: 이 협상은 음악 산업이 AI와 깊페이크 기술의 성장과 관련된 지식 재산권 문제에 어떻게 대응해야 할지에 대한 중요한 질문을 제기하고 있음.

 

Zoom 오디오로 키 입력 감지, 연구자들 93% 정확도 달성

데이터 공격의 새로운 시대: 세 연구자가 키 입력의 소리를 기반으로 90% 이상의 정확도로 원격 키스트로크를 해석할 수 있는 딥러닝 모델을 개발했다고 주장함.

공격법의 진화: 이전 시도보다 높은 정확도로 키 입력을 감지하며, MacBook Pro와 같은 노트북을 사용하여 두 가지 테스트를 통해 93% 이상의 정확도를 달성함.

보호 조치: 공격을 방어하기 위한 대책으로는 타이핑 스타일 변경, 무작위 패스워드 사용, 거짓 키스트로크 추가, 생체 인식 도구 사용 등이 제안됨.

Claude Instant 1.2 출시

Zoom, 업데이트 된 약관에 고객 데이터로 “AI 트레이닝”?

Amazon, AI가 생성한 저자의 이름 아래 판매된 책 제거


이번주 AI 논문 📰

 

 

Shepherd: 언어 모델 생성을 위한 비평가

모델 소개: Shepherd는 응답을 비평하고 세밀화를 제안하는 언어 모델로, 다양한 오류를 식별하고 수정을 위한 제안을 할 수 있는 능력을 확장합니다.

핵심 접근법: 고품질의 피드백 데이터셋을 커뮤니티 피드백과 인간 주석에서 정제합니다.

성능과 규모: Shepherd는 작은 규모(7B 매개변수)임에도 ChatGPT와 같은 기존 모델과 동등하거나 선호되는 비평을 제공합니다.

평가: GPT-4로 평가할 때 Shepherd는 경쟁 대안과 비교하여 평균 53-87%의 승률을 달성하며, 인간 평가에서는 다른 모델을 엄격히 능가하고 평균적으로 ChatGPT와 밀접하게 묶습니다.

 

JEN-1: 텍스트로 안내되는 보편적 음악 생성을 위한 새로운 모델

JEN-1 모델 소개: 텍스트 설명을 기반으로 음악을 차례대로 생성하거나 전체 구조를 한 번에 예측하는 새로운 음악 생성 모델입니다.

다양한 음악 작업: 텍스트로 음악을 안내하거나, 기존 음악에 덧붙이거나 이어서 만드는 다양한 작업을 수행합니다.

뛰어난 성능: 기존 방법보다 음악의 질과 텍스트와 음악의 일치도가 높으며, 계산도 효율적으로 수행됩니다.

 

FocalFormer3D: 3D 객체 감지에서 어려운 사례에 집중하기

문제점 및 해결책 제시: 자율 주행에서 중요한 객체를 감지하지 못하는 문제를 해결하기 위해 "Hard Instance Probing (HIP)"이라는 방법을 사용하여 모델이 어려운 사례에 집중하게 합니다.

FocalFormer3D의 동작: 어려운 객체를 찾아내고 분류하는 데 탁월한 도구로, 많은 후보 중에서 실제 객체를 효율적으로 구별합니다.

우수한 성능: nuScenes와 Waymo 데이터셋에서 테스트한 결과, FocalFormer3D는 감지와 추적 능력에서 뛰어난 성능을 보이며, 특정 리더보드에서 1위를 차지했습니다.


이번주 AI 프로덕트 📦

 

 

Generative Agents: 인간 행동의 실감나는 대화형 모방, 컴퓨터가 만든 새로운 세계

Generative Agents 소개: 인간의 일상 행동과 사회적 상호작용을 실감나게 재현

사용자와의 상호작용: 'The Sims' 게임처럼 샌드박스 환경에서 자연어로 에이전트와 소통 가능

인간 행동 시뮬레이션: 인간 행동의 신뢰성 있는 시뮬레이션을 가능하게 하는 새로운 구조와 상호작용 패턴 소개

MetaGPT: 소프트웨어 회사 전체를 대체하는 멀티 에이전트 프레임워크

기능 소개: MetaGPT는 단 한 줄의 요구 사항에서 사용자 스토리, 경쟁 분석, 요구 사항, 데이터 구조, API, 문서 등을 출력합니다.

팀 구성: Product Manager, Architect, Project Manager, Engineer들이 포함하며, 신중하게 조정된 SOP (Standard Operating Procedure)와 함께 소프트웨어 회사의 전체 프로세스를 제공합니다.

비용: 분석과 디자인을 포함한 한 예제를 생성하는 데 약 $0.2 (GPT-4 API 요금)이 들며, 전체 프로젝트는 약 $2.0입니다.

 

링크 복사

배수정 프리랜서 · Product Manager

댓글 0
댓글이 없습니다.
추천 아티클
배수정 프리랜서 · Product Manager

0