#커리어 #트렌드
팰컨(Falcon) 후속작 공개?


이번주 AI/SW 소식



  • 맘바(Mamba) 아키텍처를 응용한 새로운 언어 모델 등장

  • 일론 머스크의 xAI, 언어 모델 '그록-2' 출시


 

맘바(Mamba) 아키텍처를 응용한 새로운 언어 모델 등장

©HuggingFace

오픈소스 언어 모델 팰컨(Falcon)을 개발한 연구 기관 TII(Technology Innovation Institute)가 새로운 언어 모델 '팰컨 맘바 7B(Falcon Mamba 7B)'를 발표했습니다. 기존의 언어 모델에 널리 사용되었던 트랜스포머(Transformer) 아키텍처의 핵심인 어텐션(attention)으로는 컴퓨팅, 메모리 비용으로 인해 긴 시퀀스를 처리하는 데 한계가 있었는데요. 이 단점을 극복하기 위한 '상태 공간(state space) 모델' 중 하나가 바로 맘바입니다.

아티클을 더 읽고 싶다면?
이오플래닛에 가입해주세요.
로그인 후 모든 아티클을 무료로 볼 수 있어요.
로그인/회원가입
링크 복사

댓글 0
댓글이 없습니다.
이번주 인기 아티클
추천 아티클
0