[240305] 모두의연구소가 전하는 “모두를 위한 SW/AI 뉴스”

🤗안녕하세요! 모두를 위한 SW/AI 뉴스를 전하는 모두의연구소입니다!
(모두의연구소는요!) 지식을 나누며 함께 성장하는 국내 최대 AI 커뮤니티입니다🌟

그럼, 오늘의 SW/AI 데일리 뉴스를 전해 드릴게요!

1. [React] 생성형 UI를 지원하는 AI SDK 3.0 소개

지난 10월, 텍스트와 이미지 프롬프트를 React UI로 변환하는 generative UI 디자인 도구인 v0.dev를 출시했습니다. 오늘, v0의 Generative UI 기술을 Vercel AI SDK 3.0의 출시와 함께 오픈 소스로 공개합니다. 개발자들은 이제 텍스트와 마크다운 챗봇을 넘어서, 리치하고 컴포넌트 기반의 인터페이스를 LLM에 제공할 수 있습니다. 새로운 API의 미리보기를 원하시면 문서를 읽거나 데모를 방문해 보세요.

https://vercel.com/blog/ai-sdk-3-generative-ui

2. 자바스크립트에서 배열을 합산하는 6가지 쉬운 방법

이 블로그 포스트에서는 JavaScript 배열의 합을 구하는 다양한 방법( reduce() 메소드, for-loop, for…of loop, forEach() 메소드, map()과 reduce() 메소드의 조합, 재귀 사용)을 소개하고, 각 방법의 장단점 및 성능 벤치마크를 평가하여, 배열 합계를 효율적으로 계산하는 방법을 알려드립니다.

https://www.rajamsr.com/javascript-array-sum/

3. BigCode Project의 두번째 Code LLM: StarCoder2의 탄생

BigCode Project에서 두번째 Code LLM을 공개했습니다. StarCoder 시리즈는 Code LLM이면서 오픈소스로 만들어진 모델입니다. 작년에 StarCoder가 나왔고 이번에 StarCoder2가 출시되었습니다. 이번 모델의 경우에는 소프트웨어 헤리티지와의 파트너십으로 The Stack v2 데이터셋을 구축했으며 GitHub PR, Kaggle Notebook, 공식문서까지 훈련 데이터셋에 포함시켜 더 풍부한 결과가 나왔다고 합니다. 실성능은 오픈소스 코드 모델인 CodeLLaMA-34B와 성능이 비슷하거나 우수하다고 하며 코드관련 가장 좋은 모델인 DeepSeekCoder와 비교했을때 수학적 추론은 더 강하다고 합니다. StarCoder2, The Stack v2모두 모델 가중치와 학습 데이터를 모두 공개했습니다.

https://huggingface.co/papers/2402.19173

4. Hawk와 Griffin: 효율적인 언어 모델을 위한 게이트형 선형 재귀와 어텐션 메커니즘의 조합

이 논문은 효율적인 언어 모델을 위해 게이트형 선형 재귀를 어텐션 메커니즘과 혼합하는 방법에 관한 것입니다. RNN은 훈련 및 확장이 어렵지만 추론에 능숙하고 긴 시퀀스에서 효율적입니다. 트랜스포머는 대규모 언어 모델에 더 적합하지만 긴 시퀀스에서는 효율적이지 않습니다. 구글 딥마인드는 이러한 단점을 해결하기 위해 두 가지 새로운 모델인 Hawk와 Griffin을 제안합니다. 두 모델 모두 새로운 게이트형 선형 재귀 단위(RG-LRU)가 있는 순환 블록을 사용합니다. Griffin은 또한 어텐션 메커니즘를 사용합니다. 저자는 이러한 모델이 트랜스포머와 유사한 성능을 달성하면서 더 효율적이라고 보여줍니다.

https://huggingface.co/papers/2402.19427

모두의연구소 모두의연구소 · 브랜드 마케터

모두의연구소 브랜드커뮤니케이션팀🌟

팔로우 🙌 커피챗

댓글이 없습니다.