🤗안녕하세요! 모두를 위한 SW/AI 뉴스를 전하는 모두의연구소입니다!
(모두의연구소는요!) 지식을 나누며 함께 성장하는 국내 최대 AI 커뮤니티입니다🌟
그럼, 오늘의 SW/AI 데일리 뉴스를 전해 드릴게요!
🗞️ SW/AI 한줄 뉴스
1. 직무 면접도 이제 AI로.. 사람의 전문성도 평가하는 AI
https://n.news.naver.com/mnews/article/138/0002171381
2. 100% AI 생성 캐릭터만 참가하는 세계 첫 AI 미인대회 개최
https://www.aitimes.com/news/articleView.html?idxno=158866
🤵 빠르다 빨라 AI 세상
1. MEGALODON: 무한한 컨텍스트 길이와 선형 복잡도의 혁신적 조화
MEGALODON은 고정 길이의 chunk-wise attention을 사용해 무한한 컨텍스트 길이를 처리하면서도 선형 복잡도를 가진 신경망 아키텍처입니다. 더 좋은 성능과 안정성을 위해 complex exponential moving average (CEMA), timestep normalization layer, normalized attention mechanism, pre-norm with two-hop residual configuration 등 여러 기술적 요소를 도입했습니다. LLAMA2와의 동일 조건 비교 실험에서, MEGALODON-7B는 2B 토큰 학습 후 perplexity와 다양한 downstream task에서 더 좋은 성능을 보였습니다. 또한 2M 길이까지의 perplexity 평가와 Scrolls dataset의 장문 QA 실험을 통해 무한한 길이의 시퀀를 모델링할 수 있음을 확인했습니다.
https://huggingface.co/papers/2404.08801
2. TR-DPO: 학습 중 reference 정책 업데이트로 언어 모델 정렬의 새로운 지평을 열다
TR-DPO는 DPO 알고리즘을 개선한 새로운 언어 모델 정렬 방법으로, 학습 중에 reference 정책을 업데이트하는 것이 특징입니다. TR-DPO는 다양한 작업과 모델 크기에서 기존 DPO보다 일관되게 우수한 성능을 보였습니다. 최적의 α와 τ 설정을 통해 TR-DPO는 통계적으로 DPO를 능가하고, 일관성, 정확성, 상세도, 유용성, 무해성 등 인간 중심 측정 기준으로 평가한 대화의 품질을 크게 향상시켰습니다. 이는 업데이트된 매개변수 보정과 모델 출력 향상 간의 직접적인 연관성을 시사하며, TR-DPO 방법의 효과를 강조합니다.
https://huggingface.co/papers/2404.09656
🦸♂️ 오늘의 SW 스피드웨건
1. 웹 페이지 마크다운 컨버터
MarkdownDown은 웹 페이지를 깔끔한 마크다운 형식으로 변환해주는 도구입니다. 비필수 요소를 제거할 수 있는 옵션과 이미지를 로컬로 다운로드하여 링크하는 기능이 포함되어 있어, 웹 콘텐츠를 보다 효과적으로 정리하고 관리할 수 있습니다. 이 도구를 사용하면 블로그나 문서 작업이 한층 더 수월해집니다.
https://markdowndown.vercel.app/
2. 서버 셀프 호스팅 경험
자체 호스팅을 선호하는 개발자가 자신의 경험을 공유하면서 Docker의 사용이 자체 호스팅을 간소화하는데 어떻게 도움이 되었는지 설명합니다. 또한, 고품질의 자체 호스팅 제품 개발을 위해 클라우드 버전을 제공하는 방식으로 수익을 창출하는 것에 대해 논의합니다. 그러나 일부 제품이 무료 버전을 과도하게 제한하는 것에 대한 우려도 표현합니다.
https://pixeljets.com/blog/self-hosted-is-awesome/?ref=dailydev
1️⃣ AI학교 아이펠 온라인 8기 ►https://bit.ly/3Pcdo3q
2️⃣ AI학교 아이펠 데이터 사이언티스트 과정 ► https://bit.ly/3JjDKNu
3️⃣ 오름캠프 Django 백엔드 개발 과정 ► https://bit.ly/3PWIBYO