#운영 #프로덕트 #마인드셋
AI를 '평가한다'는 것의 의미


이 글은 ‘튜링 포스트 코리아’에 발행된 주간 뉴스레터의 일부입니다.


AI 기술, 산업, 스타트업, 그리고 사회적 영향 등에 대해 관심있으시다면 ‘튜링 포스트 코리아’ 구독 부탁드립니다.


[구독하러 가기]



“You get what you measure”

 

지난 주인 9월 18일, 마이크로소프트에서 LLM과 AI를 평가하는 새로운 기준이라는 화두를 내세우면서 ‘유레카 (Eureka)’라는 이름의 오픈소스 프레임웍을 발표했습니다. 단순하게 점수를 비교하는 방식의 기존 벤치마킹 방법을 벗어나서, 모델의 상세한 강점과 약점을 다각적으로 파악하고자 만들어진 프레임웍인데요. 유레카 발표와 함께 최신의 AI 모델 12개를 심층 분석한 리포트도 내놓았습니다.

아티클을 더 읽고 싶다면?
이오플래닛에 가입해주세요.
로그인 후 모든 아티클을 무료로 볼 수 있어요.
로그인/회원가입
링크 복사

댓글 0
댓글이 없습니다.
이번주 인기 아티클
추천 아티클
0