딥시크 대비 매개변수 5% 규모로 글로벌 최고 수준 성능
엔비디아 연례 개발자 콘퍼런스(GTC)서 국내 첫 추론 AI 발표
경량 모델과 온디바이스 모델도 공개 "크기 줄이고 성능 유지"
![배경훈 LG AI 연구원장. [사진=LG]](https://cdn.newsquest.co.kr/news/photo/202503/241518_140228_5438.jpg)
【뉴스퀘스트=황재희 기자】LG가 중국 AI(인공지능) 딥시크 보다 적은 매개 변수로 뛰어난 성능을 자랑하는 추론 AI '엑사원 딥'의 기술력을 공개한다.
현지시간 17일부터 21일까지 미국 캘리포니아주 새너제이에서 열리는 엔비디아의 연례 개발자 콘퍼런스(GTC)에 참가해 엑사원 딥의 우수한 성능을 전 세계에 소개할 예정이다.
LG AI연구원은 18일 엑사원 딥을 오픈소스로 공개했다고 이날 밝혔다.
이번 엑사원 딥 공개는 국내기업이 자체 개발한 추론 AI가 글로벌 AI 시장에서 본격적으로 경쟁력을 입증하고 에이전틱AI 시대로의 전환을 예고했다는 점에서 의미가 크다.
에이전틱 AI는 스스로 가설을 세우고 이를 검증하기 위한 추론을 진행하는 과정을 통해 자율적으로 의사결정을 할 수 있는 능동적인 AI를 뜻한다. 이를 구현하기 위해서는 기존 ‘지식 AI’를 넘어서는 ‘추론 AI’ 개발이 필수적이다.
전 세계적으로 미국의 오픈AI와 구글, 중국의 딥시크와 알리바바 등 파운데이션 모델을 보유한 소수의 기업만이 자체 추론 AI를 개발하고 있다. 엑사원 딥은 이들과 경쟁할 수 있는 국내 첫 모델이다.
성능 검증 결과 엑사원 딥-32B(320억개 매개변수)는 딥시크 R1(6710억 개 매개변수)의 5% 규모 매개변수만으로도 미국, 중국 모델들과의 비교에서 우수한 성능을 보였다.
LG AI연구원은 글로벌 오픈소스 AI 플랫폼 허깅 페이스에 매개변수가 다른 3가지 엑사원 딥의 논리적 사고력과 문제해결 능력을 평가하는 다양한 성능 평가 결과를 공개했다.
엑사원 딥-32B는 복잡한 수학 문제와 과학 문제 해결 능력에서 우수성을 입증했다. 특히 한국어에 강점이 있는 엑사원 파운데이션 모델을 기반으로 한 엑사원 딥-32B 는 올해 수능 수학 영역에서 94.5점으로 최고점을 기록했고 수학 문제 해결 능력을 평가하는 지표인 수학(MATH)-500은 95.7점을 기록했다.
이외에도 물리학, 화학, 생물학 등 박사 수준의 과학 추론 능력을 평가하는 지표에서도 우수한 성능을 달성했다.과학 문제 해결 능력을 평가하는 GPQA 다이아몬드 테스트에서 66.1점을 받아 매개변수 규모가 유사한 추론 AI 모델과의 경쟁에서 앞서는 결과를 기록했으며 코딩 능력을 평가하는 라이브코드벤치도 59.5점을 기록하며 경쟁력 있는 성능을 보였다.
LG 관계자는 "엑사원 딥이 수학과 과학, 코딩 등 전문 분야 평가 지표에서 높은 성능을 보여줌으로써 향후 기업이 필요로 하는 전문 분야뿐만 아니라 과학 연구와 교육 현장에서 활용도가 높아질 것으로 기대하고 있다"라고 말했다.
LG AI연구원은 엑사원 딥-32B와 함께 개발한 경량 모델 엑사원 딥-7.8B, 온디바이스 모델 엑사원 딥-2.4B도 오픈소스로 공개했다. 경량 모델은 32B의 24% 크기임에도 성능을 95%까지 유지하며 온디바이스 모델은 7.5% 규모임에도 성능이 86%에 달해 높은 경제성과 실용성을 동시에 갖췄다는 평가다.
향후 LG AI연구원은 LG전자와 LG유플러스 등 LG 계열사들과 함께 모델을 고도화해 온디바이스 AI 시장을 주도해 나간다는 계획이다.
<세상을 보는 바른 눈 '뉴스퀘스트'>
