상식능력, 추론능력 이전 기록 경신...적은 매개변수에도 압도적 성능 뽐내
한국어 모델 역시 오픈AI, 오픈모델 뛰어넘는 RAG와 요약 평가점수 달성

솔트룩스의 초거대 LLM '루시아'가 허깅페이스 '오픈 LLM 리더보드'에서 매개변수 350억개 이하 언어모델 기준 성능 평가 1위를 달성했다. [솔트룩스 제공=뉴스퀘스트]
솔트룩스의 초거대 LLM '루시아'가 허깅페이스 '오픈 LLM 리더보드'에서 매개변수 350억개 이하 언어모델 기준 성능 평가 1위를 달성했다. [솔트룩스 제공=뉴스퀘스트]

【뉴스퀘스트=김민우 기자】 국내 인공지능(AI) 기업 '솔트룩스'의 자체 개발 초거대 언어모델(LLM) '루시아'가 전 세계 언어모델을 평가하는 허깅페이스의 '오픈 LLM 리더보드'에서 성능 1위를 달성했다.

솔트룩스는 이번 순위가 AI 모델의 성능을 좌우하는 '매개변수' 350억개(35B) 이하 언어모델들 가운데 책정됐으며 평균 점수는 77.74점에 달했다고 15일 밝혔다.

루시아는 전체 초거대 모델 중에서는 매개변수 500억개 이상의 모델을 제치고 4위를 달성하는 등 적은 매개변수로도 상위 모델보다 뛰어난 능력을 보여주는 성능을 갖춘 것으로 평가됐다.

특히 루시아의 '상식능력'과 '추론능력' 테스트 점수는 각각 91.88점과 77.47점으로 모두 기존 기록을 경신했다.

김재은 솔트룩스 랩장은 "현재 21.4B 루시아 모델은 허깅페이스 업로드 3일만에 500회 이상의 다운로드를 기록하며 큰 주목을 받고 있다"며 "추가로 해당 모델의 베이스 버전도 공개할 계획"이라고 말했다.

솔트룩스의 초거대 LLM '루시아'가 허깅페이스 '오픈 LLM 리더보드'에서 전체 모델 가운데 성능 평가 4위를 달성했다. [솔트룩스 제공=뉴스퀘스트]
솔트룩스의 초거대 LLM '루시아'가 허깅페이스 '오픈 LLM 리더보드'에서 전체 모델 가운데 성능 평가 4위를 달성했다. [솔트룩스 제공=뉴스퀘스트]

아울러 솔트룩스의 루시아 한국어 모델은 한국지능정보사회진흥원(NIA) AI HUB 평가 데이터셋을 사용한 한국어 자체 검증에서도 오픈AI의 GPT3.5-turbo 및 오픈 모델을 뛰어넘는 검색 증강 생성(RAG)과 요약 평가 점수를 달성했다. 

솔트룩스는 RAG 기반 질의응답 정확도 90% 이상 등 우수한 성능 평가 점수를 기반으로 여러 기관 및 기업들과 LLM 도입 사업을 추진하고 있다. 또 건국대 자연어처리 연구실과의 산학협력으로 새로운 방법의 모델 학습 및 지식 편집 기술을 연구 중이다.

솔트룩스 관계자는 “자체 연례 행사인 솔트룩스 AI 컨퍼런스에서 현재 기술을 뛰어넘는 혁신적인 LLM을 공식적으로 선보일 것”이라며 “국내 대표 인공지능 기업으로써 글로벌 AI 시장을 선점할 초격자 경쟁력을 계속해서 확보해 나가겠다”고 전했다.

<세상을 보는 바른 눈 '뉴스퀘스트'>

저작권자 © 뉴스퀘스트 무단전재 및 재배포 금지