ⓒ데일리포스트=이미지 제공/ 곽민구 기자
ⓒ데일리포스트=이미지 제공/ 곽민구 기자

ㅣ데일리포스트=곽민구 기자ㅣ“LG는 초거대 멀티모달 AI ‘엑사원’을 통해 다른 생성형 AI들과는 차별화된 고객 가치를 창출하는 글로벌 경쟁력을 갖춘 AI 컴퍼니로 발전해 나갈 것입니다.” (배경훈 LG AI연구원장)

LG AI연구원이 초거대 멀티모달(Multimodal) AI ‘엑사원(EXAONE) 2.0’을 선보였다. 19일 서울 강서구 마곡 LG사이언스파크 컨버전스홀에서 열린 ‘LG AI 토크 콘서트 2023’에서다.

배경훈 LG AI연구원장은 “LG는 국내에서 유일하게 이중 언어 모델과 양방향 멀티모달 모델을 모두 상용화한 기업”이라고 소개하며 “세상의 지식을 이해하고 발견하는 상위 1%의 전문가 AI를 개발하고 있다”고 소개했다.

이와 함께 이날 LG AI연구원은 AI와 대화하며 ▲전문 문헌 검토 ▲소재 구조 설계 ▲소재 합성 예측까지 진행하는 모습을 시연했다.

■ 엑사원 2.0의 경쟁력은 무엇?

LG AI연구원은 2021년 12월 첫 선을 보인 ‘엑사원’의 진화한 모습을 공개했다. 그간 LG AI연구원은 LG 계열사와 국내외 파트너사들이 ‘엑사원’으로 보다 빠르고 편리하게 각 분야에 특화된 전문가 AI를 사용할 수 있도록 연구개발을 지속해왔다.

이번에 공개한 ‘엑사원 2.0’은 파트너십을 통해 확보한 특허, 논문 등 약 4500만 건의 전문 문헌과 3억 5000만장의 이미지를 학습했다. 여기에 멈추지 않고 LG AI연구원은 앞으로도 저작권, 신뢰성 등 AI 윤리원칙을 준수하며 데이터 학습을 진행할 계획이다.

LG AI연구원은 현존하는 전문 지식 데이터의 상당수가 영어로 되어 있는 점을 고려해 ‘엑사원 2.0’을 한국어와 영어를 동시에 이해하고 답변할 수 있는 이중 언어(Bilingual) 모델로 개발했다. 이와 함께 학습 데이터 양도 기존 모델 대비 4배 이상 늘려 성능을 높였다.

또 LG AI연구원은 ‘엑사원 2.0’의 언어 모델은 기존 모델과 동일한 성능을 유지하면서도 추론(Inference) 처리 시간은 25% 단축하고, 메모리 사용량은 70% 줄여 비용을 약 78% 낮췄다. 언어와 이미지 간의 양방향 생성이 가능한 멀티모달 모델은 이미지 생성 품질을 높이기 위해 기존 모델 대비 메모리 사용량을 2배 늘렸음에도 추론 처리 시간을 83% 단축함으로써 약 66%의 비용 절감을 달성했다.

LG AI연구원은 “고객들이 ‘엑사원 2.0’을 원하는 용도나 예산에 맞게 모델의 크기부터 종류(언어, 비전, 멀티모달), 사용 언어까지 맞춤형으로 설계가 가능하다”고 설명했다.

‘엑사원 2.0’은 고객 데이터 보안을 위해 학습 과정을 미세 조정하는 파인 튜닝(Fine-Tuning)과 AI 인프라를 고객이 보유한 서버에 직접 설치하는 구축형(On-Premise) 및 사설 클라우드(Private Cloud) 방식도 지원한다.

이날 대표적인 ‘엑사원’ 활용 사례로 LG AI연구원은 LG전자의 AICC(AI Contact Center, AI 컨택 센터)를 소개했다. LG AI연구원은 국내에서 시범 운영 중인 AICC를 하반기 중 정식 서비스로 전환할 예정이며, 내년부터 영어권 국가로 확대할 계획이다.

■ 엑사원 유니버스(Universe) : 전문가용 대화형 AI 플랫폼 탈바꿈

LG AI연구원은 이날 ‘전문가 AI’ 서비스 개발의 기반인 엑사원 3대 플랫폼인 유니버스(Universe), 디스커버리(Discovery), 아틀리에(Atelier)를 차례로 선보였다.

‘엑사원 유니버스’는 ▲질의응답·대화 ▲텍스트 분류·요약 ▲키워드 추출·생성 ▲번역 등 기능별로 메뉴를 나눴던 방식에서 전문가용 대화형 AI 플랫폼으로 변모했다.

‘엑사원 유니버스’는 다른 대화형 AI들과 달리 사전 학습한 데이터는 물론 각 도메인별 최신 전문 데이터까지 포함해 근거를 찾아내며 추론한 답변을 생성하고, 질문에 대한 답변과 함께 화면 좌측과 우측에 각각 질문과의 연관성이 가장 높은 전문 문헌들과 AI가 답변하는 과정에서 활용한 단락을 표시해 준다.

LG AI연구원은 이날 시연한 ‘엑사원 유니버스’의 AI/머신러닝 분야 서비스를 오는 31일부터 LG 그룹 내 AI 연구자, 협력 중인 대학을 대상으로 시작한다. 이어 9월에는 LG에서 AI를 연구하거나 공부하는 임직원 대상으로 정식 서비스를 진행할 예정이다.

LG AI연구원은 화학, 바이오, 제약, 의료, 금융, 특허 등 ‘엑사원 유니버스’의 각 전문 도메인별 특화 서비스도 준비하고 있다.

■ ‘엑사원 디스커버리(Discovery)’ : 화학 및 바이오 분야 지원

LG AI연구원은 화학 및 바이오 분야의 발전을 앞당길 ‘엑사원 디스커버리’도 공개했다. 세상에 없던 새로운 지식을 발견하는 플랫폼인 ‘엑사원 디스커버리’는 현재 신소재·신물질·신약 관련 탐색에 적용 중이다.

이를 위해 LG AI연구원은 논문과 특허 등 전문 문헌의 텍스트뿐만 아니라 분자 구조, 수식, 차트, 테이블, 이미지 등 非텍스트 정보까지 AI가 읽고 학습할 수 있는 형태로 데이터베이스화 하는 심층 문서 이해(DDU, Deep Document Understanding) 기술을 ‘엑사원 디스커버리’에 적용했다.

LG AI연구원은 이날 행사에서 친환경 배터리 개발에 활용할 수 있는 첨가제 소재의 개발을 주제로 ‘엑사원 유니버스’와 ‘엑사원 디스커버리’를 연계해 AI에 질문하며 ▲전문 문헌 검토 ▲분자 정보 추출 ▲소재 구조 설계(UMD, Universal Molecular Design) ▲소재 합성 예측(NCS, Neural Chemical Synthesis) 등 후보 소재를 찾아내 합성 결과를 예측하는 과정을 시연, LG의 심층 문서 이해 기술이 세계 최고 수준임을 증명했다.

LG AI연구원은 ‘엑사원 디스커버리’를 통해 1만회가 넘었던 합성 시행착오를 수십회로 줄이고, 연구개발 소요 시간은 40개월에서 5개월로 단축시킬 수 있을 것으로 전망했다.

‘엑사워 디스커버리’는 올해 4분기부터 그룹 내 화학 및 바이오 분야 연구진들을 대상으로 서비스를 제공할 예정이다.

■ 엑사원 아틀리에(Atelier) : 이미지 생성·이해에 특화된 기능 제공

‘엑사원 아틀리에’는 인간에게 창의적 영감과 아이디어를 제공하기 위해 개발한 플랫폼으로, 저작권이 확보된 이미지-텍스트가 짝을 이룬 페어(Pair) 데이터 3.5억 장을 학습한 ‘엑사원 2.0’을 기반으로 이미지 생성과 이미지 이해에 특화된 기능을 제공한다.

LG AI연구원은 인간과 AI가 상호작용을 통해 디자인을 완성해가는 ‘디자인 싱킹 프로세스(Design Thinking Process)’를 ‘엑사원 아틀리에’에 접목하기 위해 미국 파슨스 디자인 스쿨과의 공동 연구개발을 이어가고 있다.

또 LG AI연구원은 지난 6월 셔터스톡(Shutterstock)과 함께 상용화한 ‘캡셔닝 AI’ 기능도 ‘엑사원 아틀리에’에 적용했다. ‘캡셔닝 AI’는 처음 보는 이미지까지 자연어로 설명할 수 있으며, 이미지 검색에 활용할 수 있는 정보인 문장이나 키워드 등의 메타 데이터를 생성할 수 있다.

LG AI연구원은 올해 3분기에 그룹 내외부의 전문 디자이너를 대상으로 ‘엑사원 아틀리에’를 서비스할 계획이다.

한편 LG는 지난 2018년 구광모 LG 대표 취임 이후 AI를 미래 성장 동력으로 집중 육성하고 있다. 2020년 그룹 AI 연구의 싱크탱크 역할을 할 ‘LG AI연구원’을 설립한 데 이어 지난해에는 향후 5년 간 AI·데이터 분야 연구개발에 3조 6000억 원을 투입해 미래 기술을 선점하고 인재 영입에도 적극 나서고 있다.

저작권자 © 데일리포스트 무단전재 및 재배포 금지