종합적 사고를 바탕으로 인사이트 제시
사실 바탕으로 신뢰할 수 있는 근거 도출
"들판에 앉아있는 토끼 이미지를 만들어줘. 토끼 사진으로 아이들이 좋아할 만한 창작 동화를 만들어줘."
인공지능(AI)은 이런 문구들이 입력되자 10초 안에 푸른 들판에 앉아있는 평화로운 토끼 사진을 만들어냈다. 또, 사진을 만든 이후 순식간에 세 문단이 넘는 창작 동화까지 만들어냈다. AI 기술이 빠르게 진화하면서 공상과학(SF) 영화에서 볼법한 일들이 일어나고 있다.
LG AI연구원은 19일 서울 강서구 마곡 LG사이언스파크 컨버전스홀에서 'LG AI 토크 콘서트 2023'을 열고 초거대 멀티모달(Multimodal) AI 엑사원 2.0을 시연했다.
수년전 만해도 AI는 단순 질문에만 응답하는 수준에 그쳤다. 특히 챗GPT와 같은 생성형 AI는 언어에만 초점을 맞췄다. 그러나 LG AI연구원의 멀티모달 AI는 텍스트뿐 아니라 이미지, 음성 등 여러 입력 방식을 받아들이고 인간처럼 사고할 수 있다. 나아가 이미지를 언어로 표현하고 언어를 이미지로 다시 시각화하는 능력까지 갖췄다.
LG AI연구원은 이날 '전문가 AI' 서비스 개발의 기반인 엑사원 3대 플랫폼인 유니버스(Universe), 디스커버리(Discovery), 아틀리에(Atelier)를 차례로 공개했다. 엑사원 유니버스는 전문가용 대화형 AI 플랫폼이다. 디스커버리는 화학과 바이오 분야 등에서 쓰일 수 있는 지식 탐색 플랫폼이다. 아틀리에는 이미지를 언어로 표현하고 다시 언어를 이미지로 시각화할 수 있는 멀티모달 AI 플랫폼이다.
엑사원 유니버스는 △질의응답·대화 △텍스트 분류ㆍ요약 △키워드 추출ㆍ생성 △번역 등 기능별로 메뉴를 나눴던 방식에서 전문가용 대화형 AI 플랫폼으로 완전히 탈바꿈했다. LG AI연구원은 엑사원 유니버스를 각 분야의 전문가들이 믿고 정보를 탐색하며 인사이트를 찾을 수 있는 플랫폼으로 만들기 위해 전문성과 신뢰성을 높이는 데 주력했다.
유니버스는 다른 대화형 AI들과 달리 사전 학습한 데이터와 도메인별 최신 전문 데이터까지 포함해 근거를 찾아내고 추론한 답변을 만든다. 또, 질문에 대한 답변과 함께 화면 좌측과 우측에 각각 질문과 연관성이 가장 높은 전문 문헌들과 AI가 답변하는 과정에서 활용한 단락을 표시한다.
엑사원 디스커버리는 세상에 없던 새로운 지식을 발견하는 플랫폼으로 가장 먼저 신소재ㆍ신물질ㆍ신약 관련 탐색에 적용하고 있다. 디스커버리를 활용하면 원하는 배터리 신소재를 어떻게 활용할 수 있을지 빠르게 분석할 수 있다. 디스커버리는 △전문 문헌 검토 △분자 정보 추출 △소재 구조 설계(UMD, Universal Molecular Design) △소재 합성 예측(NCS, Neural Chemical Synthesis) 등 후보 소재를 찾아내 합성 결과를 예측할 수 있다.
엑사원 아틀리에는 '창의성'이 더는 인간의 전유물이 아니라는 걸 증명했다. 아틀리에는 인간에게 창의적 영감과 아이디어를 제공하기 위해 개발한 플랫폼이다. 아틀리에는 저작권이 확보된 이미지-텍스트가 짝을 이룬 페어(Pair) 데이터 3억5000장을 학습한 엑사원 2.0을 기반으로 이미지 생성과 이미지 이해에 특화된 기능을 제공한다.
배경훈 LG AI연구원장은 "LG는 국내에서 유일하게 이중 언어 모델과 양방향 멀티모달 모델을 모두 상용화한 기업이며, 세상의 지식을 이해하고 발견하는 상위 1%의 전문가 AI를 개발하고 있다"며 "국내외 파트너사와의 협력을 통해 실질적인 성공 사례를 만들어가며 '다른 생성형 AI들과는 차별화된 고객 가치'를 창출하는 글로벌 경쟁력을 갖춘 AI 기업으로 발전해 나갈 것"이라고 강조했다.