LG CNS, 인공지능 자연어 이해 표준데이터 10만 개 무료 공개

입력 2019-09-05 08:42

김우람 기자 hura@etoday.co.kr

기자 이름을 클릭하면
더 자세한 정보를
확인할 수 있어요!

북마크 되었습니다.
마이페이지에서 확인하세요.

가장작게
작게
기본
크게
가장크게

LG CNS는 인공지능(AI)의 자연어 이해를 위한 한국어 표준데이터 10만여 개를 제작해 업계에 무료로 개방한다고 5일 밝혔다.

언어 AI 개발을 위해서는 학생들이 공부하는 교과서와 유사한 개념인 AI 학습용 표준데이터가 필요하다.

해외는 미국 스탠포드대학, 마이크로소프트 등이 제작한 영문 표준데이터가 존재해 AI 개발에 활용되고 있지만, 국내는 한국어 표준데이터가 없어 영문을 번역하거나 자체적으로 데이터를 마련해야 하는 실정이었다.

LG CNS는 지난해 12월 위키백과 정보를 기반으로 AI 학습용 한국어 표준데이터 7만 개가 탑재된 '코쿼드 1.0'을 제작해 AI 업계에 공개했다.

공개 후 AI 전문가들이 모인 국내 최대 오픈 커뮤니티인 '텐서플로우 코리아'에서는 표준데이터 공개에 긍정적인 반응이 나온 것으로 알려졌다. 네이버, 카카오 등 국내 AI 기술 기업들과 AI 현업 종사자 등 50여개 팀이 코쿼드를 사용한 AI 개발에 나서기도 했다.

LG CNS는 이날 국내 AI 전문가 300여명을 초청해 AI 커뮤니티 행사 'AI Tech Talk(테크톡) for NLU'을 열어 ‘코쿼드 2.0’ 출시를 발표한다.

'코쿼드 2.0'은 '코쿼드 1.0' 대비 한국어 표준데이터를 7만 개에서 10만개로 확대하고, 단답형에서 장문의 답변이 가능한 AI를 개발할 수 있도록 데이터를 강화한 버전이다.

예를 들어 '대한민국의 수도와 그 면적은?'이라는 질문에 '서울특별시, 605.25제곱미터입니다'라고 답하는 식이다.

AI는 코쿼드 1.0 학습만으로 충분히 개발 가능했지만, '서울특별시의 특징은?'이라는 질문에 '도시 중앙 으로 한강이 흐르고 북한산, 관악산, 도봉산 등의 여러 산들로 둘러싸인…'이라는 장문의 답을 위해서는 코쿼드 2.0으로 AI를 학습시켜야 한다고 LG CNS는 강조했다.

또한, AI가 표나 리스트 형태에 담긴 정보도 읽어 답변할 수 있게끔 표준데이터 범위도 확대했다.

이번에 출시한 한국어 표준데이터는 '코쿼드 2.0' 웹사이트에서 누구나 다운로드 가능하다.

현신균 LG CNS 부사장(CTO)은 "응용분야가 무궁무진한 AI 언어 개발 분야에서 내부적으로 쌓은 데이터를 AI 업계 전체에 개방해 국내 AI 연구자들 간 상생을 위한 AI 개방형 생태계 조성에 기여코자 한다"고 밝혔다.

#LGCNS

좋아요0
화나요0
슬퍼요0
추가취재 원해요0

주요 뉴스

긁어 부스럼 만든 발언?…‘티아라 왕따설’ 다시 뜨거워진 이유 [해시태그]

12년 전 이야기가 다시 뜨거운 화제가 됐습니다. 그 주제 또한 매우 예민하죠. 한국 아이돌 그룹 중 온라인상 대중의 강력한 비난을 받았던 그 사건. ‘티아라 왕따 논란’입니다. 2세대 아이돌 논란 중 손꼽히는 사건이죠. 그래도 조용해졌던 그 이야기가 다시 수면 위로 떠올랐습니다. 과거 티아라의 소속사 대표였던 이의 발언이 시작이죠. 9일
잠자던 내 카드 포인트, ‘어카운트인포’로 쉽게 조회하고 현금화까지 [경제한줌]

생활 속에서 쉽게 실천 가능한 경제·절약 관련 팁들을 소개합니다. 언제나 사람들의 관심사였던 현명한 금융투자, 알뜰한 소비방법은 무엇이 있을까요? 현금 없는 사회 진입을 앞둔 대한민국에서 사랑받는 결제 방식은 신용카드가 압도적입니다. 이에 발맞춰 1인당 신용카드 사용 개수도 지속 늘어나고 있죠. 2010년 초 1인당 사용하는 평균 신
단독 "한 번 뗄 때마다 수 백만원 수령 가능" 가짜 용종 보험사기 기승

건강검진 시즌 맞아 최근 용종보험사기 극성 최근 1년새 용종 보험 청구 사례 10만 건 늘어 일각에선 백내장, 무릎줄기세포주사 처럼 보험사기 유행템 우려도 최근 가짜 용종을 절제하고 적게는 수십, 많게는 수백만 원에 달하는 보험금을 편취하는 보험사기가 유행을 탈 조짐을 보이고 있다. 건강검진 시즌을 맞아 일부 조직만 떼어냈는데 마치
8만 달러 터치한 비트코인, 연내 '10만 달러'도 넘보나 [Bit코인]

비트코인이 연일 최고가를 경신하고 있다. 11일(이하 한국시간) 오전 9시 가상자산(암호화폐) 통계사이트 코인게코에 따르면 비트코인은 전일 대비 5.0% 상승한 8만418.35달러(주요 거래소 평균가)에 거래됐다. 이날 오전 7시 26분께 비트코인은 8만1358.83달러를 터치하면서 다시 한번 신고가를 경신했다. 이더리움은 전일 대비 1.9% 오른 3189
말라가는 국내 증시…개인ㆍ외인 자금 이탈에 속수무책

외국인 4개월 연속 순매도세…코스피 월거래대금 200조 아래로미국 주식보관금액 1000억 달러 돌파…국내 투자자예탁금 감소세“기관, 멀티에셋 전환…개인, 해외주식 확대”“외국인, 트럼프 트레이딩·고금리·강달러에 자금이탈” 국내 주식시장은 투자 당위성마저 잃고 있다.(노동길 신한투자증권 연구원) 국내 주식시장에서 투자 당위성을 찾기 어려
환자복도 없던 우즈베크에 ‘한국식 병원’ 우뚝…“사람 살리는 병원” [르포]

‘최초의 자가발전기(UPS), 최초의 전자의무기록(EMR), 최초의 물리치료실’ 한국 병원에서는 당연한 구성요소들이 이곳에서는 ‘국내 최초’의 수식어를 달고 병원가에 파장을 일으킨다. 올해로 개원 5주년을 맞은 우즈베키스탄 부하라 힘찬병원의 이야기다. 한국 병원의 하드웨어와 소프트웨어를 그대로 옮겨 왔으며, 현지 의료진에게는 낯선 ‘환
트럼프 시대 기대감 걷어내니...高환율·관세에 기업들 ‘벌벌’

트럼프 시대가 다가오며 글로벌 증시는 환호 중이다. 특히 미국 중심 재편과 규제 완화 등의 기대감이 반영되는 모습이다. 그러나 우리 증시는 안갯속을 기대감 보다는 ‘우려’가 지배 중이다. 한국 경제는 고환율·고관세라는 이중 악재를 마주해야 하는 위기에 봉착했다. 안그래도 3분기 중국발 수출 단가가 떨어져 우울한 실적을 기록한 기업들
소문 무성하던 장현식, 4년 52억 원에 LG로…최원태는 '낙동강 오리알' 신세?

장현식이 차기 행선지를 LG 트윈스로 결정했다. 11일 LG는 "불펜 투수 장현식과 계약 기간 4년에 총액 52억 원(계약금 16억 원, 연봉 36억 원)에 자유계약선수(FA)를 체결했다"고 밝혔다. 서울고를 졸업한 장현식은 2013년 NC 다이노스에 1라운드 9순위로 입단해 기대를 모았다. 제대 후 2016년 37경기 동안 76과 3분의 1이닝 1승 3패 평균자책