한국IBM은 IBM 인지컴퓨팅 ‘왓슨’의 자연어 처리 기술에 기반한 비정형 데이터 분석 플랫폼인 ICA 한국어 버전(영어, 일본어 등 16개 언어를 동시 지원)을 출시한다고 6일 밝혔다.
ICA는 기업의 문서, 외부 사이트, 소비자 보고서, 콜센터, 소셜 네트워크 상의 댓글 등 다양한 데이터 소스로부터 비정형 데이터를 추출, 탐색, 분석하는 플랫폼이다.
ICA는 슈퍼컴퓨터 ‘왓슨’의 주요 기술인 자연어 처리에 기반했다. 자연어 처리 기술은 일상적으로 사용하는 언어를 이해하고 분석하는 인지 지능 기술로, 이를 활용하면 비정형 데이터를 분석해 고객 행동을 예측해 사전 대응할 수 있는 통찰력을 제공할 수 있다.
또한 ICA는 고급 자연어 처리를 활용해 텍스트 정보에 담긴 인간 언어의 의미와 맥락을 이해할 수 있다고 회사측은 설명했다.
먼저 자동 콘텐츠 분류 기능을 지원해 고급 텍스트 분석 기법과 콘텐츠별 규칙을 적용, 비구조화된 정보를 정확하고 일관되게 분류해 콘텐츠의 숨겨진 의미를 밝혀낼 수 있다.
텍스트 마이닝 기능은 비정형 데이터를 분석해 콘텐츠간 패턴, 관계를 식별해 비즈니스 결과를 예상하고 구체화할 수 있다.
분석된 데이터의 패턴, 분포도, 빈도, 연관관계 등을 시각적으로 보여줄 수 있는 UI도 제공한다.
의료기관에 도입할 경우 환자의 임상정보를 추출, 환자의 과거 정보와 현재 상태를 분석해 더욱 정확하게 진단하고 치료 효과를 높이는 식이다.
한국IBM 소프트웨어그룹 김상건 본부장은 “빅데이터 환경에서 데이터의 80%를 차지하는 비정형 데이터 분석을 통한 통찰력 발견 역량은 기업의 비즈니스 성공에 매우 중요한 경쟁 요소로 자리잡고 있다”며 “이번 ICA의 자연어 처리 분석 기술은 빅데이터 시장에 새로운 전기를 마련할 것”이라고 강조했다.