인공지능(AI) 알고리즘으로 증권사 애널리스트들의 기업평가 보고서 텍스트 정보를 추출해 생성된 지표가 국내총생산(GDP) 등 거시경제를 예측하는 데 매우 유용하다는 조사 결과가 나왔다.
서범석 한국은행 거시모형팀 과장은 16일 'BOK 이슈노트(AI 알고리즘을 이용한 산업 모니터링: 증권사 리포트 텍스트 분석)'를 통해 이같이 밝혔다.
서 과장은 이번 연구를 위해 2019~2020년 52개 증권사 1079명의 애널리스트가 작성한 1283개 기업 분석보고서 12만8000건을 AI 알고리즘으로 입수하고 자연어처리 기법을 이용해 경기 향방에 대한 유의미한 경제적 정보를 추출·분석했다. 증권사 보고서에 나타나는 숫자 정보는 모두 제거하고, 오직 텍스트에 나타나는 정성적(qualitative) 정보만을 이용했다.
그는 "이를 통해 애널리스트들이 평가하는 기업 업황을 산업별로 추정했다. 추정 결과 새롭게 제시한 텍스트 업황 지수는 GDP, 기업경기실사지수(BSI) 등 거시경제 지표를 예측하는 데 매우 유용한 것으로 나타났다"고 분석했다.
이어 "특히 전산업 텍스트 업황 지수와 경기선행지수 순환변동치와의 그랜저(Granger) 인과 관계를 분석해 보면, 코스피 컨센서스 전망치에는 나타나지 않는 경기선행지수로의 일방향적 인과관계가 텍스트 지표에는 존재했다"고 강조했다.
이는 애널리스트들이 제시하는 텍스트 정보에 숫자가 전달하지 못하는 새로운 정보가 반영돼 있을 가능성이 있다고 서 과장은 설명했다.
또한 증권사 보고서 텍스트 분석을 통해 코로나, 러시아-우크라이나 전쟁, 환율, 금리 등 주요 경제 이벤트에 대한 전문가들의 견해를 취합하고, 이로 인한 이벤트 영향도 및 평가 지표를 정량화해 제시했다.
서 과장은 "일반적으로 특정 이벤트의 산업별 영향을 정량화해서 비교하는 것이 어렵다는 점에서 해당 지표들의 효용성이 매우 높으며, 서베이 조사 없이도 전문가들의 생각을 파악할 수 있다는 점에서 유용한 것으로 확인됐다"고 말했다.
증권사 리포트에서 산업 간 공통으로 나타나는 키워드의 분석을 통해 산업 간 유사도 지표도 추정했는데 추정한 지표는 산업 분석 및 전망 등에 다양하게 활용 가능하다는 분석이 나왔다.
증권사 리포트의 대상 기업을 본사 소재지 기준으로 분류해 업종별 업황과 변동요인을 지역별로 추정한 지표도 지역별 산업 동향 파악에 유용한 것으로 확인됐다.
서 과장은 "텍스트는 정보를 주고받는 가장 기본적인 수단이며 전달하는 정보 범위에 한계가 없다는 점에서 텍스트 분석 기술은 경제 분야에서도 활용 가치가 매우 높다"면서 "특히 최근 ChatGPT(GPT 3.5 기반 대화형 AI 서비스) 등 자연어처리 기술은 텍스트 분석 기술이 경제 분석 자동화에 커다란 혁신을 가져올 것으로 예상된다"고 말했다.