카카오뱅크는 금융기술연구소와 빅데이터분석팀이 공동으로 연구 개발한 '2단계 신용평가모형 연구' 논문이 국제 저명 학술지에 게재됐다고 29일 밝혔다.
논문은 빅데이터 이론 및 방법론 부문의 국제 학술지인 '저널 오브 빅데이터(Journal of Big Data)'에 게재됐다. 저널 오브 빅데이터는 저널 논문 피인용지수가 10.8로 빅데이터 이론 및 방법론에 대한 국제학술지 중 가장 높은 수준(상위 5%)에 해당하는 학술지다.
2단계 신용평가모형은 기존보다 더 많은 설명 변수(데이터 종류)를 적용할 수 있는 신용평가모형 개발 방법론이다. 다양한 변수를 사용해 평가 성능을 개선하면서 동시에 모형의 설명 가능성을 유지하는 것이 가능하다.
대부분 금융사들은 로지스틱 회귀분석을 사용해 신용평가모형을 개발하고 있다. 이는 설명 변수들이 상호 독립적이어야 한다는 가정으로 인해 최대 10개 내외의 변수만을 모델에 적용할 수 있다. 새로운 변수를 발굴하더라도 독립성의 제약으로 인해 기존의 변수들을 사용할 수 없다는 점에서 성능 개선의 한계가 존재했다.
신용평가모형의 성능을 향상시키는 머신러닝, 딥러닝 기술을 이용하는 시도도 이어지고 있다. 이러한 기술을 적용할 경우 수백 개에 이르는 데이터를 활용할 수 있다. 다반, 변수와 결과 간의 함수관계가 드러나지 않아 신용평가 과정의 설명력이 필요한 금융 분야에서는 활용하기 어려웠다.
카카오뱅크의 연구는 변수의 숫자를 크게 확대해 성능을 개선하면서도 동시에 설명 가능성도 완벽하게 유지하는 방법론과 이론적 근거를 제시했다.
모형을 살펴보면, 1단계에서 동일한 범주의 변수들을 모아 평가 모형을 만든 뒤, 각 모형의 결과값을 모아서 2단계의 분석을 수행함으로써 최종 신용도를 평가하는 방식으로 운영된다.
2단계 신용평가모형 기술은 카카오뱅크가 최근 개발한 독자적인 대안신용평가모형인 '카카오뱅크 스코어'에도 적용됐다. 카카오뱅크 스코어는 '가명정보 활용 우수사례 경진대회'에서 데이터 가명결합을 통한 대안신용평가모형 개발 사례로 대상을 수상했다. 카카오뱅크는 이미 신용평가 기술과 관련된 3건의 특허를 출원하기도 했다.
카카오뱅크 관계자는 "지속적으로 신용평가 모형 기술을 개발함으로써 금융 이력 부족 고객에게 합리적인 평가 체계를 제공하고 금융포용을 강화할 것"이라고 말했다.