루닛에 따르면 연세대학교 세브란스병원, 서울아산병원, 삼성서울병원 등 한국의 주요 대학 병원들과 함께 진행한 이번 연구는 한국뿐 아니라 미국, 영국 등 5개 기관에서 수집된 17만 건 이상의 대규모 유방촬영 영상 데이터를 기반으로 했다.
특히, 제품 개발을 위해 전 세계 유방촬영술 관련 AI 연구 중 가장 큰 규모인 조직 검사를 통해 확진된 3만6000건 이상의 유방촬영 영상이 활용됐다.
루닛의 최고 제품 책임자(CPO)이자 논문의 공동 1저자인 김효은 이사는 “이번 연구에 사용된 3만6000건의 유방암 데이터는 이전에 행해진 유사 연구의 악성 데이터 수보다 7배 이상 더 많은 양”이라며 “인종에 따라 유방조직의 특성이 다르고 영상 장비와 촬영 환경에 따라 판독 정확도가 달라질 수 있는데, 이 점을 모두 고려한 양질의 데이터와 지난 4년간 루닛이 개발한 독자적 알고리즘의 결합 덕분에 의미 있는 결실을 맺었다”고 설명했다.
연구팀에 따르면 유방촬영 영상 판독 시 AI를 활용할 경우 영상의학 전문의의 판독 능력이 크게 향상됐다. 예를 들어 유방암 검출 정확도 측면에서 인공지능은 88.8%의 민감도를 보인 반면, 영상의학 전문의는 75.3%의 민감도를 보였다. 하지만 전문의가 AI의 도움을 받았을 때 민감도가 84.8%로 크게 향상됨을 확인할 수 있었다.
연구진은 AI 활용에 의한 판독 정확도 향상에 대해 AI가 의사 대비 특정 형태의 유방암들을 높은 정확도로 검출할 수 있었기 때문이라고 설명했다. 예를 들어 AI는 영상의학과 전문의와 비교해 종괴(mass, 90% 대 78%) 및 왜곡 또는 비대칭(distortion or asymmetry, 90% 대 50%) 형태의 유방암 검출에 있어 더욱 우수한 민감도를 보였다.
또한 AI의 높은 정확도는 진단이 어려운 조기 침윤성 유방암의 검출에 더욱 뛰어났다. 영상의학 전문의의 경우 T1 암 및 림프절 비전이 암 각각에 대해 74%의 민감도를 보인 반면, AI는 각각 91% 및 87%의 민감도를 보였다.
유방 조직의 밀도(density) 역시 유방촬영영상 진단에 중요한 요소이다. 서양 인종 대비 치밀 유방의 비율이 높은 아시아 인종의 경우 유방암 병소가 유방조직에 가려질 가능성이 높기 때문에 유방촬영영상 판독의 정확도가 떨어질 수 있다.
논문에 따르면 AI의 진단 성능은 유방 밀도의 영향을 덜 받은 반면, 영상의학과 전문의는 밀도에 영향을 크게 받았다. 치밀 유방에 대한 전문의의 민감도는 73.8%로, 치밀 유방이 아닌 경우에 대한 민감도 79.2%보다 현저히 낮았다. 하지만 AI의 도움을 받을 경우, 전문의의 치밀 유방 판독 민감도가 85.0%로 크게 향상됐다.
이번 연구를 총괄한 김은경 연세의대 영상의학과 교수는 “유방촬영영상 판독에 있어 큰 어려움 중 하나는 판독에서 놓치는 병변을 줄이기 위해 추가 검사를 진행시키는 경향이 있는데 이 중 적지 않은 부분이 불필요한 검사일 수 있다는 것”이라며 “우리 연구에 따르면 인공지능은 위양성에 대한 재검사율(false positive recall rate) 증가 없이 더 많은 조기 유방암의 발견에 도움을 줄 수 있는 가능성을 확인했다”고 말했다.