이번 법 개정은 4차 산업혁명 시대를 맞아 핵심 자원인 데이터의 이용 활성화를 통한 신산업 육성이 범국가적 과제로 대두되고 있는 시점에서, 인공지능, 클라우드, 사물인터넷 등 신기술을 활용한 데이터 이용을 촉진시키기 위한 제도 정비라는 차원에서 이루어졌다. 그러나 법 개정을 반대하는 측에서는 정보 접근이 용이해지면 개인정보 유출 및 불법적 이용으로 시민들의 불이익 및 인권침해가 우려된다고 주장하고 있다.
그러나 이러한 기대, 우려와는 달리 필자는 데이터 3법의 효과나 부작용 모두가 그다지 크지 않을 것으로 전망한다. 데이터 3법의 개정으로 데이터 활용 측면에서 달라지는 것은 ‘가명 데이터’를 사용할 수 있게 된 점이다. 가명 데이터란 개인정보에 대해 특정인을 식별할 수 있는 항목(예를 들면 이름, 주민등록번호 등)을 다른 사람들이 알지 못하도록 다른 형태로 바꾼 것을 말한다. 요즘 코로나19가 확산하고 있는데, 확진자의 이름을 밝히지 않고 ‘5번 확진자’, ‘31번 확진자’ 등으로 표현하는 것이 좋은 예이다.
가명 정보는 서로 다른 기관에서 보유하고 있는 데이터를 결합하기 위해 필요하다. 예를 들면 국세청과 의료보험공단이 보유하고 있는 자료를 결합하여 국민들의 개인별 소득과 진료기록을 파악하려 한다고 하자. 이를 위해서는 국민개개인의 주민등록번호나 이름, 주소와 같은 개인 신상에 관한 항목이 필요한데, 이는 모두 개인정보 보호를 위해 제공이 불가능하다. 그런데 국세청과 의료보험관리공단 모두가 ‘홍길동’이라는 사람에 대해 동일한 가명을 부여하여 데이터를 제공한다면 개인정보는 보호하면서 두 데이터를 연결시킬 수 있게 된다.
그럼에도 불구하고 가명정보의 이용을 확대하는 이번 데이터 3법 개정이 왜 그다지 큰 효과가 없다는 것인가? 이는 다음과 같은 두 가지 이유에서이다.
먼저 이번 법 개정에서는 가명정보의 이용 범위를 통계작성, 연구 및 공익적 기록보전에 한정시켰다. 첫째는 데이터 사용의 범위에 관한 문제로서, 가명정보의 상업적 이용은 여전히 엄격히 규제되므로 법 개정이 되었다고 해서 사업 환경이 크게 달라질 것은 없다. 둘째는 가명 데이터 사용에 수반되는 현실적 문제로, 설사 상업적 목적의 가명 정보 이용을 허용한다고 하더라도 가명 정보의 사용을 현실적으로 가능하게 할 제도적 기반이 아직 불충분하다.
다시 앞의 예를 보자면 가명정보를 이용하여 국세청과 의료보험관리공단의 자료를 결합시키기 위해서는 두 기관이 보유한 개인정보를 모두 보유한 제3의 기관, 즉 데이터 플랫폼이 필요하다. 데이터 플랫폼이란 통계청의 데이터 허브와 같이 개인정보를 포함하고 있는 여러 기관의 통계를 물리적으로 한 곳에 모아 연결시킨 후 가명정보로 전환하여 이용자에게 제공하는 역할을 담당하는 기관이다. 그런데 이러한 데이터 플랫폼을 설립하는 데에는 많은 현실적·제도적 장벽이 존재한다. 데이터 3법의 시행을 앞두고도 이에 대한 사회적 논의조차 제대로 되고 있지 않은 것으로 보인다. 이는 그동안 우리나라에서 데이터 결합에 대한 논의는 수없이 이루어져 왔으나, 이 문제에 대해 현실적 경험을 가진 사람들이 거의 없기 때문으로 생각된다.
그리고 데이터 플랫폼이 설립된다고 하더라도 개별 데이터 보유기관이 자발적으로 플랫폼에 데이터를 제공하여야 하는데, 데이터 보유기관에 이에 대한 현실적인 인센티브가 얼마나 있을지도 의문이다.
이러한 점에서 데이터 3법의 개정에도 불구하고 당분간은 데이터의 산업적 활용에 대한 획기적 변화는 그다지 기대하기 어렵다.