AI 개발자들 “공정 사용으로 간주해야” 주장
28일(현지시간) 워싱턴포스트(WP)에 따르면 미국 로펌 클락슨은 캘리포니아주 북부연방법원에 오픈AI가 인터넷에서 스크랩한 데이터를 사용해 수백만 명의 인터넷 사용자의 권리를 침해했다며 소송을 제기했다. 클락슨은 이전에도 데이터 유출에서 허위 광고에 이르기까지 다양한 문제에 대해 집단 소송을 제기한 적이 있다.
클락슨의 파트너 변호사인 라이언 클락슨은 “이 강력한 기술의 개발을 위해 정보를 도난당하고 상업적으로 악용당한 사람들을 대변하고자 한다”고 말했다.
이 소송은 생성형 AI의 급증과 관련해 아직 해결되지 않은 주요 문제들을 다루고 있다. 생성형 AI는 인터넷상에서 수십억 개의 단어를 수집하고 그 단어들 사이의 추론을 형성하는 방법을 학습한다. 많은 양의 데이터를 학습한 후 생성된 대규모언어모델(LLM)은 시를 쓰고 복잡한 대화를 나누며 전문 시험에 합격할 수 있는 능력을 갖추게 된다.
문제는 인터넷상의 데이터를 만든 사람들이 오픈AI와 같은 AI 개발 업체가 자사의 이익을 위해 단어를 사용하도록 허락한 적이 없다는 것이다.
클락슨은 “이 모든 정보가 LLM에서 활용될 의도가 전혀 없었는데도 대규모로 사용되고 있다”고 지적했다. 그러면서 “법원이 AI 알고리즘을 훈련하는 방법과 정보가 사용될 때 사람들이 어떻게 보상받을 수 있는지에 대한 보호 장치를 마련하길 바란다”고 덧붙였다.
일부 AI 개발자들은 인터넷에서 정보를 사용하는 것을 ‘공정 사용(fair use)’으로 간주해야 한다고 주장한다. 이는 저작권법에서 자료가 완전히 변경될 경우에만 예외로 인정되는 개념이라고 WP는 설명했다.