삼성전자는 세트 부문 선행 연구개발(R&D) 조직인 삼성리서치 산하 폴란드연구소와 북경연구소가 각종 글로벌 AI 경진대회에서 우승을 차지했다고 14일 밝혔다.
폴란드연구소와 북경연구소는 자동 언어 번역 워크숍 중 하나인 구술 언어 번역 국제워크숍(IWSLT)에 참가해 두 개의 개별 과제에서 1위를 차지했다. IWSLT는 올해 자연어 처리 분야에서 최고 수준의 국제학술대회인 전산언어학협회(ACL) 콘퍼런스에 포함되는 등 세계적으로 권위 있는 행사다.
폴란드연구소는 영어로 구성된 TED 강연을 독일어로 번역해내는 과제를 자체 연구 역량만으로 성공적으로 이행하며 2년 연속 오디오-텍스트 번역 부문 1위를 달성했다. 텍스트-텍스트 번역 부문을 포함하면 올해로 4년 연속 IWSLT 경진대회 1위를 차지하는 쾌거를 이뤘다.
폴란드연구소는 영어-독일어 오디오-텍스트 번역 부문에 참가해, 입력된 음성을 곧바로 번역하는 엔드 투 엔드(E2E) 시스템으로 과제를 해결했다.
음성 인식 단계의 오류가 빈번했던 전통적 시스템과 달리, E2E는 음성 입력 후 곧바로 번역이 진행돼 오류를 줄일 수 있다. E2E 음성 번역 시스템은 아직 연구 기간이 3년에 불과하지만, 전통적 방식을 능가하는 성과를 냈다는 평가다.
북경연구소는 일본어-중국어 간 번역 능력을 평가하는 ‘오픈 도메인 번역’ 과제에서 우승을 차지했다.
대형 번역 모델 설계를 기반으로 한 ‘상대적 위치 어텐션’ 방식을 채택해 사전 데이터 처리의 정교함을 높였다. 신경망 기계 번역(NMT) 성능을 향상시키기 위해 단일 언어 말뭉치를 본래 언어로 역번역하는 과정도 포함했다.
앞서 두 연구소는 다른 글로벌 경진대회에서도 수상하며 능력을 입증한 바 있다.
폴란드연구소는 국제전기전자공학회(IEEE)가 개최한 DCASE 2020 경진대회에서 ‘기계 상태 모니터링을 위한 이례적인 소리의 자율적 포착’ 과제에서 40개 팀 중 2위를 차지했다. 해당 과제는 정상적인 소리 샘플들 사이에서 이례적 소리를 감지해내는 내용이다.
또 지난해엔 2019년 음향 장면 이해와 소리의 출처를 측정하는 과제에서 1위를 차지했다.
북경연구소의 경우 지난 6월 컴퓨터 비전 분야 세계 최고 수준 학회인 CVPR 2020이 주최한 각종 경진대회에서도 우수한 성적을 거뒀다.
△가상 환경하에서 로봇이 인간의 명령을 이해하고 올바른 행동을 할 수 있도록 유도하는 ‘체화된 인공지능 경진대회’, △시각장애인이 촬영한 이미지에 대해 알맞은 설명을 예측해내는 ‘비즈위즈 캡션 경진대회’, △다양한 언어로 영상에 대해 설명할 수 있는 모델 개발의 진행 상황을 비교·평가하는 ‘바텍스 영상 캡션 경진대회’ 등에 참가해 2위를 차지했다.