AI 합성음 품질 향상 연구…업계 최고 수준의 음성 합성 구현
부스 마련해 연구 현황 공개, AI 인력 채용에 대한 상담 실시
엔씨소프트(엔씨)가 국제 AI 학회 ‘인터스피치 2022’에서 3편의 논문을 발표한다고 15일 밝혔다. 올해로 23회차를 맞는 인터스피치는 글로벌 AI 기업들이 최신 기술을 공유하는 세계 최고 권위의 음성 AI 학회다. 올해는 인천 송도에 위치한 ‘컨벤시아’에서 18일부터 22일까지 진행된다.
엔씨의 AI 센터 산하 연구실인 ‘스피치 AI 랩’은 오랜 기간 음성합성 관련 연구를 진행하며 권위 있는 학회에 결과를 공유해온 것으로 알려졌다. 인터스피치에도 3년 연속으로 논문을 게재했고, 올해는 3편의 논문이 채택됐다.
채택된 논문 3편의 주제는 △적대적 다중 작업 학습 기반 음색·피치 표현 분리 모델링 방안 연구, △사전 학습된 뉴럴 보코더를 이용한 발화 품질 향상 연구, △합성음 표현 다양화를 통해 자연스러움 향상을 위한 연구 등이다. 이번 연구를 통해 음성합성(TTS) 및 가창합성(SVS) 시스템의 품질을 업계 최고 수준까지 구현했다는 게 엔씨의 설명이다.
김희만 앤씨 스피치 AI 랩 실장은 “엔씨의 음성 AI 기술은 이미 상용화를 넘어 다음 단계를 바라보고 있다”라며 “차별화된 수준의 기술을 연구하고 그 결과를 외부와 꾸준히 공유할 생각”이라고 밝혔다.
한편, 엔씨는 인터스피치 학회 내 부스를 마련해 연구 현황을 공유하고 데모 버전을 시연할 예정이다. 아울러 학회 참가자를 대상으로 AI 인력 채용에 대한 상담도 진행한다.