네이버 음성인식의 진화… 여러명이 동시에 말해도 거뜬

입력 2019-04-05 17:46
  • 가장작게

  • 작게

  • 기본

  • 크게

  • 가장크게

▲김성훈 네이버 클로바 리더가 클로바 AI에 대해 설명하고 있다. (조성준 기자 tiatio@)
▲김성훈 네이버 클로바 리더가 클로바 AI에 대해 설명하고 있다. (조성준 기자 tiatio@)

네이버가 음성인식을 활용한 다양한 기술 발전에 나선다. 앞으로는 음성을 통해 식당 예약과 주문이 가능해질 전망이다.

네이버는 서울 그랜드 인터컨티넨털 호텔에서 개최한 ‘네이버 AI 콜로키움 2019’에서 음성인식을 활용한 ‘듀엣’ 서비스를 개발하고 있다고 5일 밝혔다.

이날 김성훈 네이버 클로바 리더는 ‘클로바 AI 함께해요’를 주제로 음성합성, 입술읽기, 동작인식 등 새로운 음성인식 기술을 선보였다.

우선 음성 합성을 통해 새로운 기계음을 만들 수 있다. 현재 기계음은 딱딱한 톤이 대부분이지만 여러 요소 변화를 통해 사투리 등 일상어에 친숙한 음성으로 변화시킬 수 있다. 톤을 바꾸면서 지루하지 않고 다양하게 변화시키는 것이 가능하다는 뜻이다.

또 주변이 시끄러운 환경에서도 음성인식이 가능해진다. 여러명이 동시에 말을 해도 카메라는 말하는 사람의 입술모양을 분석해 정확한 텍스트 도출이 가능하다. 카메라는 입술을 정확하게 인식해 전달하고자 하는 문장을 읽어낼 수 있다. 얼굴이나 입술뿐만 아니라 전체 동작을 스캐닝 해 춤 점수 자동 계산 등 새로운 기술도 선보였다.

네이버는 이 같은 기술을 합쳐 ‘듀엣’ 서비스를 개발하고 있다. 이날 행사장에서는 ‘듀엣’을 활용해 식당을 예약하고 음식을 주문하는 시연을 펼쳤다. 다만 듀엣은 현재 컨셉형 모델로 앞으로 기술 개발에 방향에 따라 변경될 가능성도 있다.

김성훈 리더는 “음성을 듣는 것과 보는 것이 중요해지면서 음성인식은 이제 일상이 됐다”라며 “앞으로 음성을 활용한 다양한 기술개발을 통해 여러 가지를 할 수 있도록 할 것”이라고 말했다.

  • 좋아요0
  • 화나요0
  • 슬퍼요0
  • 추가취재 원해요0

주요 뉴스

  • 어떤 주담대 상품 금리가 가장 낮을까? ‘금융상품 한눈에’로 손쉽게 확인하자 [경제한줌]
  • 2025 수능 시험장 입실 전 체크리스트 [그래픽 스토리]
  • "최강야구 그 노래가 애니 OST?"…'어메이징 디지털 서커스'를 아시나요? [이슈크래커]
  • 삼성전자, 4년 5개월 만 최저가...‘5만 전자’ 위태
  • 고려아연, 유상증자 자진 철회…"신뢰 회복 위한 최선의 방안"
  • 재건축 추진만 28년째… 은마는 언제 달릴 수 있나
  • 법원, 이재명 ‘공직선거법 1심’ 선고 생중계 불허…“관련 법익 종합적 고려”
  • ‘음주 뺑소니’ 김호중 1심 징역 2년 6개월…“죄질 불량·무책임”
  • 오늘의 상승종목

  • 11.13 장종료

실시간 암호화폐 시세

  • 종목
  • 현재가(원)
  • 변동률
    • 비트코인
    • 126,551,000
    • +4.26%
    • 이더리움
    • 4,571,000
    • -0.33%
    • 비트코인 캐시
    • 600,000
    • -0.17%
    • 리플
    • 1,003
    • +10.22%
    • 솔라나
    • 304,900
    • +3.57%
    • 에이다
    • 798
    • -0.75%
    • 이오스
    • 784
    • +2.22%
    • 트론
    • 252
    • +0.8%
    • 스텔라루멘
    • 183
    • +10.24%
    • 비트코인에스브이
    • 79,500
    • -2.03%
    • 체인링크
    • 19,630
    • +0.2%
    • 샌드박스
    • 410
    • -0.49%
* 24시간 변동률 기준