오픈AI, 인간처럼 대화하는 ‘GPT-4o’ 공개…올트먼 “놀라운 현실”

입력 2024-05-14 08:46 수정 2024-05-14 09:24
  • 가장작게

  • 작게

  • 기본

  • 크게

  • 가장크게

실시간 음성 대화 가능해져
반응 속도 최소 232밀리초
“사용 편의성 큰 진전 이뤄”

▲컴퓨터 메인보드 근처에 오픈AI 로고가 보인다. 로이터연합뉴스
▲컴퓨터 메인보드 근처에 오픈AI 로고가 보인다. 로이터연합뉴스

챗GPT 개발사 오픈AI가 인간과 같은 반응 속도로 음성 대화가 가능한 새로운 AI모델 ‘GPT-4o(GPT-포오)’를 선보였다.

13일(현지시간) 블룸버그통신에 따르면 미라 무라티 오픈AI 최고기술책임자(CTO)는 이날 라이브 스트리밍 행사에서 기존 모델을 업데이트한 대규모 언어모델(LLM) GPT-4o를 공개하고 성능을 시연했다.

GPT-4o에서 ‘o’는 ‘모든’을 의미하는 ‘옴니’의 첫 글자다. 한국어를 포함한 50가지 언어에 대응하는 것은 물론, 문자와 이미지ㆍ음성까지 인식한다. 실시간 번역 외에 스마트폰 카메라를 사용, 사람의 표정이나 그래프마저 읽는다.

오픈 AI는 “시스템에 말을 걸면 빠르게 음성으로 응답해 흐르는 듯한 대화가 가능하다”고 설명했다. 음성에 대한 반응 속도는 빠르면 232밀리초, 평균 320밀리초로 사람이 실제로 대화할 때와 같은 수준을 실현했다고 한다. 인간의 감정을 읽고 농담도 하면서, 한층 자연스러운 대화가 가능해졌다.

이날 열린 웹 발표회 시연에서는 개발자가 음성으로 아이를 재우는 장면을 가정하고 그에 맞는 이야기를 읽어달라고 요청했다. 목소리를 극화 톤으로 바꾸고, 노래를 부르며 읽게 하는 등의 조작을 선보였다.

미라 무라티 오픈AI 최고기술책임자(CTO)는 이날 발표회에서 “처음으로 사용 편의성 측면에서 정말로 큰 진전을 이뤘다고 생각하게 됐다”고 말했다.

샘 올트먼 오픈AI 최고경영자는 이날 소셜미디어 엑스(X·옛 트위터)에서 “인간 수준의 반응과 표현력에 이른 것은 큰 변화”라며 “영화 ‘her’에 나오는 AI처럼 느껴지며, 현실이라는 것이 조금 놀랍다”고 강조했다.

  • 좋아요0
  • 화나요0
  • 슬퍼요0
  • 추가취재 원해요0

주요 뉴스

  • [알림] 이투데이, '2024 CSR 영상공모전'... 27일까지 접수
  • ‘어둠의 코시’ 프로야구 포스트시즌으로 향하는 매직넘버는? [해시태그]
  • '농협은행'·'거지가 되'…Z세대의 말하기 문화?①[Z탐사대]
  • Z세대의 말하기 문화, 사회적 유산일까 문제일까②[Z탐사대]
  • “AI·카메라 컨트롤 기능 기대감”…아이폰16 출시 첫날 ‘북적’ [르포]
  • “나들이 가기 딱 좋네”…서울시민이 꼽은 여가활동 장소 1위는?
  • '로또보다 더 로또' 강남 분상제 아파트 잡아라…청약 경쟁 '치열'
  • 오늘부터 독감 예방접종 시작…어린이·임신부·어르신 순차 진행
  • 오늘의 상승종목

  • 09.20 장종료

실시간 암호화폐 시세

  • 종목
  • 현재가(원)
  • 변동률
    • 비트코인
    • 84,380,000
    • -0.49%
    • 이더리움
    • 3,414,000
    • +0.44%
    • 비트코인 캐시
    • 450,700
    • -0.97%
    • 리플
    • 782
    • -0.38%
    • 솔라나
    • 197,100
    • -2.18%
    • 에이다
    • 475
    • -0.84%
    • 이오스
    • 694
    • +0.29%
    • 트론
    • 203
    • +0%
    • 스텔라루멘
    • 130
    • +0.78%
    • 비트코인에스브이
    • 65,050
    • -1.29%
    • 체인링크
    • 15,210
    • -2.56%
    • 샌드박스
    • 372
    • +1.36%
* 24시간 변동률 기준