챗GPT, 음성↔텍스트 상호 변환...소통 능력 향상 기대

입력 : 2023.10.11 10:03
이메일 글자확대 글자축소 스크랩
  • 윤리문제 등 제어 벗어날 수도 있어 "주의"
  • 비영어권 국가 최초 한국어 개인정보 처리방침 제공
챗GPT-1-horz.jpg대화형 인공지능 서비스 챗GPT 제조사인 오픈AI는 챗GPT에 사진을 인식하고 음석을 텍스트로 변화하는 등 새로운 기능을 탑재했다. 사진=챗GPT 영상 캡처


대화형 인공지능(AI) 서비스 챗GPT가 텍스트를 통해 사용자와 소통했던 단계를 벗어나 사진을 인식하고 음성을 텍스트로 변환하고, 텍스트를 다시 음성으로 합성할 수 있는 버전을 도입한다고 밝혀 이전보다 더 인간다운 모습을 보일 전망이다.

 

기술 과학 전문매체 기즈모도(GIZMODO)에 따르면, 챗GPT 제조사인 오픈AI는 챗GPT에 도입될 프로모션 비디오를 통해 사용자에게 이미지 인식 기능에 대해 선보이고 있다고 전했다.

 

예를 들어, 사용자가 챗GPT에게 자전거 좌석을 낮춰달라고 요청하면 챗봇은 먼저 모든 종류의 좌석을 낮추기 위한 일반적인 조언을 했다. 위의 사진에서 볼수 있듯이 처음 자전거 좌석을 사용하는 이용자가 자전거 좌석 캐치 주위에 원을 그린 후 더 자세한 도움을 요청하면, 챗GPT는 해당 볼트 유형을 인식하고 엘렌 렌치가 필요하다고 답했다. 이 시스템은 사용자 설명서와 공구 상자의 사진을 보고 올바른 크기의 렌치가 있는지도 확인할 수 있다고 기즈모도는 설명했다.

 

음성 인식 시스템 적용

 

물론, 이미지 인식은 많은 챗봇 서비스에서 실험한 것이 아니지만 음성 인식 시스템과 음성 합성에 대한 최신 기술을 보유하고 있다는 것이 오픈AI 측의 설명이다.

 

오픈AI는 챗봇의 새로운 음성 서비스를 사용자에게 소개하기 위해 '어머니가 챗GPT에게 특정 숲에 살고 있는 고슴도치에 대한 이야기를 자녀들에게 읽어 달라'고 요청하는 비디오를 공개했다. 비디오의 말투는 자연스러웠지만, 그림책의 캐릭터들이 각각의 고유한 목소리를 내지는 않았다. 캐릭터의 음성은 시스템에 라이선스를 부여한 성우의 목소리를 기반으로 하기 때문이다.

 

이는 일레븐랩스(ElevenLabs)와 같은 다른 AI 음성 합성과 유사하다. 해당 서비스는 처음에는 딥페이크(인공지능을 기반으로 활용한 인간 이미지 합성 기술)나 괴롭힘에 사용돼 비판을 받았다.

 

오픈AI는 자사의 첫 번째 음성 서비스가 챗GPT 음성 채팅에서만 적용된다고 밝혔고, 최근 새로운 팟캐스트 음성 번역 기능을 발표한 스포티파이(Spotify)에 음성 시스템 라이선스를 제공하고 있다. 이로써 스페인어, 프랑스어, 독일어로 인기 팟캐스터의 목소리를 모방할 수 있게 될 예정이다.

 

물론 이 새로운 기능은 챗GPT의 '플러스(Plus)' 또는 '엔터프라이즈(Enterprise)' 서비스 비용을 지불한 사용자에게만 제공되며 두 기능 모두 10월 중순께 iOS와 안드로이드(Android)에서 사용할 수 있게 된다.

 

챗GPT 웹 버전 사용자도 곧 이미지 기능을 이용할 수 있게 될 전망이다. 다만, 이 시스템은 프로모션 비디오에서 제안하는 것처럼 빠르거나 능숙하지는 않을 것으로 보인다.

 

과학 기술매체 와이어드(Wired)에 따르면, 챗GPT 시험용 버전을 기반으로 음성 인식이 응답하는 데 몇 초가 걸렸다. 이 매체는 이미지 시스템이 사진 속 사람을 식별하려고 시도하지 않을 것이며, 사생활을 어떻게 보호할지 두고 봐야 할 것이라고 지적했다.

 

오픈AI 대변인은 기즈모도에 "시간이 지나면서 점진적으로 개선하고 위험을 줄일 수 있는 세부 사항들을 다듬는 것이 중요하다"며 "이 새로운 기능을 최소화하기 위해 '레드팀'을 구성했다"고 밝혔다.

 

그러나 사용자들이 다시 한번 챗봇의 윤리적 경계를 넘어서는 것은 시간문제다. 챗GPT는 지난 2022년 11월 공개 직후 대대적으로 인기를 끈 이후 사용자 수가 감소했다. 이는 일부 사용자들이 오픈AI가 챗봇의 기능을 제한했다고 느꼈기 때문이다. 오픈AI는 피해를 최소화하고 챗봇 사용자들이 자유롭게 활용할 수 있는 윤리적 균형을 찾는 데 어려움을 겪고 있다.

 

한국어 개인정보 방침 제공

 

한편, 오픈AI는 지난 2023년 9월 비영어 국가 중 처음으로 한국어로 된 개인정보 처리방침을 제공하고 국내 이용자를 위한 개인정보 가이드라인을 마련했다. 회사 서비스를 통해 수집되는 개인정보를 추가로 이용하기 위한 조건과 아동의 기준이 상향된 것으로, 국내 이용자 687명의 개인정보 유출 건에 대한 개인정보보호위원회의 개선 권고 일환이다.

 

오픈AI가 대한민국 이용자로부터 수집한 개인정보를 활용하기 위해서는 먼저 수집된 개인정보의 추가적인 이용·제공이 당초 수집 목적과 관련성이 있어야 한다. 동시에 수집한 데이터를 추가로 이용·제공할 수 있다는 예측도 가능해야 한다. 또 대한민국 '아동'의 연령기준을 13세에서 14세로 상향했다. 이밖에도 '처리 위탁 및 국외 이전'의 기준을 마련하고 '개인정보 파기 절차 및 방법', '정보주체와 법정대리인의 권리', '연락처', '국내대리인'을 명시했다.

권일구 기자 insu@foeconomy.co.kr
© 포커스온경제 & foeconomy.co.kr 무단전재-재배포금지

IT/바이오 많이 본 기사

메일보내기닫기
기사제목
챗GPT, 음성↔텍스트 상호 변환...소통 능력 향상 기대
보내는 분 이메일
받는 분 이메일