▶ 음성 생성 도구 ‘보이스 엔진’
▶ 활용 가능성 실험 사례 공개
오픈AI가 사람 음성을 학습해 모방 음성을 생성하는 인공지능(AI) 도구 '보이스 엔진'(Voice Engine)을 개발해 공개했다. 다만 오픈AI는 이 도구의 위험성을 고려해 본격적인 출시 여부에 대해서는 신중하게 접근한다는 입장이다.
오픈AI는 지난달 29일 자사 블로그에 "인조(Synthetic) 음성의 도전과 기회 탐색하기'란 제목으로 자사가 개발한 보이스 엔진의 사전 실험 결과를 공개했다.
회사 측은 15초 분량의 음성 샘플만 있으면 보이스 엔진을 이용해 원래 화자의 목소리와 비슷한 음성을 만들어 낼 수 있다고 밝혔다.
오픈AI는 2022년 말 보이스 엔진을 처음 개발했으며, 이를 챗GPT의 음성인식·읽어주기 기능과 텍스트-음성 변환 API(응용프로그램 인터페이스)에서 쓰이는 음성 기능 강화에 사용했다고 설명했다. 이어 이 기술의 잠재적인 활용 가능성을 알아보기 위해 지난해 말부터 신뢰할 만한 소규모 그룹과 함께 비공개 테스트를 시작했으며, 이 그룹이 개발한 애플리케이션에 깊은 인상을 받았다고 전했다.
실제로 이날 오픈AI가 공개한 실제 사람의 음성 샘플과 이를 이용해 보이스 엔진으로 생성한 음성은 거의 구분이 어려울 정도로 비슷했다.
오픈AI는 이 도구를 다양한 분야에서 긍정적인 기능으로 활용할 수 있다고 설명했다.
어린이 교육을 위한 음성 해설 콘텐츠나 실시간 개인 맞춤형 응답 생성 기능, 동영상과 팟캐스트 같은 콘텐츠를 여러 언어로 번역해 전 세계적으로 서비스하는 사례 등이다. 언어 기능에 영향을 주는 질환을 앓는 환자들을 위한 치료 애플리케이션이나 장애인을 위한 소통 기기에 지원된 사례도 있다고 오픈AI는 전했다.
블룸버그 통신은 "오픈AI가 사람의 목소리를 흉내 낼 수 있는 기능을 공개하며 AI 기술의 새로운 지평을 열었다"며 "이는 딥페이크(AI로 만든 영상이나 이미지, 음성 조작물) 위험에 대한 불안감도 일으키고 있다"고 전했다.
앞서 지난 1월 미국에서는 뉴햄프셔주 프라이머리(예비경선)를 하루 앞두고 조 바이든 대통령을 사칭한 가짜 전화가 주민들에게 걸려 와 투표 거부를 독려하는 사건이 벌어지면서 음성 조작에 대한 공포가 현실화한 바 있다.
댓글 안에 당신의 성숙함도 담아 주세요.
'오늘의 한마디'는 기사에 대하여 자신의 생각을 말하고 남의 생각을 들으며 서로 다양한 의견을 나누는 공간입니다. 그러나 간혹 불건전한 내용을 올리시는 분들이 계셔서 건전한 인터넷문화 정착을 위해 아래와 같은 운영원칙을 적용합니다.
자체 모니터링을 통해 아래에 해당하는 내용이 포함된 댓글이 발견되면 예고없이 삭제 조치를 하겠습니다.
불건전한 댓글을 올리거나, 이름에 비속어 및 상대방의 불쾌감을 주는 단어를 사용, 유명인 또는 특정 일반인을 사칭하는 경우 이용에 대한 차단 제재를 받을 수 있습니다. 차단될 경우, 일주일간 댓글을 달수 없게 됩니다.
명예훼손, 개인정보 유출, 욕설 등 법률에 위반되는 댓글은 관계 법령에 의거 민형사상 처벌을 받을 수 있으니 이용에 주의를 부탁드립니다.
Close
x총 1건의 의견이 있습니다.
인류가 지구에서 살아질 날이 점점 다가오고 있다. 나는 쪽집게 도사는 아니지만, 그래도 괜찮은 도사다.