ⓒ데일리포스트=이미지 출처/ 수퍼톤
ⓒ데일리포스트=이미지 출처/ 수퍼톤

ㅣ데일리포스트=곽민구 기자ㅣIT와 관련된 주제를 조금 더 자세히 들여다보는 연재 코너 [IT정주행]의 이번 회차에서는 하이브 자회사인 인공지능(AI) 오디오 전문기업 수퍼톤이 준비 중인 AI 음성 신기술 프로젝트를 알아보려 해.

수퍼톤이 내년에 선보일 AI 음성 신기술은 ‘프로젝트 스크린플레이’와 ‘프로젝트 시프트’였어. 직접 체험해보니 굉장히 재미있는 기술이더라고. 특히 게이머들에게는 게임의 재미를 더해줄 특별한 요소가 될 것 같았어.

이름만 들어서는 무슨 기술인지 잘 모르겠지? 지금부터 수퍼톤의 AI 음성 신기술 프로젝트에 대해 정주행 해볼테니 잘 들어봐.


■ AI 오디오 전문기업 수퍼톤?


글로벌 엔터테인먼트 기업 하이브의 자회사인 수퍼톤은 ‘창의성의 한계를 확장하는 혁신적인 음성 기술과 콘텐츠를 개발한다’는 미션과 ‘누구나 원하는 목소리로 들을 수 있는 창의적인 환경을 구축한다’는 비전을 가진 AI 오디오 기업이야. 고유 기술을 기반으로 무한한 목소리의 생성과 변환이 가능한 최첨단 AI 음성 솔루션 역량을 확보했고, 음악·영화·드라마 등 오디오가 적용되는 모든 엔터테인먼트 콘텐츠 영역에 솔루션을 접목해 나가고 있어.

디즈니플러스 ‘카지노’에서 최민식 배우의 젊은 시절 목소리를 구현한 부분과 넷플릭스 '마스크걸'에서 BJ 마스크걸 만의 목소리를 새롭게 생성하는 부분에서 슈퍼톤 기술이 활용됐다고 해.

ⓒ데일리포스트=이미지 출처/ 수퍼톤
ⓒ데일리포스트=이미지 출처/ 수퍼톤

‘프로젝트 스크린플레이’와 ‘프로젝트 시프트’는 어떤 기능을 해?


'프로젝트 스크린플레이'는 게임 캐릭터 대사를 자연스러운 오디오로 생성할 수 있는 스크립트 기반의 오디오 생성 소프트웨어야. 입력된 텍스트를 게임 캐릭터의 목소리로 변환해주는 TTS(텍스트 투 스피치) 기능과 변환된 목소리를 나이나 성별 조정을 통해 디자인할 수 있는 기능을 제공하고 있어.

‘프로젝트 시프트’는 음성을 실시간으로 변환해 주는 'RTVC(리얼타임 보이스 컨버젼)' 기술을 지원하는 프로그램이야. 내가 하는 말을 원하는 캐릭터의 보이스로 실시간 변환해 주는 기능인 거지.

ⓒ데일리포스트=이미지 출처/ 수퍼톤
ⓒ데일리포스트=이미지 출처/ 수퍼톤

■ 수퍼톤의 이 기술을 어디에서 체험해본 거야?


지금 부산 벡스코에서 진행되고 있는 지스타 2023에서 체험해 봤어. 수퍼톤이 BTB관에 부스를 열고 게임 업계 관계자들에게 기술을 소개하는 시간을 가졌거든. 나도 게임 관련 취재를 위해 지스타 2023을 갔는데 수퍼톤의 기술이 신선하게 다가와서 시연 신청을 해 직접 체험해보게 됐어.

ⓒ데일리포스트=이미지 출처/ 수퍼톤
ⓒ데일리포스트=이미지 출처/ 수퍼톤

■ AI 음성 기술을 체험해보니 어땠어.


굉장히 재미있는 경험이었어. 먼저 ‘프로젝트 스크린플레이’를 해봤는데 내가 키보드로 친 글자가 게임 캐릭터의 목소리로 흘러나오고, 그 목소리의 톤을 조정해 다른 느낌을 주는 작업이 너무 간단하게 이뤄지는 게 신기할 정도였어.

그리고 ‘프로젝트 시프트’는 시연 공간이 많은 사람이 지나다니는 곳에 위치해 있어서 직접 해보기가 좀 민망해서 담당자가 시연하는 걸 보고 설명을 들었어. 여성 스태프분이 남성 캐릭터로 보이스를 설정하고 말을 하니까 실시간으로 저음의 보이스로 변환돼 흘러나오는데 절로 감탄이 나오더라.

 


■ 이 기술들은 어디에 적용이 되는 거야.


'프로젝트 스크린플레이' 같은 경우는 요새 캐릭터 풀보이스를 제공하는 게임들이 많이 있잖아. 대부분 몇몇의 성우를 섭외해서 주요 캐릭터의 풀보이스를 제공하는데 인디 게임이나 저예산 게임 같은 경우는 비용이나 시간상 그게 쉽지 않지. 그런데 ‘프로젝트 스크린플레이’를 활용하면 그 작업이 엄청 쉬워지는 거지. 비용도 크게 절감이 될 거고 말이야. 게임 외에도 팟캐스트, 유튜브 등 목소리가 필요한 콘텐츠를 만드는 창작자에게 유용한 제작 도구가 될 수 있을 것 같았어.

‘프로젝트 시프트’의 사용처도 ‘프로젝트 스크린플레이’와 비슷할 것 같은데. 내가 느낀 건 게임 내 음성 채팅에 이 기능이 적용되면 재미있겠다는 생각이 들더라. 음성 채팅을 하는데 내가 말하는 게 자신의 캐릭터 목소리로 상대에게 들리는 거지. 유저들이 음성으로 소통을 할수록 게임에 몰입감이 더 높아지지 않을까 싶더라고.

ⓒ데일리포스트=이미지 출처/ 수퍼톤
ⓒ데일리포스트=이미지 출처/ 수퍼톤

■ 그럼 언제부터 이 기술들이 상용화되는 거야?


내년 하반기 베타 버전 출시를 목표로 하고 있다고 해. 물론 상용화가 되더라도 누군가 이 기술을 구매해 적용해야 우리도 체험해 볼 수 있겠지만 말이야. 그런데 수퍼톤 BTB 부스를 다녀간 중소 게임사들이 이 기술에 많은 관심을 보였다고 하니 1~2년 안에는 이 기술들이 적용된 게임들을 만나볼 수 있지 않을까 싶어.

ⓒ데일리포스트=이미지 출처/ 수퍼톤
ⓒ데일리포스트=이미지 출처/ 수퍼톤

 

저작권자 © 데일리포스트 무단전재 및 재배포 금지