ICASSP 2021서 음성 합성 품질 개선 및 음성 인식률 우수성 입증

[데일리포스트=송협 선임기자] 네이버와 라인이 국제 음향·음성·신호처리 학술대회 ICASSP 2021에서 양사가 공동으로 연구한 논문 2편을 비롯한 총 14편의 논문이 채택됐다.

본 학술대회서 채택된 라인은 전략사업 중 AI 사업 발전을 가속하기 위해 AI 연구개발 및 기술 활용 분야에서 네이버 클로바 및 AI LAB과 기밀하게 협력 중이며 데이터 기반 개발과 데이터 분석, 머신러닝, AI 기술개발, 기초연구를 담당하는 각 팀이 영역을 넘어 연계해 연구와 개발, 사업화로 사이클을 강화하고 있다.

현재 양사는 AI 관련 서비스 및 기능 개발의 기초연구도 진행 중이며 머신러닝 기반 음성 처리와 언어 처리, 화상 처리 등에 주력하고 있다.

특히 음향 음성 및 신호처리의 경우 GPU를 활용한 ‘Parallel WaveGAN’을 이용해 빠른 속도와 높은 품질을 실현하는 음성 합성 기술과 음성 품질과 음성 인식률 향상을 위해 다양한 소리가 혼합된 소리를 각각의 소리로 분리하는 ‘음원 분리기술 기계를 통해 소리를 자동으로 검출 및 인식하는 ’환경음 인식 기술‘을 연구하고 있다.

이번 ICASSP 2021에서 음성 합성 관련 ’생산성 대립 신경망‘을 이용해 비 자기회귀형 음성 생성 모델 ‘Parallel WaveGAN’에서 유성음 무성음 정보를 활용, 식별기를 rofidgis 연구를 소개했다.

아울러 이번 연구에서는 유성음과 무성음의 음성 성질이 상이하다는 점에 착안해 각 음성의 성질에 맞는 식별기를 설계해 합성 음성의 품질을 크게 개선시켰다.

양사의 공동 AI 브랜드 라인 클로바와 네이버 클로바는 AI 기술 및 서비스를 통해 일상과 비즈니스의 번거로움을 해소해 사용자의 삶의 질을 높이고 보다 편리하고 풍요로운 세상을 만들어가고 있다.

현재 라인과 네이버 음성 인식 기술 ‘클로바 스피치’와 음성 합성 기술 ‘클로바 보이스’를 활용한 솔루션을 제공하고 있다.

네이버 관계자는 “라인 클로바 및 네이버 클로바의 대표적인 솔루션 ‘AiCall’은 클로바 스피치 및 클로바 보이스와 대화 제어 시스템을 결합해 사용자의 요청에 AI가 자연스럽게 응대하는 서비스로 행정기관 및 음식점 등에서 활용되고 있다.”고 설명했다.

무엇보다 지난해 출시된 ‘클로바 노트’는 인터뷰나 업무 미팅 등 다양한 상황에서 대화를 인식해 내용을 기록할 수 있는 서비스이며 AI 합성음으로 동영상을 더빙할 수 있는 ‘클로바 더빙’은 코로나19로 원격수업에 나선 교사들이 동영상 자료를 제작하는데 유용하다는 평가를 받고 있다. 또 책 읽어주는 AI 조명 ‘클로바 램프’ 역시 음성인식과 합성기술이 적용됐다.

한편 라인과 네이버는 앞으로도 적극적인 AI 기초 연구를 통해 기존 서비스의 품질을 높이고 새로운 기능과 서비스를 선보일 예정이다.

◆ 라인 주식회사는?

라인주식회사는 ‘클로징 더 디스턴스’를 미션으로 사람과 정보, 콘텐츠, 서비스를 한데 모으는 글로벌 스마트 포털을 구축하고 있다. 지난 2011년 6월 라인 메신저 서비스를 시작한 이래 AI 기술과 핀테크 등 다양한 분야로 진출하며 글로벌 모바일 생태계를 조성하고 있다.

저작권자 © 데일리포스트 무단전재 및 재배포 금지