소리 AI

여러 사람들이 함께 대화하는

전화 통화 또는 회의 등의 상황에서 화자별로 음성을 분리합니다.

퓨렌스 만의 기술과 노하우로 기업 맞춤 AI 솔루션을 제공합니다.

여러 사람이 동시에 말하는 오디오에서 지도 학습 기반의 화자 분리 기법을 사용해 화자 별 음성 파일로 분리

학습 과정에서 화자의 수를 선택해서 유동적으로 원하는 화자의 수만큼 화자 분리 가능

여러 사람의 음성 외에도 주변 소음이 있는 경우에도 각 화자 별 음성 분리 가능

화자
분리 모델

출력 채널의 화자 수를 고정하고 입력 음성을 LSTM block과 MULCAT block을 통과시키며 음원 분리

두 개의 양방향 RNN과 skip connection를 활용해 화자 분리 수행

모델 훈련용 데이터 준비

화자 분리 모델 예측

Clean 파일과 예측 결과 비교

화자 분리 모델 개선