소리 AI

퓨렌스 만의 기술과 노하우로 기업 맞춤 AI 솔루션을 제공합니다.

여러 사람이 동시에 말하는 오디오에서 지도 학습 기반의 화자 분리 기법을 사용해 화자 별 음성 파일로 분리

학습 과정에서 화자의 수를 선택해서 유동적으로 원하는 화자의 수만큼 화자 분리 가능

여러 사람의 음성 외에도 주변 소음이 있는 경우에도 각 화자 별 음성 분리 가능

화자
분리 모델

출력 채널의 화자 수를 고정하고 입력 음성을 LSTM block과 MULCAT block을 통과시키며 음원 분리

두 개의 양방향 RNN과 skip connection를 활용해 화자 분리 수행

모델 훈련용 데이터 준비

화자 분리 모델 예측

Clean 파일과 예측 결과 비교

화자 분리 모델 개선