Photo News
- 2024.05.28
- 192
신의협 박사과정(지도교수 박형민),
국제 저명 저널 IEEE/ACM Trasaction on Audio, Speech, and Language Processing 논문 게재
▲(왼쪽부터) 전자공학과 박형민 교수, 신의협 박사과정
본교 지능정보 처리 연구실 (지도교수 박형민)의 신의협 박사과정생이 제1저자로 국제 저명 저널 IEEE/ACM Transactions on Audio, Speech, and Language Processing(2022년 기준 Impact Factor 5.4, JCR 상위 8.1%)에 게재 승인되었다. 발표된 논문 제목은 “Statistical Beamformer Exploiting Non-stationarity and Sparsity with Spatially Constrained ICA for Robust Speech Recognition”으로 신의협 학생은 해당 연구를 주도하였다.
해당 논문은 잡음 환경에서의 강인한 음성인식을 위한 어레이 마이크를 이용한 통계적 음성 빔포밍에 관한 것이다. 음향 빔포밍을 통해 주변 잡음을 줄이고 강인하게 음성만을 향상시킬 수 있다.
제안한 알고리즘은 음성의 통계적 특성을 non-stationary Laplacian 분포 기반으로 빔포밍을 모델링한다. 또한 독립 성분 분석(Independent Component Analysis, ICA) 기법을 응용하여 빔포밍을 위한 방향 추정을 동시에 진행하여 별도의 방향 정보가 없이 효과적으로 빔포밍을 수행한다.
해당 알고리즘은 다양한 실제 환경에서도 음성 인식을 강인하게 하는 전처리 기법으로서 적용될 수 있을 것으로 기대된다.
- 논문제목: Statistical Beamformer Exploiting Non-stationarity and Sparsity with Spatially Constrained ICA for Robust Speech Recognition
저널명: IEEE/ACM Transactions on Audio, Speech, and Language Processing(2022년 기준 Impact Factor 5.4, JCR 상위 8.1%)