Photo News
박정균 석사과정(지도교수 박형민) 신호처리분야 Top conference ‘ICASSP 2024’에 논문 채택
- 2024.05.28
- 229
박정균 석사과정(지도교수 박형민)
신호처리분야 Top conference ‘ICASSP 2024’에 논문 채택
▲(왼쪽부터) 전자공학과 박형민 교수, 인공지능학과 박정균 석사과정
본교 인공지능학과 박정균 석사과정생(석사 4학기, 제1저자)과 박형민 교수(교신저자)가 신호처리분야 Top conference인 ICASSP 2024에 발표한 논문이 최종 채택되었다.
논문 제목은 ‘OLKAVS: AN OPEN LARGE-SCALE KOREAN AUDIO-VISUAL SPEECH DATASET’으로, 연구팀은 시청각 음성인식을 위한 대용량 한국어 데이터셋을 최초로 공개하였다. 이는 세계 최대 규모의 시청각 음성 데이터셋으로, 해당 연구는 이를 활용하여 음성인식 딥러닝 모델의 성능을 향상시킬 수 있음을 검증하고 그 우수성을 인정받았다.
▲연구팀이 구축한 OLKAVS 데이터셋의 견본 영상
한편, ICASSP 2024는 2024년도 4월 14일부터 19일까지 서울 COEX에서 진행될 예정이다.
▶ 논문 제목: OLKAVS: AN OPEN LARGE-SCALE KOREAN AUDIO-VISUAL SPEECH DATASET
▶ 실험 코드 및 데이터셋 링크: https://github.com/IIP-Sogang/olkavs-avspeech