특허명 | 오디오 및 비디오 정보를 이용한 시공간 음성 구간 검출 방법 및 장치 | ||
출원인 | 고려대학교 산학협력단 | 출원일 | 2009년 2월 27일 |
공개일 | 2010년 9월 6일 | 공고일 | 2011년 6월 14일 |
요약 |
본 발명은 오디오 및 비디오 정보를 이용한 시공간 음성 구간 검출 방법 및 장치에 관한 것으로, 본 발명의 일 실시 예에 따른 오디오 및 비디오 정보를 이용한 시공간 음성 구간 검출 방법은 마이크로폰 어레이에 입력된 오디오 신호에서 음성 구간을 검출하는 단계; 상기 검출된 음성 구간에서 화자 검증을 수행하는 단계; 상기 화자 검증에 성공한 경우, 카메라에 입력된 비디오 신호를 이용하여 화자의 얼굴을 검출하고 상기 화자의 얼굴 방향을 추정하는 단계; 및 상기 추정된 얼굴 방향이 미리 저장된 기준 방향과 일치하면, 상기 검출된 음성 구간을 상기 화자의 음성 구간으로 판단하는 단계를 포함한다. 본 발명에 의하면, 인식하고자 하는 화자의 위치와 방향을 고려하여 음성 구간을 검출하여 음성 인식 시스템의 성능을 향상시킬 수 있고, 화자의 위치가 시스템이 예상한 위치를 벗어나는 경우에는 적응적인 동작이 가능하다.
|
특허명 | 출원일 | ||
---|---|---|---|
음성 인식 방법 및 장치 | 2012년 5월 14일 | ||
환자의 뱃속 소리를 탐지하여 소화관을 스캔할 수 있는 스캔장치 | 2019년 4월 5일 | ||
딥러닝 기반의 포즈 변화에 강인한 얼굴 인식 방법 및 장치 | 2018년 2월 1일 | ||
마이크로폰 어레이를 이용한 사용자 음성 인식 장치 및 그 마이크로폰 어레이 구동 방법 | 2007년 2월 6일 | ||
잡음 환경에서의 음성 처리 장치 및 방법 | 2011년 3월 8일 |