VAD (Voice Activity Detector)

By | 2024년 2월 20일
Table of Contents

VAD (Voice Activity Detector)

영상이나 오디오에서 음성의 존재를 인식 또는 추출해 주는 라이브러리이다.

SILERO VOICE ACTIVITY DETECTOR

여기
여기

음성의 존재를 인식하는 라이브러리이다.
버그라기보다는 알고리즘의 영향인데…
발음을 기준으로 음성의 존재를 측정하는게 아니라…
소리의 높낮이로 음성의 존재를 측정하는 듯 하다.

따라서, 사람의 목소리 뿐만 아니라 악기 또는 벨소리 등도 음성으로 인식한다.

텍스트 추출

여기

텍스트 추출은 영어로 출력하는 라이브러리는 많지만,
한국어를 지원하는 라이브러리는 꽤 적은 듯 하다.

답글 남기기