faster-whisper를 이용하여 자막 생성하기

앞서 소개한 faster-whisper-large-v3 음성인식 라이브러리를 이용하여 자동으로 일본어나 영어자막을 생성하는 샘플 스크립트를 작성해 본다. 직접 제작한 동영상이나 영어 또는 일본어 등 외국 영화에 대한 자막파일을 자동으로 생성하여 동영상 재생 중에 음성부분에 대한 자막을 영상에 오버레이하여 보여줄 수 있다. 샘플 스크립트의 구조 및 코드 샘플 스크립트를 구동하게 위해서는 구동 하려는 PC에 Python 3.8 이상과 ffmpeg 라이브러리가 … 더 읽기

faster-whisper, 음성인식 AI 라이브러리

faster-whisper란? faster-whisper는 OpenAI의 음성 인식 모델 Whisper를 더 빠르고 효율적으로 사용할 수 있도록 재구현한 오픈소스 라이브러리입니다.원본 Whisper는 높은 정확도로 찬사를 받았지만, 속도가 느리고 컴퓨터 자원을 많이 소모한다는 단점이 있었습니다. faster-whisper는 이 단점을 보완하며 등장했고, 지금은 개발자들 사이에서 사실상 표준처럼 쓰이고 있습니다. 왜 ‘faster’일까? – 핵심 특징 1. CTranslate2 기반의 속도와 효율성 faster-whisper는 기존 PyTorch 대신 … 더 읽기