Видео в текст: дешёвая транскрибация YouTube в статьи с помощью Whisper
Статья на
Хабре демонстрирует практический способ превратить любое видео с
YouTube в текстовый материал с минимальными затратами. Автор показывает, как скачать аудио, разбить его на части (если превышен лимит 25 Мб), транскрибировать с помощью модели Whisper от
OpenAI и дополнительно обработать результат через GPT-4o. Whisper обучена на 680 тыс. часов аудио, треть которых не на английском, и демонстрирует низкий уровень ошибок для русского языка (около 5%).
Для работы используется
Google Colab: достаточно установить pytubefix (форк pytube), pydub, ffmpeg и OpenAI API. Процесс включает: загрузку аудио, разбиение на чанки, транскрибацию, постобработку текста и сохранение результата. Дополнительно можно задать промпты для корректной расстановки знаков препинания и терминов. Стоимость транскрибации Whisper составляет $0,006 за минуту, что эквивалентно ~$0,36 за час — в 5 раз дешевле готовых сервисов.
Подход позволяет быстро получать текстовые версии интервью, подкастов, инструкций и фильмов, улучшать SEO индексацию и создавать статьи для сайтов. При желании код можно запускать локально или на VPS, скачав его с GitHub.
Читайте также
Как ускорить и удешевить транскрибацию в OpenAI: простой трюк с ffmpeg
От идеи до платформы: путь и уроки разработки AI-радио Tunio за полгода
MIT и Кембридж: ChatGPT снижает креативность и память — как этого избежать
Развитие искусственного интеллекта: что такое AGI, когда он появится и что будет дальше?
Тестовый стенд с автономным ИИ-агентом QA для тестирования бэкенда: концепция и пример
- Whisper для дешёвой транскрибации видео: Модель Whisper от OpenAI позволяет транскрибировать видео в текст с высокой точностью даже при плохом качестве звука. Обучена на 680 тыс. часов аудио, треть которых не на английском, и показывает всего около 5% ошибок на русском. Стоимость транскрибации — около $0,36 за час, что в 5 раз дешевле готовых сервисов.
[AI-инструменты для работы с контентом]
Зарегистрированные пользователи видят только два тезиса.
Зарегистрироваться