Статья на Хабре демонстрирует практический способ превратить любое видео с YouTube в текстовый материал с минимальными затратами. Автор показывает, как скачать аудио, разбить его на части (если превышен лимит 25 Мб), транскрибировать с помощью модели Whisper от OpenAI и дополнительно обработать результат через GPT-4o. Whisper обучена на 680 тыс. часов аудио, треть которых не на английском, и демонстрирует низкий уровень ошибок для русского языка (около 5%).Для работы используется Google Colab: д