Как мы сделали «ssyoutube для ChatGPT» и что из этого вышло
На
Хабре опубликован подробный технический разбор создания pdfchatgpt.com — бесплатного конвертера диалогов
ChatGPT в PDF и Markdown. Разработчики столкнулись с рядом инженерных проблем: ленивой загрузкой контента (SPA), отсутствием прямых ссылок на изображения и защитой от headless-браузеров, что мешало корректному экспорту чатов. Первая версия базировалась на puppeteer, но быстро выяснилось, что нужен обход антибот-защиты и автоматическое разрешение временных file-ID для изображений. Для этого был выбран форк playwright — patchright, маскирующий браузер под реального пользователя.
- Итоговое решение — асинхронная архитектура на Fastify + BullMQ + S3: запросы уходят в очередь, воркеры рендерят PDF, итоговые файлы доступны по ссылке.
- Отдельное внимание — корректному рендерингу: поддержка синтаксиса кода, цветные эмодзи, адаптивные таблицы (решена проблема с широкими таблицами, которые не влезают на страницу), «бесшовная» прокрутка PDF.
- Проект стартовал как pet-проект, но вырос в полноценный сервис, решающий задачу экспорта диалогов с сохранением структуры, изображений и формата.
Материал будет полезен разработчикам, кто автоматизирует работу с динамическими web-интерфейсами и экспортирует контент из LLM-платформ.
Читайте также
Автоматизация как образ мышления: как скрипты меняют не только работу, но и мозг
Конвейер цифровых сервисов: как создавать и предоставлять услуги без сбоев и стресса
Эволюция управления продуктом: ключевые инструменты и фреймворки 2024–2025
Как мы нанимаем, грейдируем и решаем задачи prompt-инженеров в финтехе: опыт Точки
Как один глупый Bash-скрипт сэкономил нам 100 часов ручной работы
Подписывайтесь на мой Telegram-канал — там еще больше интересного про AdTech, MarTech, AI и многое другое!