Как мы сделали «ssyoutube для ChatGPT» и что из этого вышло

На опубликован подробный технический разбор создания pdfchatgpt.com — бесплатного конвертера диалогов в PDF и Markdown. Разработчики столкнулись с рядом инженерных проблем: ленивой загрузкой контента (SPA), отсутствием прямых ссылок на изображения и защитой от headless-браузеров, что мешало корректному экспорту чатов. Первая версия базировалась на puppeteer, но быстро выяснилось, что нужен обход антибот-защиты и автоматическое разрешение временных file-ID для изображений. Для этого был выбран форк playwright — patchright, маскирующий браузер под реального пользователя.

  • Итоговое решение — асинхронная архитектура на Fastify + BullMQ + S3: запросы уходят в очередь, воркеры рендерят PDF, итоговые файлы доступны по ссылке.
  • Отдельное внимание — корректному рендерингу: поддержка синтаксиса кода, цветные эмодзи, адаптивные таблицы (решена проблема с широкими таблицами, которые не влезают на страницу), «бесшовная» прокрутка PDF.
  • Проект стартовал как pet-проект, но вырос в полноценный сервис, решающий задачу экспорта диалогов с сохранением структуры, изображений и формата.

Материал будет полезен разработчикам, кто автоматизирует работу с динамическими web-интерфейсами и экспортирует контент из LLM-платформ.

← Назад в лентуЧитать оригинал →
✈️ Подписывайтесь на мой Telegram-канал — там еще больше интересного про AdTech, MarTech, AI и многое другое!