Как Яндекс Дзен стал сердцем рекомендаций ВК

Доклад Дмитрия Погорелова объясняет, как стал базой рекомендаций : от монолита к масштабируемой RTD-платформе. Ключевой вызов — real-time и сетевые пределы: при 20k кандидатов × ~10 KB × 10k rps потребовалось бы гонять ~2 ТБ/с, поэтому вектора/счётчики хранят рядом с вычислениями.

  • 2017: джава-монолит (40 GB), ≤2 млн документов, ~600 мс; Cassandra для истории; единая точка падений.
  • 2020: шардирование по типам контента (видео/клипы/посты), отдельный блендер; App-host для маршрутизации между микросервисами; латентность ~400 мс; независимые зоны разработки.
  • 2023: индекс 60 млн «якорей» × 300 кандидатов (~140 GB); шардирование рекомендеров по кандидатам с рассылкой только шард-локальной пользовательской информации; graceful degradation до 50% без заметной боли; латентность ~190 мс; масштаб до 50 млн видео.
  • 2024: near-real-time эмбеддинги и счётчики; перенос во ВК: старт с VK Видео, +80% TVT к старому движку, затем Лента; рост RPS/базы — переход к шардированию по авторам.
  • 2025 (PML): «бесконечная» база для doc2doc: увеличение шардов 8→32 не даёт качества из-за распила candidate-generator’ов — их выносят отдельно; независимые индексы масштабируют без потери сравнений; технология унифицирована уже для 10+ продуктов ВК.

Итог: эволюция от монолита к шардированной RTD-архитектуре с унифицированной логистикой запросов, локальностью векторов и управляемой деградацией качества ради пропускной способности.

Ключевые инсайты из новости (по версии ChatGPT)
  • Локальность векторов для RTD-рекомендаций: При real-time отборе кандидатов основной узкий горлышко — сеть: перемещение десятков тысяч эмбеддингов и счётчиков на каждый запрос даёт теоретические потоки в масштабе терабайт/с. Практический вывод: эмбеддинги и счётчики должны храниться и вычисляться максимально близко к ранжированию (на том же узле/шарде), чтобы исключить сетевой фан-аут.
    [Архитектура → Рекомендательные системы]
Для получения полного доступа оформите подписку PubMag PRO.
Зарегистрированные пользователи видят только два тезиса.
Зарегистрироваться
Инсайты автоматически генерируются с помощью искусственного интеллекта на основе текста статьи.
← Назад в лентуЧитать оригинал →
✈️ Подписывайтесь на мой Telegram-канал — там еще больше интересного про AdTech, MarTech, AI и многое другое!