Arc: «убийца» ClickHouse на стероидах из DuckDB и Parquet? Разбор нового движка для временных рядов

Arc — экспериментальный «time-series lakehouse» от Basekick Labs, сочетающий DuckDB, Parquet и объектное хранилище (S3/MinIO) для быстрого ingest и SQL-аналитики без кластеров. Поддерживаются HTTP API, Influx Line Protocol и MessagePack (рекомендуемый для скорости), namespace-архитектура и автокомпакция файлов; WAL опционален и по умолчанию выключен.

  • Производительность: до 1,89 млн записей/с (native, MessagePack); ~570 тыс./с в Docker; p50 ≈ 21 мс, p95 ≈ 204 мс. ClickBench (AWS c6a.4xlarge): «cold run» ~35,18 с по 43 запросам; «hot run» среднее ~0,81 с/запрос. На M3 Max: «cold» ~23,86 с, «hot» ~0,52 с.
  • Интеграции: SQL через DuckDB, визуализация в Apache Superset (SQLAlchemy-диалект).
  • Статус и лицензия: альфа/техпревью, APIs могут меняться; AGPL-3.0.
  • Риски: отсутствие распределённости/шардинга, ограниченная конкурентность DuckDB, компромиссы WAL, зависимость от качества партиционирования и компакции.
  • Конкуренты: ClickHouse, TimescaleDB, InfluxDB, QuestDB и близкий по идеологии GigAPI (DuckDB+Parquet).

Вывод: Arc перспективен как лёгкий «минимальный сервер» для метрик/IoT и быстрых прототипов с дешёвым «холодным» хранением, но для продакшена с HA/шардингом и зрелой TSDB-функциональностью требуется осторожность и нагрузочное тестирование.

← Назад в лентуЧитать оригинал →
✈️ Подписывайтесь на мой Telegram-канал — там еще больше интересного про AdTech, MarTech, AI и многое другое!