Мета-анализ Хабра 2024: так ли всё плохо?

Автор статьи на провел масштабный мета-анализ публикаций за 2024 год, обработав 59 390 статей из 116 792 id, что составило 38 307 уникальных материалов, опубликованных в 2024 году. Всего пользователи потратили на чтение статей более 4 000 лет человеко-времени, а общее число просмотров превысило 325 млн. В топе по количеству публикаций за год — пользователь denis-19 (2 993 статьи, 7,8% от общего объема). Декабрь стал самым "урожайным" месяцем — 3 669 статей.

Анализ выявил: наиболее популярные форматы публикаций — обзоры, туториалы, переводы, кейсы. В топе хабов по количеству статей — Искусственный интеллект (3 628), Информационная безопасность, Программирование, Научпоп, Машинное обучение. По просмотрам лидируют Информационная безопасность (33 млн) и ИИ (27 млн).

Особое внимание уделено использованию ИИ в текстах: среди обычных авторов высокий уровень "нейронных" текстов — 28,7%, среди компаний — 41%. Использование ИИ резко растет к концу года. Интересно, что статьи, созданные с помощью нейронок, становятся длиннее, но не обязательно выше по рейтингу — у авторов ИИ-рейтинг даже чуть ниже среднего. Анализ корреляций показал, что ИИ-контент увеличивает объем, но не гарантирует вовлечения. Крупные аномалии: самая длинная статья читалась 127 минут, а самая популярная набрала 944 тыс. просмотров.

В качестве технологий и инструментов использовались C#, MathNet, HtmlAgilityPack, ClosedXML, .ML. Все данные, модели и исходники опубликованы в открытом репозитории.

Главный вывод: несмотря на бум ИИ-статей, отсутствие качественной модерации ведет к росту мусорного контента и падению профессионального уровня Хабра. Однако сообщество продолжает жить за пределами платформы, а глубокий анализ метрик открывает новые возможности для AdTech, MarTech и контент-аналитики.

← Назад в лентуЧитать оригинал →
✈️ Подписывайтесь на мой Telegram-канал — там еще больше интересного про AdTech, MarTech, AI и многое другое!