HH Inspector: open-source инструмент для сбора и анализа IT-вакансий с HeadHunter
На
Хабре представлен open-source проект HH Inspector — универсальный инструмент для автоматизации сбора и анализа вакансий IT-специалистов с сайта HeadHunter (hh.ru). Разработчик решил закрыть нишу отсутствия удобных и бесплатных решений для массового парсинга вакансий, анализа зарплат, навыков и других ключевых метрик, выложив проект в открытый доступ на GitHub.
- Основные возможности:
- Поиск вакансий по ключевым словам, специализации, региону, зарплатной вилке, опыту, типу занятости и другим параметрам.
- Сохранение собранных данных в форматах JSON и CSV, а также генерация графиков по зарплатным вилкам и другим метрикам.
- Гибкая настройка параметров поиска через YAML-файл с поддержкой комментариев и удобных пресетов.
- Автоматическая обработка зарплат (корректировка на налоги, учёт неполных данных), очистка описаний вакансий от HTML-тегов.
- Использование HeadHunter API и оригинальных наименований параметров, что облегчает интеграцию для опытных пользователей.
- Архитектура решения: Система состоит из четырёх модулей — настройка параметров, сбор данных, анализ/визуализация и управляющий модуль. Для визуализации и анализа данных используется pandas, для конфигурирования — Pydantic, для тестирования — pytest.
- Технологии: Python 3.13, uv, ruff, pyright. Репозиторий открыт для комментариев и доработок.
HH Inspector закрывает задачу прозрачного и масштабируемого мониторинга рынка IT-вакансий в
России. Проект может быть легко адаптирован под другие сегменты рынка или исследовательские задачи благодаря open-source-архитектуре и гибким настройкам.
Читайте также
Принципы ITIL 4: от теории к практике на реальных кейсах
Самоуправляемые команды: миф или реальность
Ошибки вне отчетов: как бизнес снижает риски через ИИ-проверку знаний
ITSM: мифы и реальность внедрения сервисного подхода
Управление проектами: лучшие практики, риски и уроки от IT-команд (дайджест #35)
Подписывайтесь на мой Telegram-канал — там еще больше интересного про AdTech, MarTech, AI и многое другое!