Все статьи
обновлено 8 мин

AI-рекрутер: автоматический скрининг резюме на собственной инфраструктуре

Как автоматизировать первичный скрининг резюме через self-hosted AI: от 200 откликов до топ-10 за 15 минут. С compliance под 152-ФЗ и без зависимости от Just AI / Поток.

ai-рекрутерhrскрининг-резюмеself-hosted-aiagmind152-фз

Стандартный набор резюме на одну вакансию — 100-300 откликов. Прочитать каждое внимательно невозможно, поэтому HR делает поверхностный скрининг (имя, год рождения, последнее место работы) и пропускает 30-40% качественных кандидатов которые «не выглядят» по форме. AI-скрининг решает эту задачу: за 15 минут обрабатывает 200 резюме, выделяет топ-10 с обоснованием по критериям.

В России рынок SaaS AI-рекрутеров занят (Just AI, Поток, HR Messenger), но self-hosted альтернатива даёт две вещи которых нет у SaaS: полный контроль над данными кандидатов и отсутствие подписки при больших объёмах.

Зачем рекрутингу свой AI

152-ФЗ. Резюме — персональные данные кандидата. ФИО, дата рождения, контакты, история работы. Согласие соискателя обычно подразумевается фактом отклика, но категорически не на отправку в OpenAI/Anthropic.

Коммерческая тайна. Профиль идеального кандидата, критерии оценки, ваши вопросы для собеседования — это ноу-хау HR-команды. Передавать сторонним SaaS не хочется.

Стоимость на масштабе. SaaS-платформы стоят 50-150 тыс ₽/мес для команды 5-10 рекрутеров. Self-hosted разовый CAPEX 800k-1.5M ₽ окупается за 12-18 месяцев и далее почти ноль OPEX.

Отсутствие vendor lock-in. Если SaaS изменит цены/функции/политику — переход на конкурента занимает 3-6 месяцев. Self-hosted — ваш и навсегда.

Что AI-скрининг реально делает

1. Парсинг резюме в структурированную форму

Резюме приходят в pdf, docx, иногда в jpg от соискателя с телефона. AI:

  • Парсит документ через Docling/RAGFlow + vision-модель для сканов
  • Выделяет: ФИО, контакты, образование, опыт работы (в хронологическом порядке), навыки, языки, дополнительная информация
  • Нормализует: похожие должности приводятся к единому формату (“Senior PHP Developer” = “PHP-разработчик уровня senior”)
  • Вытаскивает скрытое: сколько лет в индустрии, средний срок работы на одной позиции, gap’ы между местами

На выходе: структурированный JSON для каждого кандидата.

2. Match с описанием вакансии

HR загружает описание вакансии и required/nice-to-have критерии. AI оценивает каждого кандидата по каждому критерию:

  • ✅ Соответствует
  • ⚠️ Частично соответствует (например 3 года Python вместо требуемых 5)
  • ❌ Не соответствует

Каждая оценка сопровождается цитатой из резюме — HR видит откуда взято.

3. Ранжирование

Кандидаты сортируются по weighted score: required-критерии × 1.0, nice-to-have × 0.5. Топ-N (обычно 10-20) идут на ручной разбор.

4. Автогенерация follow-up

Для топ-кандидатов AI генерирует:

  • Краткое резюме на 5-7 строк (для пересылки нанимающему менеджеру)
  • 5-10 вопросов для интервью (на основе gaps и intersting points в резюме)
  • Шаблон письма-приглашения на собеседование

5. Опциональные фичи

  • Распознавание дубликатов: если кандидат прислал резюме на похожую вакансию ранее, AI это видит
  • Salary expectation: если в резюме указаны цифры — AI вытягивает и сравнивает с budget’ом
  • Soft skills proxy: длина текста «о себе», описание проектов, лексика — даёт грубую оценку коммуникативных навыков

Что AI-скрининг НЕ делает

  • Финальное решение о найме — только формирует short-list. Решение всегда у HR + нанимающего менеджера.
  • Замена интервью — AI не разговаривает с кандидатами вместо вас. Все интересные кандидаты идут на live-собеседование.
  • Дискриминация по защищённым признакам — критически важно: AI должен быть настроен НЕ учитывать пол, возраст (за пределами правовых требований к должности), национальность, семейное положение. Иначе вы рискуете нарушить трудовое законодательство и репутацию.

Bias и справедливость

Главная опасность AI-рекрутера — bias из training data. Например, исторические данные о найме могут содержать gender bias, и модель его повторит.

Как мы это закрываем:

  1. Эксплицитный фильтр промпта: «не учитывай пол, возраст за пределами {min} лет, национальность, семейное положение»
  2. Тест-сет с защищёнными признаками: набор парных резюме с одинаковым опытом но разным полом/возрастом → проверяем что AI оценивает одинаково
  3. Аудит решений: ежемесячный анализ топ-10 кандидатов по всем вакансиям на распределение защищённых признаков. Если перекос — investigate.
  4. Final human decision: AI выдаёт ranking, человек принимает решение. Если HR замечает что AI систематически ranking определённых групп ниже — обращается к настройщику системы.

Это не “perfect” решение, но это лучше чем у живого рекрутера, который тоже подвержен bias но без аудита.

Реальный кейс: HR-агентство на 8 рекрутеров

Поток:

  • 30-50 вакансий одновременно открыты
  • 4000-6000 откликов в месяц всего
  • 4-7 минут средне на ручной скрининг одного резюме = 250-700 часов в месяц только на скрининг

После внедрения AI-скрининга:

  • AI обрабатывает все 6000 откликов за час (асинхронно, ночью)
  • HR утром получает топ-10-20 по каждой вакансии с обоснованием
  • Время на скрининг: с 250-700 часов до 30-50 часов в месяц

Эффект:

  • Рекрутер обрабатывает 2-3x больше вакансий за то же время
  • Скорость отклика на хорошие резюме: с 1-3 дней до 4-12 часов
  • Качество найма (метрика «прошёл испытательный срок») выросло на 8-15% — потому что AI меньше пропускает нестандартных но качественных кандидатов

Технический stack для AI-рекрутера

  • Парсер документов: Docling + RAGFlow для сложных pdf
  • Vision-модель для сканов: Qwen2.5-VL или Gemma-4-vision
  • LLM для оценки: Llama 3.3 70B / Qwen 3 / DeepSeek R1
  • Векторная база: Weaviate (для поиска похожих резюме в архиве)
  • Embedding: USER-bge-m3 (лучший для русских резюме)
  • UI: Dify-интерфейс с интеграцией в ATS (Bamboo, Talantix, или собственная CRM)

Минимальное железо: 1 DGX Spark или RTX 4090 + 128 GB RAM. Стоимость сервера 600k-1.2M ₽.

Compliance в деталях

Согласие соискателя. Российские soiskатели по факту отклика на вакансию дают неявное согласие на обработку резюме для целей оценки. Но для использования AI желательно явно прописать в форме отклика на сайте или в подписке на вакансию: «Ваше резюме будет обработано AI-системой для предварительной оценки соответствия требованиям вакансии. Финальное решение о приглашении на собеседование принимается специалистом по подбору.»

Уведомление РКН. HR-агентство как оператор ПДн обязано уведомить РКН. Внутренние HR-отделы крупных компаний — тоже, если ещё нет.

Срок хранения. ПДн соискателей нельзя хранить дольше срока необходимого для целей обработки. Обычно — 6 месяцев после закрытия вакансии. Дальше — обезличивание или удаление. AI-система должна это поддерживать (автоматическое удаление по retention policy).

Поручение обработки. Если AI развёрнут собственными силами — отдельного поручения не нужно (компания сама оператор и обработчик). Если используется подрядчик (например внешний DevOps по контракту) — нужно поручение по статье 6 152-ФЗ.

Сколько стоит AI-рекрутер?

Размер компанииСрокЦена под ключ
Внутренний HR-отдел до 5 рекрутеров4-5 недель1.0-1.8 млн ₽
HR-агентство 5-15 рекрутеров6-8 недель1.8-3.0 млн ₽
Большая компания с собственным ATS8-12 недель3-5 млн ₽

Окупаемость 8-14 месяцев. Через год — почти ноль OPEX, в отличие от SaaS которая платится постоянно.

Альтернативы которые рассматривают

  • Just AI / Поток / HR Messenger — SaaS, быстрый старт, но dependency и стоимость
  • Внутренняя разработка — 6-12 месяцев на полный pipeline
  • Excel + ручная сортировка — текущая практика большинства небольших HR

Self-hosted под ключ — sweet spot между быстрым стартом SaaS и долгой собственной разработкой.

Итог

AI-рекрутер на собственной инфраструктуре — недорогой и compliant способ автоматизации скрининга резюме. На команде из 5-10 рекрутеров окупается за год, на больших HR-отделах — быстрее.

Если хочется протестировать на ваших данных — пилот за 2-3 недели от 100 000 ₽. Берём 200-500 ваших исторических резюме (по уже закрытым вакансиям с известным результатом найма) и сравниваем рейтинг AI с реальным результатом — это лучший тест качества системы.

HR — одна из вертикалей, где ИИ-помощник даёт измеримый результат. Как ИИ-помощник работает в HR и других вертикалях в рамках единого стека — читайте ИИ-помощник в HR и других вертикалях.

Связанные тексты: топ-7 ошибок при внедрении, план внедрения за 6 недель, 152-ФЗ для AI.