Юристы 20 апреля 2026 г.

Договорный ИИ для юридической практики: 152-ФЗ in-contour

Как юридическая фирма автоматизировала первичную проверку договоров без передачи данных в облако — Qwen 2.5 32B и RAG по прецедентам.

Время на договор: 42 мин vs 150 мин
Точность экстракции: ~95%
Соответствие 152-ФЗ: 100% в контуре

Юридическая фирма с практикой в корпоративном праве обрабатывает 80–120 договоров в месяц. Первичная проверка каждого — стороны, предмет, сроки, штрафные условия, соответствие 152-ФЗ — занимала 2–2.5 часа у старшего юриста. Облачные инструменты типа GPT-4o с загрузкой документа исключены сразу: персональные данные клиентов в тексте договора не могут покидать периметр компании.

Ситуация

Вся входящая документация — смесь нативных PDF, сканов (часто низкого качества) и Word-файлов. Юрист открывал каждый, вручную искал разделы по ответственности и срокам, сверял реквизиты с базой контрагентов. Ошибки на этом этапе дорогостоящие: пропущенная штрафная оговорка или неверно определённый контрагент — это риски, которые проявляются через месяцы.

На облако смотрели как на опцию — до момента, когда юридический советник напомнил, что загрузка договора с персональными данными физлиц на сервера OpenAI требует согласия субъекта и, строго говоря, невозможна без изменения оргдокументов по 152-ФЗ. Решение должно быть in-contour.

Задача (152-ФЗ + объём)

Автоматизировать первичную экстракцию: стороны, предмет, срок действия, ключевые обязательства, штрафные условия, реквизиты. Точность ≥90% на тестовой выборке исторических договоров. Все вычисления — на железе фирмы. Юрист проверяет результат и ставит финальную подпись — AI снимает черновую работу, не принимает решений.

Решение

Развернули на сервере с RTX 4090 24 GB (Q4_K_M квантование Qwen 2.5 32B умещается в ~22 GB VRAM):

Tesseract OCR + image preprocessing — конвертация сканов в текст перед LLM; пайплайн: deskew → adaptive threshold → Tesseract (rus+eng) → постобработка
vLLM (Q4_K_M) + Qwen 2.5 32B — extraction с structured output (JSON schema для каждого поля договора)
bge-m3 + Qdrant — RAG по библиотеке прецедентов (300+ типовых договоров), поиск схожих конструкций для валидации неоднозначных формулировок
Веб-интерфейс (локальный) — загрузка PDF/скана, отображение извлечённых полей с confidence-оценкой, кнопка «Отправить юристу»

Время на один договор: 12 минут (AI-экстракция + формирование структурированного резюме) + 30 минут (юрист читает резюме, проверяет высоко-confidence поля выборочно, валидирует низко-confidence). Итого 42 минуты против прежних 150.

Результат

На тестовой выборке 200 договоров (40% нативные PDF, 35% сканы, 25% Word):

~95% точность на extraction полей «стороны», «срок действия», «сумма», «штрафные условия» (precision в структурированном JSON-выводе)
Соответствие 152-ФЗ: 100% — ни один документ не покидает сервер фирмы, обработка полностью в контуре
Время сокращено с 150 до 42 минут на документ; юрист работает с готовым структурированным резюме, а не с сырым текстом

При нагрузке 100 договоров/мес экономия ~108 часов юридического времени ежемесячно — эквивалент ~1.5 FTE на задачи первичного разбора.

Стек

Ключевое решение — отказ от любых облачных API и полная локализация стека под требования 152-ФЗ:

Что не сработало

Первая итерация использовала GPT-4 Vision для OCR сканов — API-вызов немедленно нарушал требование обработки в контуре заказчика. Переключились на Tesseract + image-preprocessing перед LLM ingestion (+3 дня переделки). Отдельно: chunking по 512 токенам давал плохой recall на многостраничных приложениях — перешли на semantic paragraph-level с overlap 150 токенов.

Стек

Qwen 2.5 32B
Tesseract OCR
vLLM (Q4_K_M quant)
bge-m3
Qdrant
RTX 4090 (серый импорт)

Ситуация

Задача (152-ФЗ + объём)

Решение

Результат

Стек

Что не сработало

Связанные материалы

Стек