Договорный ИИ для юридической практики: 152-ФЗ in-contour
Как юридическая фирма автоматизировала первичную проверку договоров без передачи данных в облако — Qwen 2.5 32B и RAG по прецедентам.
- Время на договор
- 42 мин vs 150 мин
- Точность экстракции
- ~95%
- Соответствие 152-ФЗ
- 100% в контуре
12 мин AI-экстракция + 30 мин юрист-валидация
стороны, сроки, штрафные условия — на 200 договорах
ни один документ не покидает on-premise сервер
Юридическая фирма с практикой в корпоративном праве обрабатывает 80–120 договоров в месяц. Первичная проверка каждого — стороны, предмет, сроки, штрафные условия, соответствие 152-ФЗ — занимала 2–2.5 часа у старшего юриста. Облачные инструменты типа GPT-4o с загрузкой документа исключены сразу: персональные данные клиентов в тексте договора не могут покидать периметр компании.
Ситуация
Вся входящая документация — смесь нативных PDF, сканов (часто низкого качества) и Word-файлов. Юрист открывал каждый, вручную искал разделы по ответственности и срокам, сверял реквизиты с базой контрагентов. Ошибки на этом этапе дорогостоящие: пропущенная штрафная оговорка или неверно определённый контрагент — это риски, которые проявляются через месяцы.
На облако смотрели как на опцию — до момента, когда юридический советник напомнил, что загрузка договора с персональными данными физлиц на сервера OpenAI требует согласия субъекта и, строго говоря, невозможна без изменения оргдокументов по 152-ФЗ. Решение должно быть in-contour.
Задача (152-ФЗ + объём)
Автоматизировать первичную экстракцию: стороны, предмет, срок действия, ключевые обязательства, штрафные условия, реквизиты. Точность ≥90% на тестовой выборке исторических договоров. Все вычисления — на железе фирмы. Юрист проверяет результат и ставит финальную подпись — AI снимает черновую работу, не принимает решений.
Решение
Развернули на сервере с RTX 4090 24 GB (Q4_K_M квантование Qwen 2.5 32B умещается в ~22 GB VRAM):
- Tesseract OCR + image preprocessing — конвертация сканов в текст перед LLM; пайплайн: deskew → adaptive threshold → Tesseract (rus+eng) → постобработка
- vLLM (Q4_K_M) + Qwen 2.5 32B — extraction с structured output (JSON schema для каждого поля договора)
- bge-m3 + Qdrant — RAG по библиотеке прецедентов (300+ типовых договоров), поиск схожих конструкций для валидации неоднозначных формулировок
- Веб-интерфейс (локальный) — загрузка PDF/скана, отображение извлечённых полей с confidence-оценкой, кнопка «Отправить юристу»
Время на один договор: 12 минут (AI-экстракция + формирование структурированного резюме) + 30 минут (юрист читает резюме, проверяет высоко-confidence поля выборочно, валидирует низко-confidence). Итого 42 минуты против прежних 150.
Результат
На тестовой выборке 200 договоров (40% нативные PDF, 35% сканы, 25% Word):
- ~95% точность на extraction полей «стороны», «срок действия», «сумма», «штрафные условия» (precision в структурированном JSON-выводе)
- Соответствие 152-ФЗ: 100% — ни один документ не покидает сервер фирмы, обработка полностью в контуре
- Время сокращено с 150 до 42 минут на документ; юрист работает с готовым структурированным резюме, а не с сырым текстом
При нагрузке 100 договоров/мес экономия ~108 часов юридического времени ежемесячно — эквивалент ~1.5 FTE на задачи первичного разбора.
Стек
Ключевое решение — отказ от любых облачных API и полная локализация стека под требования 152-ФЗ:
Что не сработало
Первая итерация использовала GPT-4 Vision для OCR сканов — API-вызов немедленно нарушал требование обработки в контуре заказчика. Переключились на Tesseract + image-preprocessing перед LLM ingestion (+3 дня переделки). Отдельно: chunking по 512 токенам давал плохой recall на многостраничных приложениях — перешли на semantic paragraph-level с overlap 150 токенов.
Стек
- Qwen 2.5 32B
- Tesseract OCR
- vLLM (Q4_K_M quant)
- bge-m3
- Qdrant
- RTX 4090 (серый импорт)