Все статьи
обновлено 9 мин

Топ-7 ошибок при внедрении корпоративного AI и как их избежать

Реальные грабли которые мы видели на проектах: от выбора неправильной модели до игнорирования compliance. С признаками каждой ошибки и способами обойти.

внедрение-aiошибкикорпоративный-aiself-hosted-aiagmind

Ошибки внедрения ИИ — типовые провалы корпоративного AI-проекта, которые удваивают бюджет и превращают обещанные 95% точности в реальные 60%. По нашему опыту, неправильный старт встречается в каждом третьем проекте. Эти 7 граблей — про конкретный признак на старте и способ каждую из них обойти.

Ошибка 1: автоматизировать всё сразу

Признак: на первой встрече озвучивается список из 15 use-case’ов: «AI для юристов и для продажников и для HR и для службы поддержки и для аналитики…»

Что происходит: проект растягивается на 6 месяцев вместо 6 недель. Каждый отдел требует своих особенностей. Бюджет улетает в 2-3 раза. Через 4 месяца у вас система которая «вроде работает», но никто ей не пользуется.

Как избежать: выбрать один процесс с самой острой болью для пилота. Тот, где экономия времени измерима за неделю. Юрист на договорах, поддержка на FAQ, продажник на расшифровке звонков — что-то одно. После того как один процесс работает и приносит ROI — расширяйтесь на остальные.

Хорошая практика: правило «одна неделя пилота = одна функция». Не «AI для всей компании», а «AI который читает входящие договоры и выделяет риски». Конкретно, измеримо, ограниченно.

Ошибка 2: выбрать самую большую модель

Признак: «Llama 70B параметров слишком мало, давайте 405B» или «нам нужен GPT-4 уровня».

Что происходит: 405B-модель в FP16 требует ~972 ГБ VRAM и кластера 8× H100/H200 — это $240K+ в production. Даже Q4-квантизация требует 230+ ГБ VRAM и серверов от $80–150K. По официальному eval Meta разрыв в качестве между 70B и 405B — 2–3 п.п. на стандартных бенчмарках (MMLU 86.0 vs 88.6, HumanEval 88.4 vs 89.0). 70B даёт ~97% качества 405B на половине цены и в разы быстрее.

Как избежать: выбирать модель под измеренные требования, не под маркетинг. Начинать с 32B-70B уровня, мерять точность на тестовом наборе ваших задач, поднимать только если упёрлись. На 80% задач разница между 32B и 405B — meaningfully не существует.

Реалистичные параметры для 2026:

  • Юр.документы, поддержка — Qwen 32B / Llama 3.3 70B
  • Сложная аналитика, многошаговые рассуждения — DeepSeek R1 / Llama 3.3 70B
  • Креативные задачи (маркетинг, copywriting) — Llama 3.3 70B

Ошибка 3: пропустить compliance-аудит на старте

Признак: «Сначала запустим, потом разберёмся с 152-ФЗ».

Что происходит: через 3-6 месяцев приходит проверка РКН или внутренний аудит. Выясняется что данные клиентов обрабатываются неправильно, документация отсутствует, согласий нет. С 30 мая 2025 года штрафы по 152-ФЗ серьёзно повышены: 3-15 млн ₽ за стандартные утечки в зависимости от объёма, до 500 млн ₽ за массовые случаи, плюс оборотные штрафы 1-3% годовой выручки за повторные нарушения. Дополнительно — остановка системы, потеря данных, репутационный ущерб.

Как избежать: юридический аудит как первая неделя проекта, до закупки железа и установки. Юрист (внутренний или внешний) даёт checklist:

  • Какие категории ПДн обрабатываются?
  • Где хранятся данные технически?
  • Какие согласия должны быть получены?
  • Какие технические меры защиты требуются?
  • Нужно ли уведомление РКН как оператора ПДн?

После этого технический outline проекта собирается под compliance-требования, не наоборот. См. подробнее в статье про 152-ФЗ.

Ошибка 4: не подготовить данные

Признак: «У нас же есть документы, просто загрузим».

Что происходит: документы оказываются в форматах разной степени упоротости — отсканированные PDF без OCR, картинки PNG, файлы 1С с экспортом в xls, презентации с эмбеддированным текстом в картинках. RAG-индекс получается мусорный, точность ответов 50-60%.

Как избежать: аудит документной базы перед индексацией. Реальные категории и что с ними делать:

  • Чистые тексты, DOCX, MD → грузим как есть
  • Текстовые PDF → парсим Docling/Unstructured, на выходе markdown
  • Сканы PDF → OCR через RAGFlow или специализированные сервисы. Качество OCR зависит от исходника — корявые сканы дают корявые тексты
  • Картинки с текстом, схемы → vision-LLM описывает каждую картинку текстом, дальше как обычный текст
  • Excel/CSV/таблицы → отдельный pipeline через structured retrieval (не классический RAG)
  • Базы данных → выгружаем релевантные виды в JSON или Markdown

Этот этап занимает 1-2 недели на boundary’е аудита и установки. Без него RAG не работает.

Ошибка 5: игнорировать UI/UX

Признак: «Главное — модель работает. Интерфейс сделаем как-нибудь».

Что происходит: через 2-3 месяца сотрудники не пользуются системой. Они не знают где её искать, у неё неудобный интерфейс, ответы трудно копировать в нужный документ, нет интеграции с привычными инструментами (Bitrix24, корпоративная почта, Telegram).

Как избежать: UI/UX — отдельный этап с равным приоритетом. Стандартные требования:

  • Доступ через корп. SSO — без отдельных паролей. Active Directory / Keycloak / Yandex 360
  • Интеграция в существующие системы — кнопка «спросить AI» прямо в CRM/CMS
  • Telegram-бот для мобильного доступа
  • Удобное копирование ответов в Word/Outlook
  • Подсветка цитат — пользователь сразу видит откуда взялся ответ

Принцип: AI должен быть там где сотрудник уже работает, не отдельным инструментом куда нужно специально заходить.

Ошибка 6: запустить без feedback-loop

Признак: «Запустим и забудем — оно само работает».

Что происходит: через 3 месяца качество ответов деградирует на новых типах вопросов. Документы устарели, появились новые регламенты которые не загружены. Никто это не отслеживает.

Как избежать: встроенная система обратной связи и метрик:

  • Кнопки «хорошо/плохо» под каждым ответом — копится размеченный набор для тюнинга
  • Логи всех запросов — анализируются раз в месяц
  • Регулярные регрессионные тесты — набор из 50-100 типовых вопросов проверяется при каждом обновлении модели или базы
  • Owner системы — конкретный человек ответственный за качество. Не «IT-отдел», а конкретный Иван Иванов

Без feedback-loop система деградирует за квартал. С feedback-loop — улучшается.

Ошибка 7: рассчитывать на “AI заменит сотрудников”

Признак: «С AI мы сможем уволить половину поддержки/юристов/менеджеров».

Что происходит: уволили — поток вопросов вырос, AI не справляется со сложными случаями, оставшиеся сотрудники в стрессе, очереди клиентов растут, качество падает. Через 6 месяцев нанимают обратно с переплатой за срочность.

Как избежать: AI как multiplier, не как replacer. Реалистичные метрики:

  • AI закрывает 60-80% типовых вопросов автоматически
  • 20-40% — эскалируются на человека, но с готовым контекстом разговора
  • Сотрудник работает над более сложными случаями, которые раньше не доходили из-за рутины

Численность команды обычно остаётся прежней, но качество и масштаб обрабатываемых случаев растут в 2-3 раза. Это и есть real ROI: не сокращение фота, а рост capacity без roszerza команды.

Признаки правильного внедрения

Если в проекте есть всё это — у вас правильный подход:

  • Конкретный pilot scope на 1 процесс на 2-3 недели
  • Compliance-аудит в первую неделю до закупки железа
  • Аудит данных до индексации
  • Реалистичный выбор модели под измеренные требования
  • Интеграция в существующий workflow сотрудников
  • Feedback-loop с момента запуска
  • Понимание что AI = multiplier, не replacer

Если хотя бы 3 из 7 пунктов выпадают — проект почти гарантировано не окупится.

Внутренний vs внешний внедренец

Внутренней команде под силу простые сценарии (FAQ-бот, базовый поиск), если есть профильный senior с опытом. Сложности: первый раз делать дорого, грабли все на вашем счету, окупаемость отложенная.

Внешний внедренец под полный цикл: фиксированная цена (предсказуемо для бюджета), опыт сразу (не платите за обучение), 4-6 недель вместо 6-12. Минусы: риск vendor lock-in (выбирайте open-source стек) и стоимость поддержки если контракт не пролонгируется.

В AGmind мы решаем оба этих риска: open-source стек без lock-in, runbook для админа на 32 страницы, обучение admin-ов и пользователей включено. Уволите нас завтра — стек продолжит работать.

Итог

Внедрение корпоративного AI — это не «поставили и забыли». Это полноценный технический проект с фазами, deliverables, метриками. 7 ошибок выше — самые частые точки провала. Если избежать их — проект окупается за 9-14 месяцев и даёт устойчивый эффект.

Если хочется обсудить ваш конкретный сценарий и проверить какие из ошибок уже в вашем плане — пилот за 2-3 недели от 100 000 ₽. Это формат «попробовать с минимальным риском» с возвратом если результат не подойдёт.

Подробнее о процессе внедрения — в пошаговом плане на 6 недель. О compliance-аспектах — в статье про 152-ФЗ.