Как развернуть свой ChatGPT в компании за 6 недель: пошаговый план

Развернуть корпоративный ChatGPT в компании — значит установить self-hosted LLM на собственной инфраструктуре, настроить RAG под ваши данные и интегрировать с рабочими системами. Реальный срок — 4-6 недель при готовом сервере. Это не подключение API, а полноценный проект: аудит, тюнинг, интеграции, передача с документацией.

Этот текст — пошаговая карта того, что происходит на каждой неделе. Без воды, с реальными deliverables и checklist’ами что должно быть готово к каждому этапу.

Что должно быть готово до старта

До контракта на внедрение полезно собрать:

Список процессов, которые хочется автоматизировать (3-5 конкретных кейсов: «юрист по договорам», «ассистент поддержки», «анализ звонков»). Без этого скоуп уплывает.
Объём документов: сколько PDF, в каких форматах, отсканированы или текстовые
Список интеграций: 1С, Bitrix24, AmoCRM, корпоративная почта, ERP, SharePoint — что должно быть подключено
Требования compliance: 152-ФЗ, госконтракты, медицинская тайна, банковская тайна — есть ли что-то критичное
Условия безопасности: с интернетом / без интернета / с прокси

Если из этого списка половина «не знаю» — это нормально, разберёмся на этапе аудита. Но чем точнее портрет на старте, тем меньше переделок.

Неделя 1: аудит данных и процессов

Цель этапа: понять что реально происходит у вас в компании, какие данные вы используете, какие процессы можно автоматизировать с реальной экономией времени.

Что делаем:

Знакомство с командой, которая будет пользоваться AI (юристы, продажники, поддержка — те, кому ассистент облегчит работу)
Аудит документной базы: образцы договоров, регламентов, методичек, FAQ
Карта процессов: где сейчас тратится время на чтение/поиск/оформление
Анализ существующего стека: что уже стоит (CRM, документооборот, корп. почта)
Определение требований compliance с участием юриста или офицера ИБ

На выходе:

Отчёт на 15-20 страниц с описанием текущего состояния
Спецификация железа (если нужно покупать) или подтверждение что существующий сервер подходит
Список процессов с приоритизацией: что делаем первым этапом, что вторым
Документ с границами проекта — что входит в первую версию, что нет

Чего ждать: пара длинных встреч (2-3 часа каждая), интервью с ключевыми пользователями, изучение примеров документов под NDA.

Неделя 2: подготовка железа и базовая установка

Цель этапа: получить рабочий сервер с базовой инсталляцией AGmind.

Если железо уже есть:

Подключение к серверу, проверка ОС (Linux Ubuntu 22.04 LTS — оптимально), GPU-драйверов, доступа из корпоративной сети
Установка стека: PostgreSQL, Redis, Weaviate, MinIO, контейнерный runtime
Базовая инсталляция AGmind через install.sh
Настройка резервного копирования, мониторинга, логов

Если железо нужно покупать:

Подбор спецификации под нагрузку (число пользователей, размер модели, контекст)
Согласование закупки (1-2 недели на поставку, если стандартное железо)
Установка в стойку, подключение к сети
Базовая инсталляция как выше

На выходе:

Сервер с запущенным AGmind, доступ через VPN/корп. сеть
Базовая модель (Llama 3.3 70B / Qwen 3 / DeepSeek) отвечает на вопросы общего характера
Web-интерфейс для тестирования (доступ только у внутренней команды)
Документация по инфраструктуре

Чего ждать: на этом этапе AI пока ничего не знает о вашей компании — это инструмент без обученных данных. Полноценная работа начнётся через 1-2 недели.

Недели 3-4: обучение на ваших документах

Цель этапа: превратить базовую модель в ассистента, который отвечает по вашим конкретным документам.

Что делаем:

Сбор документов: собираем 200-2000 файлов в одну папку (договоры, регламенты, методички, FAQ, переписка которую можно отдать AI)
Парсинг: документы прогоняются через RAGFlow/Docling, преобразуются в структурированный markdown
Чанкинг: документы режутся на куски подходящего размера для поиска
Векторизация: каждый чанк превращается в эмбеддинг через bge-m3 или аналог
Загрузка в векторную базу: Weaviate
Тестирование: проверяем точность ответов на типовых вопросах
Тюнинг: правим параметры чанкинга, эмбеддера, реранкера до достижения цели

Целевая точность: 90-95% на ваших типовых вопросах. Это значит, что AI правильно находит источник и формулирует ответ в 9-10 случаях из 10 на знакомых ему типах запросов.

На выходе:

Векторная база со всеми вашими документами
AI отвечает на вопросы со ссылкой на конкретную страницу источника
Bench-тесты на 50-100 типовых вопросах с замером точности
Документация какие настройки выбраны и почему

Чего ждать: это самый длинный и самый важный этап. От его качества зависит всё. Здесь часто всплывают неожиданные особенности корпоративных документов: нестандартное оформление таблиц, сканы которые плохо распознаются, региональные термины которые требуют отдельных настроек.

Недели 4-5: агенты и интеграции

Цель этапа: связать AI с системами, в которых работают сотрудники, чтобы AI стал частью workflow.

Типовые интеграции:

Корпоративная учётная система (Active Directory, Keycloak, Yandex 360) — чтобы пользователи логинились через свою корп. учётку, без отдельных паролей
1С / SAP / другая ERP — чтобы AI мог отвечать на вопросы по продажам, складу, документообороту
Bitrix24 / AmoCRM — расшифровка звонков → next-step → запись в CRM
Корпоративная почта — категоризация входящих, автоответы по простым запросам
SharePoint / Confluence — единый поиск по корп. базе знаний

Параллельно собираются агенты: не один универсальный бот, а набор специалистов под каждый отдел. Юрист, продажник, HR — у каждого своя инструкция, свои инструменты, свой стиль.

Сборка агентов происходит в Dify drag-n-drop. Десяток агентов собирается за неделю.

На выходе:

Все интеграции работают в боевом режиме
Сотрудники авторизуются через корп. учётку
Агенты отрабатывают на реальных задачах
Документация по каждому агенту: что делает, как пользоваться, как обновить

Неделя 5-6: нагрузочное тестирование и передача

Цель этапа: убедиться что система выдержит реальную нагрузку и подготовить команду к самостоятельной работе.

Нагрузочное тестирование:

Имитация типовой рабочей нагрузки (30-100 параллельных запросов в час)
Проверка времени отклика на пиках
Стресс-тест: сколько запросов в минуту выдержит до деградации
Тест fail-over: что происходит при отказе одного компонента

Передача:

4-часовое обучение для администратора (как мониторить, как обновлять, что делать при инциденте)
2-часовое обучение для конечных пользователей по отделам
32-страничный runbook с типовыми сценариями инцидентов
Видеозаписи всего обучения для будущих сотрудников

На выходе:

Система работает в боевом режиме, нагрузка проверена
Админ может самостоятельно поднимать после сбоя, обновлять, добавлять новых пользователей
Команда знает как пользоваться

Неделя 6+: SLA-поддержка (опционально)

После запуска есть два пути:

Самостоятельная поддержка: Ваш админ работает с системой по runbook’у. Внедренец остаётся на связи бесплатно по простым вопросам, платная консультация по сложным. Подходит компаниям с сильным IT-отделом.

SLA-поддержка под ключ: Внедренец берёт ответственность за uptime и обновления. Реакция на P1-инциденты за 1 час, ежемесячный health-review, регулярные обновления версий. Подходит когда нужна гарантия доступности.

Чего НЕ ждать

Не ждите готовых решений в первую неделю. Аудит — это про понимание, не про код. Если внедренец на первом звонке готов начать установку — это плохой признак.

Не ждите 100% точности на старте. Любой корпоративный AI требует тюнинга на конкретных данных. Точность растёт по мере итераций. Реалистичная цель — 90-95% на знакомых вопросах через 4-5 недель.

Не ждите что AI заменит экспертов. Юрист с AI-ассистентом обрабатывает в 3-5 раз больше договоров. AI без юриста — генератор галлюцинаций. Соотношение остаётся.

Итог

Внедрение корпоративного AI — это полноценный проект на 6-9 недель с конкретными фазами и deliverables. Не подписка, не «коробка», не «магия». Но при правильном подходе экономика однозначная: окупаемость через 9-14 месяцев, после — почти ноль OPEX.

Если хочется проверить процесс на маленьком масштабе — пилот на одном процессе за 2-3 недели от 100 000 ₽. Это не полный цикл, но даёт реальное представление о том, что получится в полной версии.

Полный технический разбор стека — в статье на Habr про DGX Spark. Для понимания экономики — расчёт стоимости на 30 человек.