Как развернуть свой ChatGPT в компании за 6 недель: пошаговый план
Реальная карта внедрения корпоративного self-hosted AI: что происходит каждую неделю, чего ждать на каждом этапе, какие вопросы нужно решить заранее. Без маркетинга.
Развернуть корпоративный ChatGPT в компании — значит установить self-hosted LLM на собственной инфраструктуре, настроить RAG под ваши данные и интегрировать с рабочими системами. Реальный срок — 4-6 недель при готовом сервере. Это не подключение API, а полноценный проект: аудит, тюнинг, интеграции, передача с документацией.
Этот текст — пошаговая карта того, что происходит на каждой неделе. Без воды, с реальными deliverables и checklist’ами что должно быть готово к каждому этапу.
Что должно быть готово до старта
До контракта на внедрение полезно собрать:
- Список процессов, которые хочется автоматизировать (3-5 конкретных кейсов: «юрист по договорам», «ассистент поддержки», «анализ звонков»). Без этого скоуп уплывает.
- Объём документов: сколько PDF, в каких форматах, отсканированы или текстовые
- Список интеграций: 1С, Bitrix24, AmoCRM, корпоративная почта, ERP, SharePoint — что должно быть подключено
- Требования compliance: 152-ФЗ, госконтракты, медицинская тайна, банковская тайна — есть ли что-то критичное
- Условия безопасности: с интернетом / без интернета / с прокси
Если из этого списка половина «не знаю» — это нормально, разберёмся на этапе аудита. Но чем точнее портрет на старте, тем меньше переделок.
Неделя 1: аудит данных и процессов
Цель этапа: понять что реально происходит у вас в компании, какие данные вы используете, какие процессы можно автоматизировать с реальной экономией времени.
Что делаем:
- Знакомство с командой, которая будет пользоваться AI (юристы, продажники, поддержка — те, кому ассистент облегчит работу)
- Аудит документной базы: образцы договоров, регламентов, методичек, FAQ
- Карта процессов: где сейчас тратится время на чтение/поиск/оформление
- Анализ существующего стека: что уже стоит (CRM, документооборот, корп. почта)
- Определение требований compliance с участием юриста или офицера ИБ
На выходе:
- Отчёт на 15-20 страниц с описанием текущего состояния
- Спецификация железа (если нужно покупать) или подтверждение что существующий сервер подходит
- Список процессов с приоритизацией: что делаем первым этапом, что вторым
- Документ с границами проекта — что входит в первую версию, что нет
Чего ждать: пара длинных встреч (2-3 часа каждая), интервью с ключевыми пользователями, изучение примеров документов под NDA.
Неделя 2: подготовка железа и базовая установка
Цель этапа: получить рабочий сервер с базовой инсталляцией AGmind.
Если железо уже есть:
- Подключение к серверу, проверка ОС (Linux Ubuntu 22.04 LTS — оптимально), GPU-драйверов, доступа из корпоративной сети
- Установка стека: PostgreSQL, Redis, Weaviate, MinIO, контейнерный runtime
- Базовая инсталляция AGmind через
install.sh - Настройка резервного копирования, мониторинга, логов
Если железо нужно покупать:
- Подбор спецификации под нагрузку (число пользователей, размер модели, контекст)
- Согласование закупки (1-2 недели на поставку, если стандартное железо)
- Установка в стойку, подключение к сети
- Базовая инсталляция как выше
На выходе:
- Сервер с запущенным AGmind, доступ через VPN/корп. сеть
- Базовая модель (Llama 3.3 70B / Qwen 3 / DeepSeek) отвечает на вопросы общего характера
- Web-интерфейс для тестирования (доступ только у внутренней команды)
- Документация по инфраструктуре
Чего ждать: на этом этапе AI пока ничего не знает о вашей компании — это инструмент без обученных данных. Полноценная работа начнётся через 1-2 недели.
Недели 3-4: обучение на ваших документах
Цель этапа: превратить базовую модель в ассистента, который отвечает по вашим конкретным документам.
Что делаем:
- Сбор документов: собираем 200-2000 файлов в одну папку (договоры, регламенты, методички, FAQ, переписка которую можно отдать AI)
- Парсинг: документы прогоняются через RAGFlow/Docling, преобразуются в структурированный markdown
- Чанкинг: документы режутся на куски подходящего размера для поиска
- Векторизация: каждый чанк превращается в эмбеддинг через
bge-m3или аналог - Загрузка в векторную базу: Weaviate
- Тестирование: проверяем точность ответов на типовых вопросах
- Тюнинг: правим параметры чанкинга, эмбеддера, реранкера до достижения цели
Целевая точность: 90-95% на ваших типовых вопросах. Это значит, что AI правильно находит источник и формулирует ответ в 9-10 случаях из 10 на знакомых ему типах запросов.
На выходе:
- Векторная база со всеми вашими документами
- AI отвечает на вопросы со ссылкой на конкретную страницу источника
- Bench-тесты на 50-100 типовых вопросах с замером точности
- Документация какие настройки выбраны и почему
Чего ждать: это самый длинный и самый важный этап. От его качества зависит всё. Здесь часто всплывают неожиданные особенности корпоративных документов: нестандартное оформление таблиц, сканы которые плохо распознаются, региональные термины которые требуют отдельных настроек.
Недели 4-5: агенты и интеграции
Цель этапа: связать AI с системами, в которых работают сотрудники, чтобы AI стал частью workflow.
Типовые интеграции:
- Корпоративная учётная система (Active Directory, Keycloak, Yandex 360) — чтобы пользователи логинились через свою корп. учётку, без отдельных паролей
- 1С / SAP / другая ERP — чтобы AI мог отвечать на вопросы по продажам, складу, документообороту
- Bitrix24 / AmoCRM — расшифровка звонков → next-step → запись в CRM
- Корпоративная почта — категоризация входящих, автоответы по простым запросам
- SharePoint / Confluence — единый поиск по корп. базе знаний
Параллельно собираются агенты: не один универсальный бот, а набор специалистов под каждый отдел. Юрист, продажник, HR — у каждого своя инструкция, свои инструменты, свой стиль.
Сборка агентов происходит в Dify drag-n-drop. Десяток агентов собирается за неделю.
На выходе:
- Все интеграции работают в боевом режиме
- Сотрудники авторизуются через корп. учётку
- Агенты отрабатывают на реальных задачах
- Документация по каждому агенту: что делает, как пользоваться, как обновить
Неделя 5-6: нагрузочное тестирование и передача
Цель этапа: убедиться что система выдержит реальную нагрузку и подготовить команду к самостоятельной работе.
Нагрузочное тестирование:
- Имитация типовой рабочей нагрузки (30-100 параллельных запросов в час)
- Проверка времени отклика на пиках
- Стресс-тест: сколько запросов в минуту выдержит до деградации
- Тест fail-over: что происходит при отказе одного компонента
Передача:
- 4-часовое обучение для администратора (как мониторить, как обновлять, что делать при инциденте)
- 2-часовое обучение для конечных пользователей по отделам
- 32-страничный runbook с типовыми сценариями инцидентов
- Видеозаписи всего обучения для будущих сотрудников
На выходе:
- Система работает в боевом режиме, нагрузка проверена
- Админ может самостоятельно поднимать после сбоя, обновлять, добавлять новых пользователей
- Команда знает как пользоваться
Неделя 6+: SLA-поддержка (опционально)
После запуска есть два пути:
Самостоятельная поддержка: Ваш админ работает с системой по runbook’у. Внедренец остаётся на связи бесплатно по простым вопросам, платная консультация по сложным. Подходит компаниям с сильным IT-отделом.
SLA-поддержка под ключ: Внедренец берёт ответственность за uptime и обновления. Реакция на P1-инциденты за 1 час, ежемесячный health-review, регулярные обновления версий. Подходит когда нужна гарантия доступности.
Чего НЕ ждать
Не ждите готовых решений в первую неделю. Аудит — это про понимание, не про код. Если внедренец на первом звонке готов начать установку — это плохой признак.
Не ждите 100% точности на старте. Любой корпоративный AI требует тюнинга на конкретных данных. Точность растёт по мере итераций. Реалистичная цель — 90-95% на знакомых вопросах через 4-5 недель.
Не ждите что AI заменит экспертов. Юрист с AI-ассистентом обрабатывает в 3-5 раз больше договоров. AI без юриста — генератор галлюцинаций. Соотношение остаётся.
Итог
Внедрение корпоративного AI — это полноценный проект на 6-9 недель с конкретными фазами и deliverables. Не подписка, не «коробка», не «магия». Но при правильном подходе экономика однозначная: окупаемость через 9-14 месяцев, после — почти ноль OPEX.
Если хочется проверить процесс на маленьком масштабе — пилот на одном процессе за 2-3 недели от 100 000 ₽. Это не полный цикл, но даёт реальное представление о том, что получится в полной версии.
Полный технический разбор стека — в статье на Habr про DGX Spark. Для понимания экономики — расчёт стоимости на 30 человек.