Сколько реально стоит свой ChatGPT в компании на 30 человек
Прямой расчёт: облачный AI-стек vs self-hosted на 36 месяцев для команды 30 человек. С таблицами, скрытыми расходами и точкой окупаемости.
Свой ChatGPT на 30 человек — это оценочно 150–290 тыс. ₽ в месяц совокупных затрат в первый год (CAPEX железа + внедрение + минимальный SLA), против 250–350 тыс. ₽/мес на облачных подписках. Со второго года разрыв кратный: self-hosted уходит на ~50 тыс. ₽/мес OPEX, облако остаётся прежним.
Этот текст — про настоящие цифры, без маркетинга. Сценарии, скрытые статьи расходов, и почему «облачный AI дешевле потому что без капекса» — миф для команд от 20 человек.
Базовые предпосылки
Расчёт идёт для команды 30 активных пользователей AI-ассистента (юристы, продажники, аналитики, поддержка). Сценарий: каждый делает ~50 запросов в день, средний запрос — 4-6 тыс. токенов на вход, 1-2 тыс. на выход. Итого: 45 тыс. запросов в месяц, ~250 млн входных + ~70 млн выходных токенов.
Это реальный паттерн, не «максимальный». Многие компании выходят на эти цифры через 3-6 месяцев активного использования, когда сотрудники привыкают.
Сценарий 1: облачный путь — OpenAI / Anthropic / Google
Возьмём связку, которая чаще всего «выходит» по фактам:
- ChatGPT Enterprise (gpt-4o, gpt-4-turbo) для основной работы
- Claude Team (claude-sonnet-4) для длинных контекстов
- Embeddings + retrieval через Pinecone или Weaviate Cloud
- Базовая интеграция через Make / n8n / Zapier для бизнес-логики
| Статья | Месяц | Год |
|---|---|---|
| ChatGPT Enterprise (30 seat × $60) | $1 800 | $21 600 |
| Claude Team (30 seat × $30) | $900 | $10 800 |
| OpenAI API доплата за переборы (gpt-4-turbo, ~1.5x от seat) | $450 | $5 400 |
| Pinecone Standard | $70 | $840 |
| Make Pro | $35 | $420 |
| Платная поддержка / SLA | $100 | $1 200 |
| Итого USD | ~$3 355 | ~$40 260 |
| В рублях по курсу 90 | ~302 000 ₽ | ~3.62 млн ₽ |
Это «ровный» вариант. На пиках (отчётные периоды, season) — добавляется $300-800 к месяцу через overage’и API.
Скрытые расходы, которые забывают:
- VPN / мост для российских юзеров до OpenAI/Anthropic — 60-150 тыс ₽/год за стабильный канал
- Юристы на consulting по 152-ФЗ для каждого нового кейса использования — 50-200 тыс ₽/год
- Compliance audit при тендерах с госзаказчиками — 100-300 тыс ₽ единовременно
- Привязка: миграция на другую модель = переписать промпты, перенастроить интеграции (40-80 часов разработчика, ~250-500 тыс ₽)
С этими статьями средний total cost — 3.0-4.2 млн ₽ в год.
Сценарий 2: self-hosted под ключ
Та же команда, та же нагрузка. Стек на одном DGX Spark или сервере уровня RTX 4090 + 128 GB RAM, под управлением AGmind:
| Статья | Сумма |
|---|---|
| Сервер (DGX Spark или 4090 + 128 ГБ) | 600 000 — 1 200 000 ₽ |
| ИБП + базовая стойка | 80 000 — 150 000 ₽ |
| Внедрение под ключ (аудит + развёртывание + интеграции + передача) | 1 200 000 — 2 000 000 ₽ |
| Итого CAPEX (один раз) | 1.88 — 3.35 млн ₽ |
После запуска — только OPEX:
| Статья | Год |
|---|---|
| Электричество (~400 Вт ср., ~3.5 руб/кВт·ч) | 12 000 ₽ |
| Опциональный SLA-поддержка (P1 час, monthly health-check) | 60 000 — 150 000 ₽/мес = 0.7-1.8 млн ₽ |
| Без SLA — переход на in-house IT | 0 (трудозатраты вашего админа) |
| Обновления моделей (перетюнинг раз в 6-12 мес) | 50 000 — 200 000 ₽/раз |
Чистый OPEX без SLA: ~80 000 ₽/год на электричество и обновления. С SLA: ~1 млн ₽/год.
Цифры в таблицах — оценочные расчёты на типовых сценариях нагрузки, а не оферта; реальная стоимость зависит от вашего профиля использования.
Точка окупаемости
Если включить SLA (для большинства компаний это разумно — уровень доступности как у внешнего провайдера):
CAPEX 2.5 млн ₽ + 12 мес SLA × 0.6 млн = 3.1 млн ₽ за первый год
Облачный сценарий первый год: 3.6 млн ₽
Разница: 0.5 млн ₽ в пользу self-hosted уже на первый год
Дальше каждый последующий год self-hosted стоит ~0.6 млн ₽ против 3.6+ млн на облаке. Накопленная экономия за 3 года: 4.5-6 млн ₽.
Без SLA (компания с собственным IT-отделом): первый год ровно. Каждый следующий год экономия ~3.5 млн ₽.
Когда self-hosted не имеет смысла
Прямо скажем — три случая, где облако правильный выбор:
- Команда до 10 человек с эпизодическим использованием. Подписки за 60-100 тыс ₽/мес окупают любые альтернативы.
- Стартап с runway < 12 месяцев — CAPEX ломает cash flow, важнее короткие платежи.
- Использование экзотических моделей (gpt-4-vision-preview на cutting edge, exclusive features Anthropic) — на on-prem может быть отставание на 6-12 месяцев.
Для команды 30+ с регулярной нагрузкой — экономика однозначная.
Что обычно недооценивают
Реальная нагрузка растёт с привычкой. В первый месяц 30 человек делают 5-10k запросов. Через год — 60-100k. Облачные счета растут пропорционально, on-prem — нет (упирается только в железо).
Compliance-стоимость в облаке растёт вместе с тендерами. Каждый новый госконтракт требует юридического заключения по 152-ФЗ и иногда аудита. Self-hosted закрывает это раз и навсегда. Методику расчёта ROI и метрики окупаемости разбираем в «ROI внедрения AI: расчёт и метрики».
Lock-in счёт приходит через 2-3 года. Когда вы потратили год на промпт-инжиниринг и кастомные workflow в Make/n8n — миграция на конкурента стоит 500-1500 тыс ₽ за работу разработчиков. Сценарии перехода с облака на self-hosted разобраны в «Миграция облачного AI на self-hosted».
Итог
Для команды 30+ человек с регулярной AI-нагрузкой self-hosted развёртывание окупается за 9-14 месяцев. На горизонте 3 лет накопленная экономия — 4-6 млн ₽. Плюс закрытый вопрос compliance, отсутствие lock-in, контроль над данными.
Принципиальное условие: правильное внедрение. Своими руками без опыта — это 6-12 месяцев на грабли (мы их уже прошли, есть кейс на Habr). Под ключ — 4-6 недель и фиксированная цена.
Если хочется проверить экономику на ваших цифрах — пилот на одном процессе от 100 000 ₽ за 2-3 недели. Это формат «потрогать руками перед полным внедрением» с возвратом если результат не устроит.