Сколько реально стоит свой ChatGPT в компании на 30 человек

Свой ChatGPT на 30 человек — это оценочно 150–290 тыс. ₽ в месяц совокупных затрат в первый год (CAPEX железа + внедрение + минимальный SLA), против 250–350 тыс. ₽/мес на облачных подписках. Со второго года разрыв кратный: self-hosted уходит на ~50 тыс. ₽/мес OPEX, облако остаётся прежним.

Этот текст — про настоящие цифры, без маркетинга. Сценарии, скрытые статьи расходов, и почему «облачный AI дешевле потому что без капекса» — миф для команд от 20 человек.

Базовые предпосылки

Расчёт идёт для команды 30 активных пользователей AI-ассистента (юристы, продажники, аналитики, поддержка). Сценарий: каждый делает ~50 запросов в день, средний запрос — 4-6 тыс. токенов на вход, 1-2 тыс. на выход. Итого: 45 тыс. запросов в месяц, ~250 млн входных + ~70 млн выходных токенов.

Это реальный паттерн, не «максимальный». Многие компании выходят на эти цифры через 3-6 месяцев активного использования, когда сотрудники привыкают.

Сценарий 1: облачный путь — OpenAI / Anthropic / Google

Возьмём связку, которая чаще всего «выходит» по фактам:

ChatGPT Enterprise (gpt-4o, gpt-4-turbo) для основной работы
Claude Team (claude-sonnet-4) для длинных контекстов
Embeddings + retrieval через Pinecone или Weaviate Cloud
Базовая интеграция через Make / n8n / Zapier для бизнес-логики

Статья	Месяц	Год
ChatGPT Enterprise (30 seat × $60)	$1 800	$21 600
Claude Team (30 seat × $30)	$900	$10 800
OpenAI API доплата за переборы (gpt-4-turbo, ~1.5x от seat)	$450	$5 400
Pinecone Standard	$70	$840
Make Pro	$35	$420
Платная поддержка / SLA	$100	$1 200
Итого USD	~$3 355	~$40 260
В рублях по курсу 90	~302 000 ₽	~3.62 млн ₽

Это «ровный» вариант. На пиках (отчётные периоды, season) — добавляется $300-800 к месяцу через overage’и API.

Скрытые расходы, которые забывают:

VPN / мост для российских юзеров до OpenAI/Anthropic — 60-150 тыс ₽/год за стабильный канал
Юристы на consulting по 152-ФЗ для каждого нового кейса использования — 50-200 тыс ₽/год
Compliance audit при тендерах с госзаказчиками — 100-300 тыс ₽ единовременно
Привязка: миграция на другую модель = переписать промпты, перенастроить интеграции (40-80 часов разработчика, ~250-500 тыс ₽)

С этими статьями средний total cost — 3.0-4.2 млн ₽ в год.

Сценарий 2: self-hosted под ключ

Та же команда, та же нагрузка. Стек на одном DGX Spark или сервере уровня RTX 4090 + 128 GB RAM, под управлением AGmind:

Статья	Сумма
Сервер (DGX Spark или 4090 + 128 ГБ)	600 000 — 1 200 000 ₽
ИБП + базовая стойка	80 000 — 150 000 ₽
Внедрение под ключ (аудит + развёртывание + интеграции + передача)	1 200 000 — 2 000 000 ₽
Итого CAPEX (один раз)	1.88 — 3.35 млн ₽

После запуска — только OPEX:

Статья	Год
Электричество (~400 Вт ср., ~3.5 руб/кВт·ч)	12 000 ₽
Опциональный SLA-поддержка (P1 час, monthly health-check)	60 000 — 150 000 ₽/мес = 0.7-1.8 млн ₽
Без SLA — переход на in-house IT	0 (трудозатраты вашего админа)
Обновления моделей (перетюнинг раз в 6-12 мес)	50 000 — 200 000 ₽/раз

Чистый OPEX без SLA: ~80 000 ₽/год на электричество и обновления. С SLA: ~1 млн ₽/год.

Цифры в таблицах — оценочные расчёты на типовых сценариях нагрузки, а не оферта; реальная стоимость зависит от вашего профиля использования.

Точка окупаемости

Если включить SLA (для большинства компаний это разумно — уровень доступности как у внешнего провайдера):

CAPEX 2.5 млн ₽ + 12 мес SLA × 0.6 млн = 3.1 млн ₽ за первый год
Облачный сценарий первый год: 3.6 млн ₽
Разница: 0.5 млн ₽ в пользу self-hosted уже на первый год

Дальше каждый последующий год self-hosted стоит ~0.6 млн ₽ против 3.6+ млн на облаке. Накопленная экономия за 3 года: 4.5-6 млн ₽.

Без SLA (компания с собственным IT-отделом): первый год ровно. Каждый следующий год экономия ~3.5 млн ₽.

Когда self-hosted не имеет смысла

Прямо скажем — три случая, где облако правильный выбор:

Команда до 10 человек с эпизодическим использованием. Подписки за 60-100 тыс ₽/мес окупают любые альтернативы.
Стартап с runway < 12 месяцев — CAPEX ломает cash flow, важнее короткие платежи.
Использование экзотических моделей (gpt-4-vision-preview на cutting edge, exclusive features Anthropic) — на on-prem может быть отставание на 6-12 месяцев.

Для команды 30+ с регулярной нагрузкой — экономика однозначная.

Что обычно недооценивают

Реальная нагрузка растёт с привычкой. В первый месяц 30 человек делают 5-10k запросов. Через год — 60-100k. Облачные счета растут пропорционально, on-prem — нет (упирается только в железо).

Compliance-стоимость в облаке растёт вместе с тендерами. Каждый новый госконтракт требует юридического заключения по 152-ФЗ и иногда аудита. Self-hosted закрывает это раз и навсегда. Методику расчёта ROI и метрики окупаемости разбираем в «ROI внедрения AI: расчёт и метрики».

Lock-in счёт приходит через 2-3 года. Когда вы потратили год на промпт-инжиниринг и кастомные workflow в Make/n8n — миграция на конкурента стоит 500-1500 тыс ₽ за работу разработчиков. Сценарии перехода с облака на self-hosted разобраны в «Миграция облачного AI на self-hosted».

Итог

Для команды 30+ человек с регулярной AI-нагрузкой self-hosted развёртывание окупается за 9-14 месяцев. На горизонте 3 лет накопленная экономия — 4-6 млн ₽. Плюс закрытый вопрос compliance, отсутствие lock-in, контроль над данными.

Принципиальное условие: правильное внедрение. Своими руками без опыта — это 6-12 месяцев на грабли (мы их уже прошли, есть кейс на Habr). Под ключ — 4-6 недель и фиксированная цена.

Если хочется проверить экономику на ваших цифрах — пилот на одном процессе от 100 000 ₽ за 2-3 недели. Это формат «потрогать руками перед полным внедрением» с возвратом если результат не устроит.