Ваш код. Ваши серверы. Ваш AI.

Тот же продукт внутри вашего периметра. Тот же движок, тот же поиск, тот же MCP. Подключите свою LLM и свой Git-сервер.

Docker Compose или Kubernetes / Helm
Своя LLM (любая OpenAI-совместимая)
Изоляция тенантов + AES-256-GCM envelope-шифрование

Когда облачную версию не пропускают закупки

Если код не может покидать сеть — из-за регулятора, IP или своей службы безопасности — облачный продукт отпадает сразу. Self-hosted — тот же продукт, но на вашем железе.

Жёсткая локализация данных

Финансовые организации и другие регулируемые отрасли с региональными требованиями к хранению данных
Внутренние комплаенс-политики, запрещающие коду покидать периметр
Компании, готовящиеся к собственным аудитам (SOC 2 / ISO 27001)

Из вашего VPC не уходит ничего. Никогда.

Защита IP и секретов

Проприетарные алгоритмы, модели или коммерческая тайна в коде
Строгие политики передачи данных третьим сторонам
Контракты под NDA, где исходящие пути к коду недопустимы

Исходники остаются там, где ключи — у вас.

Закупки и вендорские ограничения

Международные компании с региональными списками одобренных вендоров
Заказчики, которым всё должно работать в собственном VPC
Команды на внутренних LLM-стеках вместо публичных API

Никаких новых вендоров и согласований через исключения.

Те же функции, что и в облаке.

Self-hosted собирается из того же кода, что и облако. Ниже — полная таблица соответствия.

Те же функции, что и в облаке.
Возможность	Облако	Self-Hosted
Полный Context Engine	Включено	Включено
Мультирепозиторный анализ	Включено	Включено
Code Review Agent	Включено	Включено
Deep Research	Включено	Включено
MCP-сервер	Включено	Включено
API-доступ	Включено	Включено
Граф знаний GraphRAG	Включено	Включено
Инкрементальная индексация	Включено	Включено
Совместная работа команды	Включено	Включено
RBAC и права доступа	Включено	Включено
Изоляция тенантов (привязка KEK на уровне организации)	Включено	Включено
Шифрование в покое (envelope AES-256-GCM)	Включено	Включено
Поддержка своей LLM	Не включено	Включено
SSO / SAML	В планах	Доступно на Enterprise (custom)
Контроль локализации данных	Ограничено	Полный

Полный Context Engine

ОблакоВключено
Self-HostedВключено

Мультирепозиторный анализ

ОблакоВключено
Self-HostedВключено

Code Review Agent

ОблакоВключено
Self-HostedВключено

Deep Research

ОблакоВключено
Self-HostedВключено

MCP-сервер

ОблакоВключено
Self-HostedВключено

API-доступ

ОблакоВключено
Self-HostedВключено

Граф знаний GraphRAG

ОблакоВключено
Self-HostedВключено

Инкрементальная индексация

ОблакоВключено
Self-HostedВключено

Совместная работа команды

ОблакоВключено
Self-HostedВключено

RBAC и права доступа

ОблакоВключено
Self-HostedВключено

Изоляция тенантов (привязка KEK на уровне организации)

ОблакоВключено
Self-HostedВключено

Шифрование в покое (envelope AES-256-GCM)

ОблакоВключено
Self-HostedВключено

Поддержка своей LLM

ОблакоНе включено
Self-HostedВключено

SSO / SAML

ОблакоВ планах
Self-HostedДоступно на Enterprise (custom)

Контроль локализации данных

ОблакоОграничено
Self-HostedПолный

Два пути развёртывания

Один — чтобы быстро попробовать, другой — для продакшена под нагрузкой.

Быстрый старт

Docker Compose

Развёртывание на одной ноде для небольших команд.

Подходит для: Команд разработки, POC, небольших компаний
Рекомендуется: 16 ГБ RAM, 8 vCPU, 200 ГБ SSD

Запуск за час на одной ноде.

Production-ready

Kubernetes / Helm

Горизонтально масштабируемое высокодоступное развёртывание.

Подходит для: Крупных компаний, платформенных команд
Совместимость: Managed K8s (EKS, GKE, AKS) и on-prem-дистрибутивы

HA, автоскейлинг, тысячи репозиториев.

Все развёртывания включают автоматический бэкап, эндпоинты для мониторинга и health-чеки. Контейнерные образы тянутся из нашего приватного registry (или вашего зеркала).

Подключите свою LLM.

Поиск делает основную работу — модель класса 70B с открытыми весами справляется с большинством запросов. Кластер из H100 не нужен.

Почти всё, что делает frontier-модель «умной» на коде, — это контекст. Мы его поставляем, вы берёте модель под свой GPU-бюджет.

Модель	Комментарий
gpt-oss-120b	Открытая модель от OpenAI; сильный универсал для кода и рассуждений
GLM 5.1	Флагман Zhipu AI; длинный контекст, силён в понимании кода
Kimi 2.6	Агентная модель Moonshot; большое контекстное окно
DeepSeek V4	MoE-флагман DeepSeek; силён в задачах с кодом
Qwen 3 Coder	Длинноконтекстная coder-модель Alibaba

Поддержка коммерческих API

Для гибридных развёртываний.

OpenAI (модели класса GPT)
Anthropic Claude
Google Gemini (дефолт в текущих self-hosted-сборках)
DeepInfra
Azure OpenAI Service

Как подключить

CodeAlive работает с любым OpenAI-совместимым API — vLLM, Ollama, TGI, LocalAI, SGLang и большинство внутренних LLM-шлюзов. Прописываете адрес inference-стека, добавляете API-ключ — готово.

Модель поменьше с хорошим поиском обходит frontier-модель без него.

Что в кодовой базе уже есть

Сертификата SOC 2 пока нет. Вместо бейджей показываем, что уже реализовано в продукте.

Изоляция тенантов

Каждый запрос автоматически фильтруется по ID организации на уровне репозитория
Доступ между тенантами выбрасывает WrongTenantAccessException — enforced в коде, а не в политике
Изолированные sandbox-контейнеры под каждый репозиторий без доступа к БД и шлюзу
Покрыто интеграционными тестами, которые гоняются на каждой сборке

Контроль доступа

RBAC через модель Mandate (Administrator / Manager / User / ReadOnly / Guest)
Воркспейсы на уровне организации со скоупингом по репозиториям
API-ключи привязаны к одной организации и хранятся как SHA-256-хеши
SSO / SAML — в планах; сегодня доступно только на Enterprise через кастомное развёртывание

Защита данных

Исходный код не хранится постоянно: репозитории подтягиваются в sandbox на время индексации и удаляются после
Символы кода хранятся зашифрованными: AES-256-GCM с envelope-шифрованием
Привязка KEK к организации: даже с мастер-ключом расшифровать данные другой организации криптографически невозможно
TLS 1.3 в транзите; ключевой материал обнуляется после использования; KEK версионируются для ротации без даунтайма

Аудит и observability

Структурированное логирование через OpenTelemetry (traces + logs + metrics)
Трейсы запросов включают контекст пользователя и организации; читаются из вашего лог-бэкенда (Grafana / Loki / Datadog / Splunk)
GDPR-совместимое логирование согласий для cookie/preference-событий
Формат под SIEM (JSON); нативных SIEM-коннекторов пока нет

Сетевая безопасность

В self-hosted работает целиком внутри вашего VPC и сети
Default-deny network policies между сервисами
Доступ операторов через VPN; публичного Kubernetes API нет
Секреты подкладываются через External Secrets Operator — никогда не в образах и не в env-файлах

Управление уязвимостями

Подпись контейнерных образов
Регулярные security-патчи через версионированные релизы образов
Мониторинг CVE по зависимостям
SBOM по запросу

Доступно по запросу

NDA под ваши требования
Документ с обзором безопасности
Окно пентеста для Enterprise-клиентов

Что и где работает

Каждый компонент, его место в вашей сети и то, с чем он общается.

┌─────────────────────────────────────────────────────────────────────────┐
│                        YOUR SECURE PERIMETER                            │
│  ┌───────────────────────────────────────────────────────────────────┐  │
│  │                     CodeAlive Platform                            │  │
│  │  ┌─────────────┐  ┌─────────────┐  ┌─────────────┐                │  │
│  │  │   Web UI    │  │  MCP Server │  │  REST API   │                │  │
│  │  └──────┬──────┘  └──────┬──────┘  └──────┬──────┘                │  │
│  │         │                │                │                       │  │
│  │         └────────────────┼────────────────┘                       │  │
│  │                          ▼                                        │  │
│  │  ┌─────────────────────────────────────────────────────────────┐  │  │
│  │  │                   Context Engine                            │  │  │
│  │  │  ┌─────────────┐  ┌─────────────┐  ┌─────────────┐          │  │  │
│  │  │  │  Indexer    │  │  GraphRAG   │  │  Query      │          │  │  │
│  │  │  │  Service    │  │  Engine     │  │  Processor  │          │  │  │
│  │  │  └─────────────┘  └─────────────┘  └─────────────┘          │  │  │
│  │  └─────────────────────────────────────────────────────────────┘  │  │
│  │         │                          │                              │  │
│  │         ▼                          ▼                              │  │
│  │  ┌─────────────┐           ┌─────────────────┐                    │  │
│  │  │  Vector DB  │           │  Your LLM       │                    │  │
│  │  │  (Embedded) │           │  (vLLM/Ollama)  │                    │  │
│  │  └─────────────┘           └─────────────────┘                    │  │
│  └───────────────────────────────────────────────────────────────────┘  │
│         │                                                               │
│         ▼                                                               │
│  ┌──────────────────┐                                                   │
│  │  Your Git Server │  (GitLab, Bitbucket, Gitea, etc.)                 │
│  │  (Internal)      │                                                   │
│  └──────────────────┘                                                   │
│                                                                         │
│  ═══════════════════════════════════════════════════════════════════    │
│                    NO EXTERNAL NETWORK TRAFFIC                          │
└─────────────────────────────────────────────────────────────────────────┘

Описание компонентов

Context Engine: Индексирует кодовую базу и отвечает на запросы
GraphRAG Engine: Строит и обходит граф знаний по связям в коде
Сервис индексации: Обрабатывает репозитории и извлекает семантическую информацию
Обработчик запросов: Принимает запросы на естественном языке и достаёт релевантный контекст
Векторная БД: Хранит эмбеддинги для семантического поиска
Ваша LLM: Языковая модель, которую вы запускаете (полностью под вашим контролем)

Требования к ресурсам

Сам CodeAlive — без учёта локальной LLM, если вы её запускаете рядом.

Размер развёртывания	Репозитории	Пользователи	CPU	RAM	Хранилище
Минимум (POC)	Несколько	Пара человек	4 ядра	8 ГБ	50 ГБ SSD
Production (небольшая/средняя команда)	До ~200	До ~100	8+ ядер	16–32 ГБ	200+ ГБ SSD
Большая команда / несколько команд	До ~1000	До ~500	16+ ядер	64+ ГБ	500+ ГБ SSD
Enterprise	Кастом	Кастом	Рассчитаем вместе	Рассчитаем вместе	Рассчитаем вместе

Минимум (POC)
Репозитории
Несколько
Пользователи
Пара человек
CPU
4 ядра
RAM
8 ГБ
Хранилище
50 ГБ SSD
Production (небольшая/средняя команда)
Репозитории
До ~200
Пользователи
До ~100
CPU
8+ ядер
RAM
16–32 ГБ
Хранилище
200+ ГБ SSD
Большая команда / несколько команд
Репозитории
До ~1000
Пользователи
До ~500
CPU
16+ ядер
RAM
64+ ГБ
Хранилище
500+ ГБ SSD
Enterprise
Репозитории
Кастом
Пользователи
Кастом
CPU
Рассчитаем вместе
RAM
Рассчитаем вместе
Хранилище
Рассчитаем вместе

GPU нужен только если вы запускаете локальную LLM на той же машине. Если OpenAI-совместимая LLM работает где-то ещё — в вашем кластере vLLM, через LLM-шлюз или cloud API — сам CodeAlive работает на CPU. Реальные требования зависят от размера репозиториев, частоты индексации и числа одновременных пользователей. Рассчитаем под ваш случай на deployment-звонке.

Работает с вашим текущим стеком

Git-серверы, identity-провайдеры и observability-стек, которые у вас уже подняты.

Git-серверы (внутренние)

GitLab Self-Managed
Bitbucket Data Center
Gitea
GitHub Enterprise Server
Azure DevOps Server

Identity-провайдеры

В планах; доступно на Enterprise через кастомное развёртывание.

SAML 2.0 / OIDC (запланировано для general availability)
Okta
Azure AD / Entra ID
Ping Identity
OneLogin
Keycloak

Сейчас:Email/пароль + API-ключи с RBAC на уровне организации

AI-агенты и IDE (через MCP)

Cursor
Claude Code
Continue
Cline
VS Code (через расширение)
JetBrains IDEs

Observability

Эндпоинт метрик Prometheus
Трейсы OpenTelemetry
Структурированные логи (JSON)
Интеграция с Grafana, Datadog, Splunk

Интеграция с CI/CD

API для встраивания в пайплайны
Поддержка вебхуков
GitHub Actions (self-hosted runners)
GitLab CI
Jenkins

Истории клиентов

Self-hosted-клиенты появятся здесь, когда выйдут в продакшен и согласуют публикацию. Никаких выдуманных персонажей. Хотите быть первой публичной историей? Напишите нам.

Пока посмотрите отзывы на главной — Hauke Feddersen (grasbyte GmbH), Zhaksylyk Ualiyev (Esqadra Technologies), Alexander Kolotov (Blockscout) и Sergey Loginov. Реальные люди, опубликовано с разрешения.

Связаться с нами Читать отзывы на главной

Первый ответ за день, продакшен за неделю

Helm-чарт не нужно разбирать в одиночку — разворачиваем вместе с вами.

Таймлайн развёртывания

1
Установочный звонок
День 0
- Разбираемся в ваших требованиях
- Оцениваем совместимость с инфраструктурой
- Определяем критерии успеха
2
Архитектурное ревью
Дни 1–2
- Фиксируем топологию развёртывания
- Планируем точки интеграции
- Security-ревью
3
Развёртывание
Дни 3–5
- Установка с поддержкой
- Помощь с конфигурацией
- Первичная индексация репозиториев
4
Валидация
Дни 5–7
- Функциональное тестирование
- Тюнинг производительности
- Приёмочное тестирование
5
Запуск в прод
День 7+
- Онбординг команды
- Постоянная поддержка
- Регулярные созвоны

Уровни поддержки

Уровень поддержки	Время ответа	Включено в
Standard	24 часа	Все self-hosted
Priority	4 часа	Тариф Enterprise
Dedicated	1 час + Slack	Enterprise+

Standard
Время ответа
24 часа
Включено в
Все self-hosted
Priority
Время ответа
4 часа
Включено в
Тариф Enterprise
Dedicated
Время ответа
1 час + Slack
Включено в
Enterprise+

Обсудить развёртывание Технические требования

Частые вопросы по self-hosted-развёртыванию

Готовы развернуть в своём периметре?

Внутри вашего VPC, на вашей LLM, с вашим внутренним Git-сервером.

Запросить демо Гайд по архитектуре

Тот же движок, что и в облаке — тот же поиск, тот же MCP, те же агенты
Разворачивается через Docker Compose или Kubernetes / Helm
Подключите свою LLM — любую OpenAI-совместимую
NDA доступен; документ с обзором безопасности — по запросу