Перейти к основному содержимому
CodeAlive

Ваш код. Ваши серверы. Ваш AI.

Тот же продукт внутри вашего периметра. Тот же движок, тот же поиск, тот же MCP. Подключите свою LLM и свой Git-сервер.

  • Docker Compose или Kubernetes / Helm
  • Своя LLM (любая OpenAI-совместимая)
  • Изоляция тенантов + AES-256-GCM envelope-шифрование

Когда облачную версию не пропускают закупки

Если код не может покидать сеть — из-за регулятора, IP или своей службы безопасности — облачный продукт отпадает сразу. Self-hosted — тот же продукт, но на вашем железе.

Жёсткая локализация данных

  • Финансовые организации и другие регулируемые отрасли с региональными требованиями к хранению данных
  • Внутренние комплаенс-политики, запрещающие коду покидать периметр
  • Компании, готовящиеся к собственным аудитам (SOC 2 / ISO 27001)
Из вашего VPC не уходит ничего. Никогда.

Защита IP и секретов

  • Проприетарные алгоритмы, модели или коммерческая тайна в коде
  • Строгие политики передачи данных третьим сторонам
  • Контракты под NDA, где исходящие пути к коду недопустимы
Исходники остаются там, где ключи — у вас.

Закупки и вендорские ограничения

  • Международные компании с региональными списками одобренных вендоров
  • Заказчики, которым всё должно работать в собственном VPC
  • Команды на внутренних LLM-стеках вместо публичных API
Никаких новых вендоров и согласований через исключения.

Те же функции, что и в облаке.

Self-hosted поставляется тем же бинарём, что и облако. Ниже — исчерпывающая матрица.

Полный Context Engine

  • ОблакоВключено
  • Self-HostedВключено

Мультирепозиторный анализ

  • ОблакоВключено
  • Self-HostedВключено

Code Review Agent

  • ОблакоВключено
  • Self-HostedВключено

Deep Research

  • ОблакоВключено
  • Self-HostedВключено

MCP-сервер

  • ОблакоВключено
  • Self-HostedВключено

API-доступ

  • ОблакоВключено
  • Self-HostedВключено

Граф знаний GraphRAG

  • ОблакоВключено
  • Self-HostedВключено

Инкрементальная индексация

  • ОблакоВключено
  • Self-HostedВключено

Совместная работа команды

  • ОблакоВключено
  • Self-HostedВключено

RBAC и права доступа

  • ОблакоВключено
  • Self-HostedВключено

Изоляция тенантов (привязка KEK на уровне организации)

  • ОблакоВключено
  • Self-HostedВключено

Шифрование в покое (envelope AES-256-GCM)

  • ОблакоВключено
  • Self-HostedВключено

Поддержка своей LLM

  • ОблакоНе включено
  • Self-HostedВключено

SSO / SAML

  • ОблакоВ планах
  • Self-HostedДоступно на Enterprise (custom)

Контроль локализации данных

  • ОблакоОграничено
  • Self-HostedПолный

Два пути развёртывания

Один — чтобы быстро попробовать, другой — для продакшена под нагрузкой.

Быстрый старт

Docker Compose

Развёртывание на одной ноде для небольших команд.

Подходит для
Команд разработки, POC, небольших компаний
Рекомендуется
16 ГБ RAM, 8 vCPU, 200 ГБ SSD

Запуск за час на одной ноде.

Production-ready

Kubernetes / Helm

Горизонтально масштабируемое высокодоступное развёртывание.

Подходит для
Крупных компаний, платформенных команд
Совместимость
Managed K8s (EKS, GKE, AKS) и on-prem-дистрибутивы

HA, автоскейлинг, тысячи репозиториев.

Все развёртывания включают автоматический бэкап, эндпоинты для мониторинга и health-чеки. Контейнерные образы тянутся из нашего приватного registry (или вашего зеркала).

Подключите свою LLM.

Поиск делает основную работу — модель класса 70B с открытыми весами справляется с большинством запросов. Кластер из H100 не нужен.

Почти всё, что делает frontier-модель «умной» на коде, — это контекст. Мы его поставляем, вы берёте модель под свой GPU-бюджет.

Рекомендуемые модели с открытыми весами

Эти проверены. Любая OpenAI-совместимая тоже подойдёт.

  • gpt-oss-120b

    Открытая модель от OpenAI; сильный универсал для кода и рассуждений

  • GLM 5.1

    Флагман Zhipu AI; длинный контекст, силён в понимании кода

  • Kimi 2.6

    Агентная модель Moonshot; большое контекстное окно

  • DeepSeek V4

    MoE-флагман DeepSeek; силён в задачах с кодом

  • Qwen 3 Coder

    Длинноконтекстная coder-модель Alibaba

Требования к железу зависят от выбранной модели и квантизации. Берите модель под тот GPU-бюджет, который у вас уже есть. Поиск CodeAlive позволяет модели поменьше работать так, словно у неё контекст модели побольше.

Поддержка коммерческих API

Для гибридных развёртываний.

  • OpenAI (модели класса GPT)
  • Anthropic Claude
  • Google Gemini (дефолт в текущих self-hosted-сборках)
  • DeepInfra
  • Azure OpenAI Service

Как подключить

CodeAlive работает с любым OpenAI-совместимым API — vLLM, Ollama, TGI, LocalAI, SGLang и большинство внутренних LLM-шлюзов. Прописываете адрес inference-стека, добавляете API-ключ — готово.

Модель поменьше с хорошим поиском обходит frontier-модель без него.

Что в кодовой базе уже есть

Бейджа SOC 2 пока нет. Вместо него — что реально лежит в кодовой базе сегодня.

Изоляция тенантов

  • Каждый запрос автоматически фильтруется по ID организации на уровне репозитория
  • Доступ между тенантами выбрасывает WrongTenantAccessException — enforced в коде, а не в политике
  • Изолированные sandbox-контейнеры под каждый репозиторий без доступа к БД и шлюзу
  • Покрыто интеграционными тестами, которые гоняются на каждой сборке

Контроль доступа

  • RBAC через модель Mandate (Administrator / Manager / User / ReadOnly / Guest)
  • Воркспейсы на уровне организации со скоупингом по репозиториям
  • API-ключи привязаны к одной организации и хранятся как SHA-256-хеши
  • SSO / SAML — в планах; сегодня доступно только на Enterprise через кастомное развёртывание

Защита данных

  • Исходный код не хранится постоянно: репозитории подтягиваются в sandbox на время индексации и удаляются после
  • Символы кода хранятся зашифрованными: AES-256-GCM с envelope-шифрованием
  • Привязка KEK к организации: даже с мастер-ключом расшифровать данные другой организации криптографически невозможно
  • TLS 1.3 в транзите; ключевой материал обнуляется после использования; KEK версионируются для ротации без даунтайма

Аудит и observability

  • Структурированное логирование через OpenTelemetry (traces + logs + metrics)
  • Трейсы запросов включают контекст пользователя и организации; читаются из вашего лог-бэкенда (Grafana / Loki / Datadog / Splunk)
  • GDPR-совместимое логирование согласий для cookie/preference-событий
  • Формат под SIEM (JSON); нативных SIEM-коннекторов пока нет

Сетевая безопасность

  • В self-hosted работает целиком внутри вашего VPC и сети
  • Default-deny network policies между сервисами
  • Доступ операторов через VPN; публичного Kubernetes API нет
  • Секреты подкладываются через External Secrets Operator — никогда не в образах и не в env-файлах

Управление уязвимостями

  • Подпись контейнерных образов
  • Регулярные security-патчи через версионированные релизы образов
  • Мониторинг CVE по зависимостям
  • SBOM по запросу

Доступно по запросу

  • NDA под ваши требования
  • Security overview document
  • Окно пентеста для Enterprise-клиентов

Что и где работает

Каждый компонент, его место в вашей сети и то, с чем он общается.

Описание компонентов

Context Engine
Индексирует кодовую базу и отвечает на запросы
GraphRAG Engine
Строит и обходит граф знаний по связям в коде
Indexer Service
Обрабатывает репозитории и извлекает семантическую информацию
Query Processor
Принимает запросы на естественном языке и достаёт релевантный контекст
Vector DB
Хранит эмбеддинги для семантического поиска
Ваша LLM
Языковая модель, которую вы запускаете (полностью под вашим контролем)

Требования к ресурсам

Сам CodeAlive — без учёта локальной LLM, если вы её запускаете рядом.

  • Минимум (POC)

    Репозитории
    Несколько
    Пользователи
    Пара человек
    CPU
    4 ядра
    RAM
    8 ГБ
    Хранилище
    50 ГБ SSD
  • Production (небольшая/средняя команда)

    Репозитории
    До ~200
    Пользователи
    До ~100
    CPU
    8+ ядер
    RAM
    16–32 ГБ
    Хранилище
    200+ ГБ SSD
  • Большая команда / несколько команд

    Репозитории
    До ~1000
    Пользователи
    До ~500
    CPU
    16+ ядер
    RAM
    64+ ГБ
    Хранилище
    500+ ГБ SSD
  • Enterprise

    Репозитории
    Кастом
    Пользователи
    Кастом
    CPU
    Рассчитаем вместе
    RAM
    Рассчитаем вместе
    Хранилище
    Рассчитаем вместе

GPU нужен только если вы запускаете локальную LLM на той же машине. Если OpenAI-совместимая LLM работает где-то ещё — в вашем кластере vLLM, через LLM-шлюз или cloud API — сам CodeAlive работает на CPU. Реальные требования зависят от размера репозиториев, частоты индексации и числа одновременных пользователей. Рассчитаем под ваш случай на deployment-звонке.

Работает с вашим текущим стеком

Git-серверы, identity-провайдеры и observability-стек, которые у вас уже подняты.

Git-серверы (внутренние)

  • GitLab Self-Managed
  • Bitbucket Data Center
  • Gitea
  • GitHub Enterprise Server
  • Azure DevOps Server

Identity-провайдеры

В планах; доступно на Enterprise через кастомное развёртывание.

  • SAML 2.0 / OIDC (запланировано для general availability)
  • Okta
  • Azure AD / Entra ID
  • Ping Identity
  • OneLogin
  • Keycloak

Сейчас:Email/пароль + API-ключи с RBAC на уровне организации

AI-агенты и IDE (через MCP)

  • Cursor
  • Claude Code
  • Continue
  • Cline
  • VS Code (через расширение)
  • JetBrains IDEs

Observability

  • Эндпоинт метрик Prometheus
  • Трейсы OpenTelemetry
  • Структурированные логи (JSON)
  • Интеграция с Grafana, Datadog, Splunk

Интеграция с CI/CD

  • API для встраивания в пайплайны
  • Поддержка вебхуков
  • GitHub Actions (self-hosted runners)
  • GitLab CI
  • Jenkins

Истории клиентов

Self-hosted-клиенты появятся здесь, когда выйдут в продакшен и согласуют публикацию. Никаких выдуманных персонажей. Хотите быть первой публичной историей? Напишите нам.

Пока посмотрите отзывы на главной — Hauke Feddersen (grasbyte GmbH), Zhaksylyk Ualiyev (Esqadra Technologies), Alexander Kolotov (Blockscout), Sergey Loginov и Sergey Sarafinovich. Реальные люди, опубликовано с разрешения.

Первый ответ за день, продакшен за неделю

Helm-чарт не нужно разбирать в одиночку — разворачиваем вместе с вами.

Таймлайн развёртывания

  1. Установочный звонок

    День 0
    • Разбираемся в ваших требованиях
    • Оцениваем совместимость с инфраструктурой
    • Определяем критерии успеха
  2. Архитектурное ревью

    Дни 1–2
    • Фиксируем топологию развёртывания
    • Планируем точки интеграции
    • Security-ревью
  3. Развёртывание

    Дни 3–5
    • Установка с поддержкой
    • Помощь с конфигурацией
    • Первичная индексация репозиториев
  4. Валидация

    Дни 5–7
    • Функциональное тестирование
    • Тюнинг производительности
    • Приёмочное тестирование
  5. Запуск в прод

    День 7+
    • Онбординг команды
    • Постоянная поддержка
    • Регулярные созвоны

Уровни поддержки

  • Standard

    Время ответа
    24 часа
    Включено в
    Все self-hosted
  • Priority

    Время ответа
    4 часа
    Включено в
    Тариф Enterprise
  • Dedicated

    Время ответа
    1 час + Slack
    Включено в
    Enterprise+

Частые вопросы по self-hosted-развёртыванию

Готовы развернуть в своём периметре?

Внутри вашего VPC, на вашей LLM, с вашим внутренним Git-сервером.

  • Тот же движок, что и в облаке — тот же поиск, тот же MCP, те же агенты
  • Разворачивается через Docker Compose или Kubernetes / Helm
  • Подключите свою LLM — любую OpenAI-совместимую
  • NDA доступен; security overview document — по запросу