Поднимется ли база из последней копии
Сам факт успешного backup-job не доказывает, что восстановление завершится без ошибок.
Recovery Proof • Доказуемое восстановление PostgreSQL
Recovery Proof автоматически выполняет тестовое восстановление PostgreSQL из реальных backup'ов, проверяет восстановление до нужной точки во времени, запускает SQL-checks и показывает фактический RTO/RPO. Вы заранее видите, где процесс сломается и что нужно исправить.
Проблема
У большинства команд backup-job'ы зеленые. Но в момент инцидента всплывают вопросы, на которые мониторинг backup'ов не отвечает.
Сам факт успешного backup-job не доказывает, что восстановление завершится без ошибок.
Пробелы в цепочке WAL обычно обнаруживаются в самый неудачный момент.
RTO на словах и measured RTO на конкретном сценарии часто сильно расходятся.
База может стартовать, но приложение все равно не переживет инцидент.
Пока вы не делали реальное тестовое восстановление, готовность к инциденту остается предположением.
Решение
Recovery Proof по кнопке или по расписанию исполняет полный сценарий test restore и показывает, что произойдет в реальном инциденте.
Поднимаем отдельное окружение восстановления без вмешательства в production.
Проверяем либо последнюю точку восстановления, либо конкретный target timestamp.
Проверяем не только старт PostgreSQL, но и то, что важные инварианты действительно соблюдаются.
Измеряем, сколько времени занял конкретный сценарий, а не опираемся на ожидания команды.
Показываем потенциальную потерю данных по сценарию и качество доступной WAL-цепочки.
Отправляем итог в Slack или на email: прошло / не прошло, где проблема и что чинить.
Вместо "кажется, все должно сработать" вы получаете факт: прошло или не прошло, сколько заняло и в каком месте сценарий ломается.
Как это работает
Стартуем с самого важного сценария, где сбой действительно дорогой для бизнеса.
Runner получает доступ только к backup storage и restore-среде. Запись в production не нужна.
Можно вручную или по расписанию. Временная restore-среда поднимается автоматически.
Видите pass / fail, measured RTO, результат PITR, SQL-checks и место фактического сбоя.
Что получает клиент
Видно реальное время восстановления по конкретному сценарию и конкретному стеку.
Не только backup завершился, но и восстановление дошло до нужной точки во времени.
Не просто fail, а конкретное узкое место: WAL gap, restore bottleneck или SQL-check failure.
Меньше ручных стендов, ад-хок проверки и импровизации в момент аварии.
Покажете результат CTO, Platform-команде, ИБ, аудиту или руководителю без перевода логов.
Видно динамику по сценариям и можно быстро понять, что изменилось после очередной правки стека.
Пример отчета
Это не просто технический лог. Это доказательство того, что восстановление либо работает, либо нет.
Итог сценария
Что видно сразу
Проверки после восстановления
Если сценарий не прошел
Кому подходит
Если стек не совсем стандартный, оставьте заявку на проверку совместимости. Быстро скажем, подходит ли сценарий под пилот.
Пилот за 14 дней
Мы не предлагаем длинный проект. Начинаем с одного критичного кластера и одного понятного вопроса про восстановление.
Первый результат обычно появляется через 2–3 дня после старта.
Безопасность и внедрение
Runner работает в вашем контуре и не требует доступа на запись в production. Мы не меняем текущую backup-схему и не вмешиваемся в рабочую среду.
Контроль доступа, сеть и restore-среда остаются на вашей стороне.
Продукту не нужен write-access в рабочую БД, чтобы исполнять restore drill.
Проверяем реальную восстановляемость на вашем текущем backup-процессе.
Почему сейчас
Самая дорогая ошибка — это не "backup не сработал". Самая дорогая ошибка — это когда кажется, что backup есть и все в порядке, а во время сбоя выясняется обратное.
Восстановление до нужной точки оказывается невозможным уже в момент инцидента.
Команда не выдерживает заявленный RTO, хотя формально backup-система была "зелёной".
База стартует, но целостность данных или ключевая бизнес-логика не проходят SQL-checks.
Команда репетирует восстановление уже под давлением, а не в контролируемых условиях.
FAQ
Мониторинг показывает, что backup завершился. Recovery Proof показывает, что восстановление реально работает.
pgBackRest делает backup и restore. Мы регулярно исполняем полный сценарий test restore, проверяем результат и измеряем фактическое время.
Нет. Runner не требует доступа на запись в production.
Это и есть ценность продукта. Вы увидите проблему до инцидента и получите понятный список того, что нужно исправить.
Пилотный сценарий обычно можно запустить за несколько дней.
Оставьте заявку на проверку совместимости. Мы быстро скажем, подходит ли ваш стек под пилот.
За короткий созвон поймем, подходит ли вам пилот. Если подходит — запустим первый сценарий и покажем реальный результат на вашей инфраструктуре.
Три CTA для проверки гипотезы спроса: пилот, пример отчета и совместимость стека.