monitoring + backup: Stale-Handle-Hardening und Dead-Man's-Switch
Schliesst den lokalen Code-Stand fuer zwei offene MASTER_TODO-Punkte ab. monitoring: restliche Einzeldatei-Bind-Mounts (alertmanager, blackbox, loki, promtail, alertmanager-ntfy-bridge) auf Directory-Mounts umgestellt, analog zum Prometheus-Fix vom 2026-06-19. Vermeidet "Stale NFS file handle" auf dem /mnt/user-FUSE-Share bei git/Komodo-Updates. grafana-provisioning war bereits Directory-Mount. `docker compose config` gruen. Beim Deploy --force-recreate noetig, da sich Mount-Zielpfade aendern. backup: endpoint-agnostischer Dead-Man's-Switch (Healthchecks-kompatibel, Cloud oder self-hosted) in pull-critical-backups.ps1 und pre-borg.sh. Pings /start, Erfolg und /fail; No-Op ohne konfigurierte URL, bricht also keinen Lauf. Ping-URLs sind Capability-URLs und bleiben als Secret ausserhalb des Repos. Doku: SECRETS_MAP, Nearline-README und MASTER_TODO nachgezogen. Co-Authored-By: Claude Opus 4.8 <noreply@anthropic.com>
This commit is contained in:
@@ -22,12 +22,31 @@ case "${DUMP_ROOT:-}" in
|
||||
;;
|
||||
esac
|
||||
|
||||
# Externer Dead-Man's-Switch (endpoint-agnostisch: Healthchecks.io-Cloud oder
|
||||
# self-hosted). ntfy meldet nur Fehler eines tatsaechlich gestarteten Laufs;
|
||||
# der externe Switch faengt zusaetzlich den Fall ab, dass der Pre-Hook gar nicht
|
||||
# laeuft. Die Ping-URL ist eine Capability-URL -> wie ein Secret behandeln,
|
||||
# niemals ins Repo. Ist keine URL gesetzt, ist der Switch ein No-Op.
|
||||
HEALTHCHECKS_URL="${HEALTHCHECKS_URL:-${HEALTHCHECKS_BORG_URL:-}}"
|
||||
HEALTHCHECKS_URL_FILE="${HEALTHCHECKS_URL_FILE:-/mnt/user/appdata/secrets/healthchecks_borg_url}"
|
||||
if [ -z "$HEALTHCHECKS_URL" ] && [ -r "$HEALTHCHECKS_URL_FILE" ]; then
|
||||
HEALTHCHECKS_URL="$(tr -d '[:space:]' < "$HEALTHCHECKS_URL_FILE")"
|
||||
fi
|
||||
|
||||
hc_ping() {
|
||||
# $1: optionaler Suffix ("/start" | "/fail"); leer = Erfolg
|
||||
[ -n "$HEALTHCHECKS_URL" ] || return 0
|
||||
command -v curl >/dev/null 2>&1 || return 0
|
||||
curl -fsS -m 10 --retry 3 "${HEALTHCHECKS_URL}${1:-}" >/dev/null 2>&1 || true
|
||||
}
|
||||
|
||||
notify_failure() {
|
||||
local step="$1"
|
||||
local message="$2"
|
||||
if [ -x "$NTFY_SCRIPT" ]; then
|
||||
"$NTFY_SCRIPT" "$NTFY_TOPIC" "Borg pre-hook failed: $step" "$message" high || true
|
||||
fi
|
||||
hc_ping "/fail"
|
||||
}
|
||||
|
||||
run_step() {
|
||||
@@ -44,6 +63,8 @@ run_step() {
|
||||
fi
|
||||
}
|
||||
|
||||
hc_ping "/start"
|
||||
|
||||
echo "[pre-borg] Running posture-check"
|
||||
if "$POSTURE_CHECK"; then
|
||||
echo "[pre-borg] OK: posture-check"
|
||||
@@ -60,3 +81,4 @@ run_step "pre-backup-dumps" "$PRE_BACKUP_DUMPS"
|
||||
run_step "restore-freshness" env DUMP_ROOT="$FRESHNESS_DUMP_ROOT" "$FRESHNESS_CHECK"
|
||||
|
||||
echo "[pre-borg] All pre-flight checks passed"
|
||||
hc_ping
|
||||
|
||||
Reference in New Issue
Block a user