Micha cd650b19ac Close Gitea signup, dedup posture-check alerts, extend Borg scope
Operational hardening across several services after live incident
analysis between 2026-05-18 and 2026-05-20:

- Gitea: disable public registration and OpenID signup/signin to
  stop the external POST / 5xx bursts that triggered availability
  alerts. New repo-wide policy requires every productive
  Micha/homelab-infra Komodo stack to ship with an active
  Gitea->Komodo webhook on the current stack ID (documented in
  CLAUDE.md, AI_CONTEXT.md, WORKFLOW.md).
- posture-check: extract the Disk1 fstype check into its own
  function so the documented Disk1 NTFS exception no longer raises
  ntfy warnings, skip POSIX inode checks on NTFS, and dedup ntfy
  alerts via a fingerprint state file with ALERT_REPEAT_SECONDS
  (default 24h). Repeat-spam on the same cause now suppressed.
- docker-critical-events: parse the event JSON for container name,
  action, exit code and signal; drop `die exit=0` events (clean
  stops); ship a structured ntfy message instead of the raw event
  line.
- Borg UI: mount /mnt/user/services into the backup container as
  /local/services:ro and include homelab-infra, stacks and
  posture-check in all-important-sources.txt. RESTORE_MATRIX and
  DISASTER_RECOVERY updated accordingly.
- Unraid user scripts: document the new
  homelab-operations-report-daily cron job and the SMTP password
  file it expects on the host.
- MIGRATION_LOG: capture the four live events from this window -
  Gitea 5xx burst + signup closure, Komodo webhook reconciliation,
  posture-check host-version verification, Borg scope extension,
  and Traefik 5xx alert detuning.

Co-Authored-By: Claude Opus 4.7 <noreply@anthropic.com>
2026-05-23 11:05:35 +02:00
2026-05-18 20:29:18 +02:00
2026-05-17 16:51:43 +02:00
2026-05-18 13:09:27 +02:00
2026-05-16 13:04:22 +02:00
2026-05-18 13:09:32 +02:00
2026-05-06 19:13:52 +02:00
2026-05-17 10:41:29 +02:00

Homelab Infrastructure (KalliLab CORE)

Dieses Repository ist die zentrale Quelle ("Single Source of Truth") fuer die komplette Infrastruktur meines Homelabs.

WICHTIG - Einstieg

Vor jeder Aenderung lesen:

  1. HOMELAB_ARCHITECTURE_MASTER_V2.md
  2. docs/WORKFLOW.md

Bei Restore-, Host-Ausfall- oder Wiederanlauf-Fragen zusaetzlich:

  1. docs/DISASTER_RECOVERY.md
  2. docs/RESTORE_MATRIX.md

Architektur

  • Host: Unraid
  • Container: Docker Compose
  • Reverse Proxy: Traefik v3 (Service-Routing via Docker-Labels, File-Provider nur fuer zentrale Dynamic-Config)
  • Zugriff: Tailscale (VPN)
  • DNS: AdGuard Home + Unbound
  • GitOps: Gitea + Komodo

Grundprinzipien

  • Gitea Online ist der operative Sollzustand.
  • Der lokale Clone ist die Arbeitskopie.
  • Komodo deployed automatisch aus Gitea und ist kein Bearbeitungsort.
  • Keine produktiven Container ausserhalb von Compose.
  • Traefik ist der einzige oeffentliche Einstiegspunkt.
  • Secrets werden niemals im Repository gespeichert.

Repository-Struktur

  • core/ -> Basisdienste (Gitea)
  • security/ -> sicherheitskritische Dienste
  • infra/ -> Datenbanken und technische Services
  • apps/ -> Anwendungen
  • ops/ -> Monitoring und Tools
  • host-services/ -> Dienste mit Host-Netz
  • traefik/ -> Reverse Proxy Konfiguration
  • docs/ -> Dokumentation und Prozesse
  • env/ -> Beispiel-Umgebungsvariablen

Kurz-Workflow

  1. In GitHub Desktop Fetch origin.
  2. Wenn noetig Pull origin.
  3. Lokal aendern.
  4. Commit erstellen.
  5. Push origin.
  6. Komodo-Webhook und Ergebnis pruefen.
  7. Doku bei Bedarf aktualisieren.

Status

  • Komodo ist der primaere und einzige produktive Stack-Manager.
  • Komodo bleibt bewusst bei nativer Authentifizierung; zentrale Traefik-Auth wird dort nicht pauschal vorgeschaltet.
  • Portainer CE ist abgeschaltet und kein Teil des aktiven Betriebs mehr.
  • Homepage ist das aktive produktive Frontend / Start-Dashboard.
  • Traefik dynamic/ bleibt eine dokumentierte manuelle Host-Sync-Ausnahme ausserhalb des normalen Komodo-Deployments.
  • Mutable Image-Tags sind auf die aktuell laufenden Digests eingefroren; echte Versions-Upgrades erfolgen bewusst separat.
  • Disaster-Recovery und dienstspezifische Restore-Quellen sind in docs/DISASTER_RECOVERY.md und docs/RESTORE_MATRIX.md beschrieben.
  • Der verbindliche Detailablauf steht in docs/WORKFLOW.md.
  • nextcloud, bentopdf und monitoring folgen dem dokumentierten Netz-/Secret-/Traefik-Modell; der zentrale Monitoring-Stack buendelt Prometheus, Loki, Promtail, Grafana und InfluxDB 3 Core.
S
Description
Meine NAS-Architektur
Readme 6.1 MiB
Languages
Shell 68%
PowerShell 25.7%
Python 5.6%
JavaScript 0.4%
Dockerfile 0.3%