T

Micha 3c71a66c55 Document monitoring alerts, bundle cron and H/ pull live status

- AUDIT_2026-05-25_TODO: Borg-Stale, Cert-Expiry, Container-Down
  Alerts auf "erledigt" (Cron */5 textfile exporter live,
  Prometheus reload mit 14 Regeln); Gitea-Bundle-Cron auf "erledigt"
  (User-Script gitea-bundle-mirror-6h aktiv, Bundles 644);
  H:/ Nearline-Pull auf "erledigt (Pull live, Scheduled Task offen)"
  mit Zaehlerstaenden 19 Borg-Dumps + 10 Bundle-Files.

- MIGRATION_LOG: neuer Eintrag fasst die drei zusammenhaengenden
  Live-Aktivierungen zusammen, inkl. Befund-Ursprung (Permission-
  Drift), Reparaturen und expliziter Ausklammerung der nicht
  angefassten Themen (Auth, Hermes, USV, FRITZ!Box, Plex).

- H_DRIVE_NEARLINE_PULL: Erstlauf-Befund mit Permission-Issues
  und nachgezogenem Stand; Erwartungs-Liste auf real geliefertes
  Set angepasst; Flash-Config explizit Out-of-Scope.

- pull-critical-backups.ps1: Live-Robocopy-Output an Out-Null,
  damit der Markdown-Report nicht von Robocopy-Strings zerlegt
  wird (PowerShell-Pipeline-Quirk im foreach).

Co-Authored-By: Claude Opus 4.7 <noreply@anthropic.com>

2026-05-27 20:48:04 +02:00

apps

Consolidate dashboard on Glance

2026-05-25 14:44:46 +02:00

core/gitea

Fix Gitea external DNS for GitHub mirror

2026-05-25 11:17:31 +02:00

docs

Document monitoring alerts, bundle cron and H/ pull live status

2026-05-27 20:48:04 +02:00

env

Consolidate dashboard on Glance

2026-05-25 14:44:46 +02:00

host-services

Bind AdGuard admin to Tailscale

2026-05-26 14:55:49 +02:00

infra

Harden backup and posture checks

2026-05-16 13:04:22 +02:00

monitoring

Prepare monitoring alert rules

2026-05-27 06:38:57 +02:00

ops

Document monitoring alerts, bundle cron and H/ pull live status

2026-05-27 20:48:04 +02:00

security

Replace Uptime Kuma with monitoring checks

2026-05-25 16:37:46 +02:00

services/posture-check

Write Prometheus textfile and Gitea bundles world-readable

2026-05-27 20:41:07 +02:00

traefik

ops: wire monitoring stack to traefik metrics

2026-05-16 22:10:43 +02:00

.gitignore

Finalize homelab audit end state

2026-05-23 11:29:08 +02:00

CLAUDE.md

Close Gitea signup, dedup posture-check alerts, extend Borg scope

2026-05-23 11:05:35 +02:00

HOMELAB_ARCHITECTURE_MASTER_V2.md

Update audit follow-up documentation

2026-05-26 20:24:50 +02:00

Homelab_Audit_2026-05-05.pdf

hermes update

2026-05-06 19:13:52 +02:00

README.md

Remove legacy monitoring stacks

2026-05-26 15:27:37 +02:00

README.md

Homelab Infrastructure (KalliLab CORE)

Dieses Repository ist die zentrale Quelle ("Single Source of Truth") fuer die komplette Infrastruktur meines Homelabs.

WICHTIG - Einstieg

Vor jeder Aenderung lesen:

HOMELAB_ARCHITECTURE_MASTER_V2.md
docs/WORKFLOW.md

Bei Restore-, Host-Ausfall- oder Wiederanlauf-Fragen zusaetzlich:

docs/DISASTER_RECOVERY.md
docs/RESTORE_MATRIX.md
docs/SERVICES_RECOVERY.md

Bei Hardware-, Netzwerk-, Provider- oder Kapazitaetsfragen zusaetzlich:

docs/HARDWARE_INVENTORY.md
docs/NETWORK_INVENTORY.md
docs/EXTERNAL_DEPENDENCIES.md
docs/CAPACITY_AND_LIFECYCLE.md

Architektur

Host: Unraid
Container: Docker Compose
Reverse Proxy: Traefik v3 (Service-Routing via Docker-Labels, File-Provider nur fuer zentrale Dynamic-Config)
Zugriff: Tailscale (VPN)
DNS: AdGuard Home + Unbound
GitOps: Gitea + Komodo

Grundprinzipien

Gitea Online ist der operative Sollzustand.
Der lokale Clone ist die Arbeitskopie.
Komodo deployed automatisch aus Gitea und ist kein Bearbeitungsort.
Keine produktiven Container ausserhalb von Compose.
Traefik ist der einzige oeffentliche Einstiegspunkt.
Secrets werden niemals im Repository gespeichert.

Repository-Struktur

core/ -> Basisdienste (Gitea)
security/ -> sicherheitskritische Dienste
infra/ -> Datenbanken und technische Services
apps/ -> Anwendungen
ops/ -> operative Tools
monitoring/ -> zentraler Observability-Stack
host-services/ -> Dienste mit Host-Netz
traefik/ -> Reverse Proxy Konfiguration
docs/ -> Dokumentation und Prozesse
env/ -> Beispiel-Umgebungsvariablen

Kurz-Workflow

In GitHub Desktop Fetch origin.
Wenn noetig Pull origin.
Lokal aendern.
Commit erstellen.
Push origin.
Komodo-Webhook und Ergebnis pruefen.
Doku bei Bedarf aktualisieren.

Status

Komodo ist der primaere und einzige produktive Stack-Manager.
Komodo bleibt bewusst bei nativer Authentifizierung; zentrale Traefik-Auth wird dort nicht pauschal vorgeschaltet.
Portainer CE ist abgeschaltet und kein Teil des aktiven Betriebs mehr.
Glance ist das aktive produktive Homelab-Dashboard.
Traefik dynamic/ bleibt eine dokumentierte manuelle Host-Sync-Ausnahme ausserhalb des normalen Komodo-Deployments.
Mutable Image-Tags sind auf die aktuell laufenden Digests eingefroren; echte Versions-Upgrades erfolgen bewusst separat.
Disaster-Recovery und dienstspezifische Restore-Quellen sind in docs/DISASTER_RECOVERY.md und docs/RESTORE_MATRIX.md beschrieben.
Recovery-kritische Services-Pfade wie Gitea-Repositories, Komodo-Workspaces und Host-Automation sind in docs/SERVICES_RECOVERY.md beschrieben.
Hardware-, Netzwerk-, Provider- und Capacity-Inventare sind als operative Audit-Dokumente unter docs/HARDWARE_INVENTORY.md, docs/NETWORK_INVENTORY.md, docs/EXTERNAL_DEPENDENCIES.md und docs/CAPACITY_AND_LIFECYCLE.md vorbereitet.
Der verbindliche Detailablauf steht in docs/WORKFLOW.md.
nextcloud, bentopdf und monitoring folgen dem dokumentierten Netz-/Secret-/Traefik-Modell; der zentrale Monitoring-Stack buendelt Prometheus, Loki, Promtail, Grafana und InfluxDB 3 Core.

Languages

Shell 68%

PowerShell 25.7%

Python 5.6%

JavaScript 0.4%

Dockerfile 0.3%