48 Elasticity and Scaling

48.1 Einführung

Elasticity und Scaling sind wesentliche Konzepte in Kubernetes, die es ermöglichen, Anwendungen dynamisch an die Arbeitslasten anzupassen. Kubernetes bietet verschiedene Mechanismen zur automatischen Skalierung von Anwendungen und Ressourcen, um sicherzustellen, dass sie effizient und zuverlässig arbeiten. In diesem Kapitel werden wir die Grundlagen der Skalierung in Kubernetes, die verschiedenen Arten der Skalierung und deren Implementierung behandeln.

48.2 Arten der Skalierung

In Kubernetes gibt es drei Hauptarten der Skalierung:

Horizontal Pod Autoscaling (HPA): Automatisches Hinzufügen oder Entfernen von Pods basierend auf Metriken wie CPU-Auslastung oder benutzerdefinierten Metriken.
Vertical Pod Autoscaling (VPA): Automatische Anpassung der Ressourcenanforderungen (CPU und Speicher) eines Pods basierend auf der tatsächlichen Nutzung.
Cluster Autoscaling: Automatisches Hinzufügen oder Entfernen von Nodes in einem Cluster basierend auf der Ressourcenauslastung und den Anforderungen der laufenden Pods.

48.3 Horizontal Pod Autoscaling (HPA)

HPA passt die Anzahl der Pods in einem Deployment, ReplicaSet oder StatefulSet basierend auf der Ressourcenauslastung an. Der HPA-Controller überwacht kontinuierlich die Metriken und skaliert die Pods entsprechend.

Beispiel einer HPA-Konfiguration:

apiVersion: autoscaling/v2beta2
kind: HorizontalPodAutoscaler
metadata:
  name: nginx-hpa
  namespace: default
spec:
  scaleTargetRef:
    apiVersion: apps/v1
    kind: Deployment
    name: nginx-deployment
  minReplicas: 1
  maxReplicas: 10
  metrics:
  - type: Resource
    resource:
      name: cpu
      target:
        type: Utilization
        averageUtilization: 50

Erstellen und Überprüfen des HPA:

kubectl apply -f hpa.yaml
kubectl get hpa nginx-hpa -n default

48.4 Vertical Pod Autoscaling (VPA)

VPA passt die Ressourcenanforderungen (CPU und Speicher) eines Pods basierend auf der tatsächlichen Nutzung an. Es besteht aus drei Komponenten: Recommender, Updater und Admission Controller.

Beispiel einer VPA-Konfiguration:

apiVersion: autoscaling.k8s.io/v1
kind: VerticalPodAutoscaler
metadata:
  name: nginx-vpa
  namespace: default
spec:
  targetRef:
    apiVersion: apps/v1
    kind: Deployment
    name: nginx-deployment
  updatePolicy:
    updateMode: "Auto"

Erstellen und Überprüfen des VPA:

kubectl apply -f vpa.yaml
kubectl get vpa nginx-vpa -n default

48.5 Cluster Autoscaling

Der Cluster Autoscaler fügt automatisch Nodes hinzu oder entfernt sie aus dem Cluster, basierend auf den Ressourcenauslastungen und den Anforderungen der Pods. Dies ist besonders nützlich in Cloud-Umgebungen, in denen Ressourcen dynamisch bereitgestellt werden können.

Beispiel einer Cluster Autoscaler Konfiguration für GKE:

apiVersion: autoscaling/v1
kind: ClusterAutoscaler
metadata:
  name: cluster-autoscaler
  namespace: kube-system
spec:
  scaleTargetRef:
    apiVersion: v1
    kind: NodeGroup
    name: default-pool
  minReplicas: 1
  maxReplicas: 10

Aktivieren des Cluster Autoscalers:

Für GKE:

gcloud container clusters update my-cluster --enable-autoscaling --min-nodes=1 --max-nodes=10 --zone=us-central1-a

48.6 Monitoring und Metriken

Effektive Skalierung erfordert eine kontinuierliche Überwachung der Ressourcen und Anwendungen. Kubernetes unterstützt verschiedene Metrik-Sammler und Überwachungswerkzeuge wie Prometheus, Metrics Server und Grafana.

Metrics Server installieren:

kubectl apply -f https://github.com/kubernetes-sigs/metrics-server/releases/latest/download/components.yaml

Überwachen der Metriken:

kubectl top nodes
kubectl top pods -n default

48.7 Best Practices

Metriken richtig konfigurieren: Stellen Sie sicher, dass die Metriken, die zur Skalierung verwendet werden, korrekt und repräsentativ für die Arbeitslasten sind.
Ressourcenlimits setzen: Definieren Sie angemessene Ressourcenlimits und -anforderungen für Pods, um eine Über- oder Unterprovisionierung zu vermeiden.
Tests und Validierung: Testen Sie die Skalierungsrichtlinien in einer Staging-Umgebung, um ihre Wirksamkeit zu validieren.
Überwachung und Anpassung: Überwachen Sie kontinuierlich die Skalierungsentscheidungen und passen Sie die Richtlinien an, um eine optimale Leistung zu gewährleisten.

Elasticity und Scaling sind entscheidend für die Effizienz und Zuverlässigkeit von Anwendungen in Kubernetes. Durch die Implementierung von HPA, VPA und Cluster Autoscaling können Administratoren sicherstellen, dass ihre Anwendungen dynamisch auf sich ändernde Arbeitslasten reagieren und dabei optimale Ressourcennutzung und Leistung gewährleisten. Ein umfassendes Verständnis dieser Konzepte und deren korrekte Anwendung ist entscheidend für den erfolgreichen Betrieb von Kubernetes-Clustern.

48.8 Cluster Control Plane Options

48.8.1 Einführung

Die Control Plane in Kubernetes ist das Herzstück des Clusters und verwaltet die grundlegenden Steuerungsfunktionen, einschließlich der API-Schnittstellen, des Schedulers und der Controller-Manager. Verschiedene Optionen für die Konfiguration und Bereitstellung der Control Plane bieten unterschiedliche Vor- und Nachteile hinsichtlich Verfügbarkeit, Skalierbarkeit und Wartung. In diesem Kapitel werden die verschiedenen Optionen zur Bereitstellung der Control Plane behandelt.

48.8.2 Control Plane Komponenten

Die Kubernetes Control Plane besteht aus mehreren kritischen Komponenten:

API-Server: Das zentrale Management-Interface, das API-Anfragen verarbeitet und als Gateway zu etcd fungiert.
etcd: Die verteilte, konsistente Key-Value-Datenbank, die den Cluster-Zustand speichert.
Scheduler: Entscheidet, auf welchem Node neue Pods platziert werden.
Controller-Manager: Führt die Controller-Schleifen aus, die für die Aufrechterhaltung des gewünschten Zustands der Cluster-Ressourcen verantwortlich sind.

48.8.3 Optionen zur Bereitstellung der Control Plane

48.8.3.1 1. Single-Master Setup

Ein Single-Master Setup besteht aus einer einzigen Instanz der Control Plane-Komponenten. Dies ist die einfachste und kostengünstigste Konfiguration, aber sie bietet keine Hochverfügbarkeit und ist anfällig für Ausfälle.

Vorteile: - Einfache Implementierung und Wartung. - Geringere Kosten und Ressourcenbedarf.

Nachteile: - Kein Schutz vor Ausfällen. - Keine Hochverfügbarkeit.

Anwendungsbeispiel: - Kleine Testumgebungen oder Entwicklungsumgebungen.

48.8.3.2 2. Multi-Master Setup

Ein Multi-Master Setup verwendet mehrere Master-Nodes, die die Control Plane-Komponenten replizieren. Dies bietet Hochverfügbarkeit und Fehlertoleranz, da der Ausfall eines Masters durch die anderen ausgeglichen wird.

Vorteile: - Hohe Verfügbarkeit und Fehlertoleranz. - Verbesserte Skalierbarkeit.

Nachteile: - Komplexere Implementierung und Wartung. - Höherer Ressourcenbedarf und Kosten.

Anwendungsbeispiel: - Produktionsumgebungen, die hohe Verfügbarkeit erfordern.

Beispiel einer Multi-Master Konfiguration:

[ Load Balancer ]
      /       \
[ Master 1 ] [ Master 2 ] [ Master 3 ]
     |          |          |
[ etcd 1 ]   [ etcd 2 ]  [ etcd 3 ]
     |          |          |
[ Worker Nodes ]

48.8.3.3 3. Hosted Control Plane

Ein gehostetes Control Plane Setup wird von Cloud-Anbietern wie Google Kubernetes Engine (GKE), Amazon Elastic Kubernetes Service (EKS) und Azure Kubernetes Service (AKS) angeboten. Dabei verwaltet der Cloud-Anbieter die Control Plane, während der Benutzer nur für die Worker Nodes verantwortlich ist.

Vorteile: - Reduzierte Betriebs- und Wartungskosten. - Hohe Verfügbarkeit und automatische Upgrades. - Schnelle Bereitstellung.

Nachteile: - Abhängigkeit vom Cloud-Anbieter. - Eingeschränkte Kontrolle über die Control Plane-Konfiguration.

Anwendungsbeispiel: - Unternehmen, die Kubernetes in der Cloud betreiben möchten und die Verwaltung der Control Plane auslagern wollen.

48.8.3.4 4. Self-Hosted Control Plane

Eine selbst gehostete Control Plane wird innerhalb des Clusters als reguläre Kubernetes-Pods ausgeführt. Dies ermöglicht eine flexible Verwaltung und Skalierbarkeit der Control Plane-Komponenten.

Vorteile: - Flexibilität bei der Verwaltung und Skalierung. - Nutzung von Kubernetes-Mechanismen zur Verwaltung der Control Plane.

Nachteile: - Komplexere Implementierung und potenzielle Selbstabhängigkeiten. - Höhere Anforderungen an das Cluster-Design.

Anwendungsbeispiel: - Fortgeschrittene Kubernetes-Nutzer, die eine hohe Flexibilität und Kontrolle über ihre Control Plane wünschen.

48.8.4 Vergleich der Optionen

Option	Hochverfügbarkeit	Wartungsaufwand	Kosten	Komplexität
Single-Master Setup	Nein	Gering	Niedrig	Niedrig
Multi-Master Setup	Ja	Hoch	Hoch	Hoch
Hosted Control Plane	Ja	Gering	Mittel	Niedrig
Self-Hosted Control Plane	Ja	Mittel	Mittel	Mittel

Die Wahl der richtigen Control Plane-Option hängt von den spezifischen Anforderungen Ihrer Umgebung ab. Ein Single-Master Setup eignet sich für Test- und Entwicklungsumgebungen, während ein Multi-Master Setup für Produktionsumgebungen mit hohen Verfügbarkeitsanforderungen geeignet ist. Gehostete Control Plane-Lösungen bieten eine einfache und skalierbare Option für Cloud-basierte Deployments, während selbst gehostete Control Planes Flexibilität und Kontrolle für fortgeschrittene Benutzer bieten. Ein umfassendes Verständnis der Vor- und Nachteile jeder Option ist entscheidend, um die beste Lösung für Ihre Bedürfnisse zu wählen.