Kernkonzepte

Lakebase basiert auf einer Reihe von Features, mit denen Sie Ihre Datenbankanwendungen effizient entwickeln, testen und skalieren können. In diesem Abschnitt werden die Kernkonzepte vorgestellt, die Lakebase von herkömmlichen Datenbanksystemen unterscheiden.

Projekte

Ein Lakebase-Projekt ist der Container der obersten Ebene für alle Datenbankressourcen. Jedes Projekt gehört zu einem Azure Databricks Arbeitsbereich und enthält eine oder mehrere Verzweigungen, die jeweils über eigene Compute- und Datenbanken verfügen.

Project
└── Branch (e.g., production)
    ├── Compute (read-write)
    └── Database (e.g., databricks_postgres)

Weitere Informationen: Projekte | verwalten

Automatische Skalierung

Lakebase passt die Berechnungsressourcen basierend auf Ihren Workloadanforderungen automatisch an. Wenn der Datenverkehr Ihrer Anwendung zunimmt oder verringert wird, skalieren Sie Ressourcen innerhalb Ihres konfigurierten Bereichs nach oben oder unten, ohne manuelle Eingriffe oder Ausfallzeiten.

Wichtige Vorteile:

  • Automatische Anpassung: Ressourcenskalierung basierend auf der tatsächlichen Nachfrage.
  • Keine Ausfallzeiten: Die Skalierung innerhalb des konfigurierten Bereichs erfolgt ohne Unterbrechung von Verbindungen. Das Ändern der minimalen oder maximalen CU-Konfiguration kann jedoch zu einer kurzen Unterbrechung führen.
  • Kostenoptimierung: Zahlen Sie nur für die Ressourcen, die Sie tatsächlich verwenden.
  • Leistungskonsistenz: Halten Sie die reaktionsfähige Leistung bei Datenverkehrsspitzen aufrecht.

Weitere Informationen: Automatisches Skalieren | Konfigurieren der automatischen Skalierung

Zu Null skalieren

Wenn Ihre Datenbank im Leerlauf ist, kann Lakebase Automatisch Computeressourcen auf Null skalieren, wodurch Kosten für nicht verwendete Kapazität eliminiert werden. Wenn die Aktivität fortgesetzt wird, wird Ihre Rechenleistung automatisch in Sekunden wieder hochskaliert.

Wichtige Vorteile:

  • Null Leerlaufkosten: Keine Berechnungsgebühren, wenn Ihre Datenbank inaktiv ist.
  • Sofortige Wiederaufnahme: Datenbanken wachen automatisch auf, wenn auf sie zugegriffen wird.
  • Entwicklungsfreundlich: Ideal für Entwicklungs- und Stagingumgebungen mit zeitweiliger Nutzung.
  • Automatische Verwaltung: Kein manueller Eingriff erforderlich.

Weitere Informationen: Skalierung auf Null | Skalierung auf Null konfigurieren

Datenbankzweige

Datenbankzweige in Lakebase funktionieren ähnlich wie Git Branches für Ihren Code. Sie können sofortige, isolierte Verzweigungen für Entwicklung, Tests oder Experimente erstellen, ohne Daten zu duplizieren oder ihre Produktionsumgebung zu beeinträchtigen.

Wichtige Vorteile:

  • Sofortige Erstellung: Mithilfe der Copy-on-Write-Technologie werden Verzweigungen innerhalb von Sekunden erstellt.
  • Kosteneffizient: Nur geänderte Daten werden separat gespeichert, wodurch die Speicherkosten minimiert werden.
  • Isolierte Umgebungen: Testen Sie Änderungen sicher, ohne dass sich dies auf Ihre primäre Datenbank auswirkt.
  • Zusammenarbeit: Teammitglieder können gleichzeitig an separaten Zweigstellen arbeiten.

Weitere Informationen: Datenbankzweige | Zweige verwalten

Berechnungen und Endgeräte

Ein Lakebase-Endpunkt ist der stabile Verbindungspunkt, den Ihre Anwendung verwendet, um eine Datenbank zu erreichen. Hinter jedem Endpunkt behandeln eine oder mehrere Computeinstanzen die Abfrageverarbeitung. Ihre Verbindungszeichenfolge bleibt gleich, auch wenn Sie Computeressourcen skalieren oder eine hohe Verfügbarkeit hinzufügen.

Ein Branch verfügt in der Regel über einen Lese-/Schreibendpunkt (Ihre primäre Compute-Instanz) und optional über einen oder mehrere schreibgeschützte Endpunkte (Lesereplikate).

Weitere Informationen: Compute-Instanzen und Endpunkte | Compute-Instanzen verwalten

Speicherarchitektur

Lakebase speichert Daten in einer verteilten Speicherebene, die von der Berechnung getrennt ist. Der Speicher ist zonenredundant und bleibt unabhängig vom Status der Rechenressourcen erhalten, unabhängig davon, ob die Rechenressourcen ausgeführt werden, angehalten sind oder ein Failover durchgeführt wird. Diese Speichertrennung ermöglicht sofortige Branches, Lesereplikate und Scale-to-Zero, ohne Daten zu duplizieren.

Wichtige Vorteile:

  • Hoch verfügbarer Speicher: Azure Databricks verwaltet unabhängig von Ihrer HA-Berechnungseinstellung hoch verfügbare Speicher.
  • Bleibt bei Änderungen an den Rechenressourcen erhalten: Der Speicher bleibt bei Ausfällen, Pausen oder Konfigurationsänderungen der Rechenressourcen verfügbar.
  • Grundlage für Verzweigungen und Replikate: Die Instant Branch-Erstellung und das Lesen von Replikaten basieren beide auf mehreren Computeinstanzen, die dieselbe Speicherebene nutzen.

Weitere Informationen: Speicherarchitektur

Hohe Verfügbarkeit

Hochverfügbarkeit kombiniert eine primäre Lese-/Schreib-Compute-Instanz mit einer oder mehreren sekundären Berechnungseinheiten, die über Verfügbarkeitszonen verteilt sind. Wenn die primäre Instanz nicht mehr verfügbar ist, stuft Lakebase automatisch eine sekundäre Instanz zur primären hoch, und Ihre Anwendung wird ab der letzten festgeschriebenen Transaktion fortgesetzt. Ihre Verbindungszeichenfolge bleibt durchgehend unverändert. Der Speicher ist bereits hochverfügbar. Das Aktivieren von HA fügt Redundanz auf Compute-Ebene für ein automatisches Failover hinzu.

Wichtige Vorteile:

  • Automatisches Failover: Lakebase fördert eine sekundäre Computeinstanz ohne manuelle Eingriffe.
  • Kein Datenverlust: Failover behält alle zugesicherten Transaktionen bei.
  • Stabile Verbindungszeichenfolgen: Ihre Anwendung muss ihre Verbindungskonfiguration nach einem Failover nicht mehr ändern.

Weitere Informationen: Hochverfügbarkeit | Hochverfügbarkeit verwalten

Lesereplikate

Lesereplikate sind unabhängige schreibgeschützte Instanzen, die Lesevorgänge an denselben Daten wie Ihre primäre Lese-/Schreibinstanz ausführen. Im Gegensatz zu herkömmlichen Replikaten dupliziert Lakebase-Lesereplikate keine Daten – sie lesen von derselben Speicherebene, wodurch die sofortige Erstellung ermöglicht und zusätzliche Speicherkosten vermieden werden.

Wichtige Vorteile:

  • Horizontale Skalierung: Verteilen von Leseanforderungen über mehrere Replikate hinweg.
  • Keine Datenduplizierung: Alle Replikate werden aus demselben Speicher gelesen.
  • Sofortige Erstellung: In Sekunden ohne Datenkopie verfügbar.
  • Kosteneffizient: Keine zusätzlichen Speicherkosten sowie automatische Skalierung und Skalierungs-zu-Null-Unterstützung.

Weitere Informationen: Lesen von Replikaten | Verwalten von Lesereplikaten

Wie sie zusammenarbeiten

Diese Kernkonzepte arbeiten zusammen, um eine leistungsstarke und flexible Datenbankplattform zu schaffen:

  1. Projekte organisieren alle Datenbankressourcen und gehören zu einem Azure Databricks Arbeitsbereich.
  2. Automatische Skalierung stellt sicher, dass jeder Branch je nach Bedarf über die richtige Rechenkapazität verfügt.
  3. Scale-to-zero senkt die Kosten für inaktive Branches, indem Rechenressourcen bei Nichtnutzung angehalten werden.
  4. Mit Datenbankzweigen können Sie isolierte Umgebungen für Entwicklung und Tests erstellen, ohne Daten zu duplizieren.
  5. Rechenressourcen und Endpunkte stellen stabile Verbindungspunkte bereit, während Sie Ihre Infrastruktur skalieren oder umkonfigurieren.
  6. Die Speicherarchitektur sorgt dafür, dass Ihre Datenzone redundant und hoch verfügbar ist, unabhängig vom Berechnungszustand.
  7. Hohe Verfügbarkeit fügt Redundanz auf Computeebene und automatisches Failover über Verfügbarkeitszonen für Produktionsworkloads hinweg hinzu.
  8. Lesereplikate verteilen Lesedatenverkehr über zusätzliche Computeinstanzen.

Mit dieser Architektur können Sie Datenbankanwendungen mit größerer Flexibilität, geringeren Kosten und geringerem Betriebsaufwand erstellen und skalieren als herkömmliche Datenbanksysteme.