Verarbeiten von Daten mit Datenflussdiagrammen

Ein Datenflussdiagramm ist eine komponierbare Verarbeitungspipeline, die Daten transformiert, während sie zwischen Quellen und Zielen fließt. Ein Standarddatenfluss folgt einer festen Anreicherung, Filter- und Kartensequenz. Mit einem Datenflussdiagramm können Sie Transformationen in beliebiger Reihenfolge verketten, in parallele Pfade verzweigen und Daten über Zeitfenster aggregieren.

In diesem Artikel wird schrittweise das Erstellen eines Datenflussdiagramms erläutert. Eine Übersicht über Datenflussdiagramme und die verfügbaren Transformationen finden Sie unter Übersicht über Datenflussdiagramme.

Von Bedeutung

Datenflussdiagramme unterstützen derzeit nur MQTT-, Kafka- und OpenTelemetry-Endpunkte. Andere Endpunkttypen wie Data Lake, Microsoft Fabric OneLake, Azure Data Explorer und lokaler Speicher werden nicht unterstützt. Weitere Informationen finden Sie unter Bekannte Probleme.

Voraussetzungen

  • Eine Instanz von Azure IoT Einsatz, die in einem Kubernetes-Cluster bereitgestellt wird. Weitere Informationen finden Sie unter Deploy Azure IoT Einsatz.
  • Die Azure CLI-Version 2.62.0 oder neuer, die auf Ihrem Entwicklungscomputer installiert ist. Verwenden Sie az --version, um Ihre Version zu überprüfen. Bei Bedarf können Sie sie mithilfe von az upgrade aktualisieren. Weitere Informationen finden Sie unter Install the Azure CLI.

  • Die Azure IoT Einsatz Erweiterung für die Azure CLI. Verwenden Sie den folgenden Befehl, um die Erweiterung hinzuzufügen oder auf die neueste Version zu aktualisieren:

    az extension add --upgrade --name azure-iot-ops
    
  • Azure IoT Einsatz Version 1.2 oder höher.

  • Ein Datenflussprofil. Sie können das Standardprofil verwenden.

  • Ein Datenflussendpunkt für Ihre Quelle und Ihr Ziel. Der standardmäßige MQTT-Broker-Endpunkt funktioniert für die ersten Schritte.

Erstellen eines Datenflussdiagramms

Ein Datenflussdiagramm enthält drei Arten von Elementen: Quellen , die Daten einbinden, transformationen , die sie verarbeiten, und Ziele , die sie senden. Verbinden Sie sie in der Reihenfolge, in der Daten fließen sollen.

  1. Wechseln Sie im Operations-Erlebnis zu Ihrer Azure IoT Einsatz-Instanz.

  2. Wählen Sie "Datenflussdiagramm>erstellen" aus.

    Screenshot der Bedienungsoberfläche mit Datenflussgraph.

  3. Geben Sie einen Namen für das Datenflussdiagramm ein, und wählen Sie ein Datenflussprofil aus. Das Standardprofil ist standardmäßig ausgewählt.

    Screenshot des Dialogfelds zum Erstellen von Vorgängen mit dem Namensfeld und der Dropdownliste für Profile.

  4. Erstellen Sie Ihre Pipeline, indem Sie dem Zeichenbereich Elemente hinzufügen:

    1. Fügen Sie eine Quelle hinzu: Wählen Sie den Quellendpunkt aus, und konfigurieren Sie die Themen, die für eingehende Nachrichten abonniert werden sollen.

      Screenshot des Konfigurationspanels für die Betriebserfahrung, das die Dropdown-Liste für Endpunkte und die Themeneingabe anzeigt.

      1. Hinzufügen von Transformationen: Wählen Sie eine oder mehrere Transformationen aus, um die Daten zu verarbeiten. Verfügbare Transformationen umfassen Abbildung, Filter, Verzweigung, Verkettung und Fenster. Ausführliche Informationen zu den einzelnen Transformationstypen finden Sie in der Übersicht über Datenflussdiagramme.

      Screenshot des Menüs

      Screenshot der Betriebsansicht mit einem Beispiel für die Konfiguration einer Verzweigungstransformation.

    2. Fügen Sie ein Ziel hinzu: Wählen Sie den Zielendpunkt aus, und konfigurieren Sie das Thema oder den Pfad, an das verarbeitete Daten gesendet werden sollen.

      Screenshot der Vorgangsoberfläche mit einem Zielbeispiel.

  5. Verbinden Sie die Elemente in der Reihenfolge, in der Daten fließen sollen.

    Screenshot des Bereichs

  6. Wählen Sie "Speichern" aus, um das Datenflussdiagramm bereitzustellen.

Konfigurieren der Quelle

Die Quelle definiert, wo Daten in die Pipeline eingegeben werden. Geben Sie einen Endpunktverweis und ein oder mehrere Themen an.

Wählen Sie im Datenflussdiagramm-Editor das Quellelement aus, und konfigurieren Sie Folgendes:

Setting Beschreibung
Endpunkt Der zu verwendende Datenflussendpunkt. Wählen Sie den Standardwert für den lokalen MQTT-Broker aus.
Themen Ein oder mehrere Themen, die für eingehende Nachrichten abonniert werden sollen.

Transformationen hinzufügen

Transformiert Prozessdaten zwischen Der Quelle und dem Ziel. Jede Transformation verweist auf ein integriertes Artefakt und ist mit Regeln konfiguriert.

Die verfügbaren integrierten Transformationen sind:

Umwandeln Artefakt Beschreibung
Landkarte azureiotoperations/graph-dataflow-map:1.0.0 Umbenennen, Neustrukturieren, Berechnen und Kopieren von Feldern.
Filter azureiotoperations/graph-dataflow-filter:1.0.0 Verwerfen Sie Nachrichten, die einer Bedingung entsprechen.
Filiale azureiotoperations/graph-dataflow-branch:1.0.0 Leiten Sie jede Nachricht basierend auf einer Bedingung an einen true- oder false-Pfad weiter.
Concatenate azureiotoperations/graph-dataflow-concatenate:1.0.0 Führen Sie zwei oder mehr Pfade wieder in einem Pfad zusammen.
Fenster azureiotoperations/graph-dataflow-window:1.0.0 Sammeln Sie Nachrichten über ein Zeitintervall, und aggregieren Sie dann.

Weitere Informationen zum Anreichern von Nachrichten mit externen Daten finden Sie unter "Anreichern mit externen Daten".

Wählen Sie im Datenflussdiagramm-Editor "Transformation hinzufügen " und dann den Transformationstyp aus. Konfigurieren Sie die Regeln im visuellen Editor.

Verketten mehrerer Transformationen

Sie können eine beliebige Anzahl von Transformationen verketten. Verbinden Sie sie im nodeConnections Abschnitt in der Reihenfolge, in der Daten fließen sollen:

Ziehen Sie Verbindungen zwischen Transformationen auf der Arbeitsfläche, um die Verarbeitungsreihenfolge festzulegen.

Konfigurieren des Ziels

Das Ziel definiert, wo verarbeitete Daten gesendet werden. Geben Sie einen Endpunktverweis und ein Thema oder Pfad an.

Wählen Sie das Zielelement aus, und konfigurieren Sie Folgendes:

Setting Beschreibung
Endpunkt Der Datenflussendpunkt, an den Daten gesendet werden sollen.
Topic Das Thema oder der Pfad, in dem verarbeitete Daten veröffentlicht werden sollen.

Dynamisches Themenrouting basierend auf Nachrichteninhalten finden Sie unter Weiterleiten von Nachrichten zu verschiedenen Themen.

Überprüfen, ob das Datenflussdiagramm funktioniert

Überprüfen Sie nach der Bereitstellung eines Datenflussgraphs, ob er läuft.

Wählen Sie in der Betriebsumgebung Ihr Datenflussdiagramm aus, um den Status anzuzeigen. Ein gesundes Diagramm zeigt einen laufenden Zustand an.

Nächste Schritte