Überblick über Aktivitäten

Aktivitäten sind die Bausteine, mit denen Sie End-to-End-Datenworkflows in Microsoft Fabric erstellen können. Stellen Sie sich sie als die Aufgaben vor, die Ihre Daten verschieben und transformieren, um Ihren Geschäftlichen Anforderungen gerecht zu werden. Sie können eine Kopieraktivität verwenden, um Daten aus SQL Server in Azure Blob Storage zu verschieben. Anschließend können Sie eine Dataflow-Aktivität oder Notizbuchaktivität hinzufügen, um diese Daten zu verarbeiten und zu transformieren, bevor Sie sie in Azure Synapse Analytics für die Berichterstellung laden.

Tipp

Erfahren Sie, wie Sie Ihre Pipelines auf der Arbeitsfläche visuell erstellen und darin navigieren. Weitere Informationen finden Sie unter Pipeline-Canvas.

Aktivitäten werden in Pipelines gruppiert, um bestimmte Ziele zu erreichen. Sie können z. B. eine Pipeline erstellen, die:

  • Ruft Protokolldaten aus verschiedenen Quellen ab
  • Bereinigt und organisiert diese Daten
  • Führt Analysen aus, um Erkenntnisse zu finden

Wenn Sie Ihre Aktivitäten in einer Pipeline gruppieren, können Sie all diese Schritte als eine Einheit verwalten, anstatt jede Aktivität separat zu behandeln. Sie können die gesamte Pipeline gleichzeitig bereitstellen und planen, um sie bei Bedarf auszuführen.

Microsoft Fabric bietet drei Arten von Aktivitäten:

Datenverschiebungsaktivitäten

Diese Aktivitäten helfen Ihnen, Daten von einem Ort an eine andere in Ihrer Pipeline zu verschieben.

Bewegungsaktivität Description
Kopieren von Daten Sie können Daten aus jeder unterstützten Quelle auf jedes unterstützte Ziel kopieren. Sehen Sie sich die Übersicht über den Connector an, um zu sehen, was verfügbar ist.
Kopierauftrag Kopieraufträge sind eine vereinfachte Methode zum schnellen Verschieben von Daten.

Wenn Sie zwischen verschiedenen Datenbewegungsoptionen wählen müssen, lesen Sie den Artikel zum Entscheidungsleitfaden zur Datenbewegung.

Datentransformationsaktivitäten

Diese Aktivitäten helfen Ihnen, Ihre Daten zu verarbeiten und zu transformieren. Sie können sie einzeln verwenden oder mit anderen Aktivitäten verketten.

Weitere Informationen finden Sie im Artikel Datentransformationsaktivitäten.

Datentransformationsaktivität Compute-Umgebung
Kopieren von Daten Compute-Manager von Microsoft Fabric
Dataflow Gen2 Compute-Manager von Microsoft Fabric
Löschen von Daten Compute-Manager von Microsoft Fabric
Fabric-Notizbuch Apache Spark-Cluster, die von Microsoft Fabric verwaltet werden
HDInsight-Aktivität Apache Spark-Cluster, die von Microsoft Fabric verwaltet werden
Spark-Auftragsdefinition Apache Spark-Cluster, die von Microsoft Fabric verwaltet werden
Gespeicherte Prozedur Azure SQL, Azure Synapse Analytics oder SQL Server
SQL-Skript Azure SQL, Azure Synapse Analytics oder SQL Server

Ablaufsteuerungsaktivitäten

Mit diesen Aktivitäten können Sie steuern, wie Ihre Pipeline ausgeführt wird:

Steuern der Aktivität Description
Anfügevariable Ermöglicht das Hinzufügen eines Werts zu einer vorhandenen Arrayvariablen.
Genehmigungsaktivität Unterbricht die Pipelineausführung und fordert von den festgelegten Prüfern eine Entscheidung über Genehmigung oder Ablehnung an.
Azure Batch-Aktivität Führt ein Azure Batch-Skript aus.
Azure Databricks-Aktivität Führt einen Azure Databricks-Auftrag (Notebook, Jar, Python) aus.
Azure Machine Learning-Aktivität Führt einen Azure Machine Learning-Auftrag aus.
Aktivität deaktivieren Deaktiviert eine andere Aktivität.
Fail Bringen Sie die Pipelineausführung mit einer angepassten Fehlermeldung und einem Fehlercode zum Scheitern.
Filter Wende einen Filterausdruck auf ein Eingabearray an.
ForEach Mit der Aktivität "ForEach" wird der Ablauf in Ihrer Pipeline so gesteuert, dass er sich wiederholt. Diese Aktivität wird verwendet, um über eine Sammlung zu iterieren und die angegebenen Aktivitäten in einer Schleife auszuführen. Die Schleifenimplementierung dieser Aktivität ähnelt der Foreach-Schleifenstruktur in Programmiersprachen.
Funktionenaktivität Führt eine Azure Function aus.
Abrufen von Metadaten Die Aktivität „Metadaten abrufen“ kann zum Abrufen von Metadaten für alle Daten in einer Data Factory- oder Synapse-Pipeline verwendet werden.
Wenn-Bedingung Die „If Condition“ kann verwendet werden, um eine Verzweigung basierend auf einer Bedingung einzurichten, die als wahr oder falsch ausgewertet wird. Die Aktivität „If Condition“ bietet die gleiche Funktionalität wie eine If-Anweisung in Programmiersprachen. Sie wertet eine Aktivitätengruppe aus, wenn die Bedingung als true ausgewertet wird, und eine weitere Aktivitätengruppe, wenn die Bedingung als false ausgewertet wird.
Pipeline aufrufen Mit der Aktivität „Pipeline ausführen“ kann eine Data Factory- oder Synapse-Pipeline eine andere Pipeline aufrufen.
KQL-Aktivität Führt ein KQL-Skript für eine Kusto-Instanz aus.
Seehaus-Wartungsaktivitäten Durchführung von Routinewartungen für Tabellen in einem Lakehouse über eine Microsoft Fabric-Pipeline.
Nachschlageaktivität Mit der Lookup-Aktivität können Sie einen Datensatz, Tabellennamen oder Wert aus einer beliebigen externen Quelle abrufen oder nachschlagen. Auf die Ausgabe kann durch nachfolgende Aktivitäten verwiesen werden.
Aktualisieren der Aktivität „materialisierte Lake-Ansicht“ Aktualisiert einen materialisierten Seeblick in einem Lakehouse, um die neuesten Daten widerzuspiegeln.
Aktualisieren der SQL-Endpunktaktivität Aktualisiert einen SQL-Endpunkt in Lakehouse, um die neuesten Daten widerzuspiegeln.
Variable festlegen Ermöglicht das Festlegen des Werts einer vorhandenen Variablen.
Switch-Aktivität Implementiert einen Wechselausdruck, der mehrere nachfolgende Aktivitäten für jedes potenzielle Ergebnis des Ausdrucks zulässt.
Teams-Aktivität Veröffentlicht eine Nachricht in einem Teams-Kanal oder Gruppenchat.
Bis zur Aktivität Es wird eine „Wiederholen bis“-Schleife implementiert, die der Struktur einer Do-Until-Schleife in Programmiersprachen ähnelt. Sie führt eine Reihe von Aktivitäten in einer Schleife aus, bis die der Aktivität zugeordnete Bedingung als „true“ ausgewertet wird. Sie können einen Timeoutwert für die Until-Aktivität angeben.
Warteaktivität Wenn Sie eine Warteaktivität in einer Pipeline verwenden, wartet die Pipeline den angegebenen Zeitraum, bevor sie die Ausführung nachfolgender Aktivitäten fortsetzt.
Webaktivität Die Webaktivität kann verwendet werden, um einen benutzerdefinierten REST-Endpunkt aus einer Pipeline aufzurufen.
Webhook-Aktivität Die Webhook-Aktivität ermöglicht das Aufrufen eines Endpunkts und das Übergeben einer Rückruf-URL. Der Pipeline-Durchlauf wartet, bis der Callback aufgerufen wird, bevor er mit der nächsten Aktivität fortfährt.

Hinzufügen von Aktivitäten zu einer Pipeline mit der Microsoft Fabric-Benutzeroberfläche

Hier erfahren Sie, wie Sie Aktivitäten in Ihrer Pipeline hinzufügen und konfigurieren:

  1. Erstellen Sie eine neue Pipeline in Ihrem Arbeitsbereich.
  2. Wechseln Sie zur Registerkarte "Aktivitäten", und durchsuchen Sie die verfügbaren Aktivitäten. Scrollen Sie nach rechts, um alle Optionen anzuzeigen, und wählen Sie dann eine Aktivität aus, um sie dem Pipeline-Editor hinzuzufügen.
  3. Wenn Sie eine Aktivität hinzufügen und auf der Canvas auswählen, werden die zugehörigen Allgemeinen Einstellungen im Eigenschaftenbereich unten angezeigt.
  4. Jede Aktivität verfügt über weitere Konfigurationsoptionen auf anderen Registerkarten im Eigenschaftenbereich.

Der Screenshot zeigt den Pipeline-Editor mit der Registerkarte „Aktivitäten“, der Symbolleiste, einer Kopieraktivität und der Registerkarte „Allgemein“ mit den Eigenschaften, alles hervorgehoben.

Allgemeine Einstellungen

Wenn Sie einer Pipeline eine neue Aktivität hinzufügen und diese auswählen, werden die Eigenschaften unten auf dem Bildschirm angezeigt. Dazu gehören "Allgemein", "Einstellungen" und manchmal auch andere Registerkarten.

Screenshot: Registerkarte „Allgemeine Einstellungen“ einer Aktivität.

Jede Aktivität enthält Die Felder "Name " und " Beschreibung " in den allgemeinen Einstellungen. Einige Aktivitäten haben auch folgende Optionen:

Setting Description
Timeout Wie lange eine Aktivität ausgeführt werden kann, bevor ein Timeout erfolgt. Der Standardwert ist 12 Stunden und die maximale Anzahl von sieben Tagen. Verwenden Sie das Format D.HH:MM:SS.
Wiederholungen aktivieren Wenn diese Option ausgewählt ist, wird die Aktivität automatisch erneut ausgeführt, wenn sie fehlschlägt.
Retry Wie oft wiederholt werden soll, wenn die Aktivität fehlschlägt. Der Standardwert ist 1.
Wiederholungsbedingungen (Vorschau) Konfigurieren Sie bestimmte Fehlerbedingungen, die einen Wiederholungsversuch auslösen.
Wiederholungsintervall (Sek.) Anzahl der Sekunden, die zwischen Wiederholungsversuchen gewartet werden sollen. Der Standardwert ist 30 Sekunden.
(Erweiterte Eigenschaften) Sichere Ausgabe Wenn diese Option ausgewählt ist, wird die Aktivitätsausgabe nicht in Protokollen angezeigt.
(Erweiterte Eigenschaften) Sichere Eingabe Wenn diese Option ausgewählt ist, werden die Aktivitätseingaben nicht in Protokollen angezeigt.

Note

Standardmäßig können sie bis zu 120 Aktivitäten pro Pipeline haben. Dazu gehören interne Vorgänge bei Containern.

Wiederholen einer Aktivität

Wenn eine Aktivität während der Pipelineausführung fehlschlägt, können Sie sie so konfigurieren, dass sie automatisch erneut versucht wird, bevor Sie die Ausführung als fehlgeschlagen markieren. Diese Funktion ist nützlich zum Umgang mit vorübergehenden Fehlern wie Netzwerk-Time-outs, vorübergehender Nichtverfügbarkeit von Diensten oder sporadischen Verbindungsproblemen.

Konfigurieren von Wiederholungseinstellungen

So richten Sie das Wiederholungsverhalten für eine Aktivität ein:

  1. Wählen Sie die Aktivität auf der Pipeline-Arbeitsfläche aus.
  2. Aktivieren Sie auf der Registerkarte " Allgemein " des Eigenschaftenbereichs das Kontrollkästchen " Wiederholungsversuche aktivieren ", um die Wiederholungsfunktion zu aktivieren.
  3. Legen Sie das Feld " Wiederholen " auf die Anzahl der Wiederholungsversuche fest. Geben Sie einen Wert zwischen 1 und 1000 ein. Der Standardwert ist 1.
  4. Konfigurieren Sie optional Die Wiederholungsbedingungen (Vorschau), um zu steuern, wann Wiederholungen basierend auf bestimmten Fehlerkriterien auftreten.
  5. Legen Sie das Feld " Wiederholungsintervall (Sek.) fest, um zu bestimmen, wie viele Sekunden zwischen Wiederholungsversuchen gewartet werden sollen. Der Standardwert ist 30 Sekunden.

Screenshot der Einstellungen für wiederholungen auf der Registerkarte

Konfigurieren von Wiederholungsbedingungen (Vorschau)

Standardmäßig wird eine Aktivität bei einem Fehler erneut ausgeführt. Verwenden Sie Retry-Bedingungen , um genau anzugeben, welche Fehler einen Wiederholungsversuche auslösen sollen. Dies hilft Ihnen, keine erneuten Versuche für Fehler zu verschwenden, die sich nicht beheben lassen, z. B. Authentifizierungsfehler.

Um eine Wiederholungsbedingung hinzuzufügen:

  1. Wählen Sie im Abschnitt Wiederholungsbedingungen (Vorschau) die Schaltfläche + aus, um eine neue Bedingungszeile hinzuzufügen.
  2. Wählen Sie ein Feld aus, das ausgewertet werden soll:
    • Fehlermeldung: Der Textinhalt der Fehlermeldung.
    • Fehlertyp: Die Fehlerkategorie (z. B. Benutzerfehler, Systemfehler).
    • Fehlercode: Der zurückgegebene spezifische Fehlercode (z. B. 429 für die Zinsbegrenzung).
  3. Wählen Sie einen Operator aus, um den Übereinstimmungstyp zu definieren (z. B. Enthält).
  4. Geben Sie einen Wert ein, mit dem abgeglichen werden soll.
  5. Verwenden Sie die Spalte "Und/Oder ", um mehrere Bedingungen zu kombinieren. Wählen Sie And, um festzulegen, dass alle Bedingungen erfüllt sein müssen, oder Or, um es erneut zu versuchen, wenn eine beliebige Bedingung erfüllt ist.

Wenn Sie beispielsweise nur bei Ratenbegrenzungsfehlern einen erneuten Versuch ausführen möchten, fügen Sie eine Bedingung hinzu, bei der Feld auf Error code gesetzt ist, Operator auf Contains gesetzt ist und Wert auf 429 gesetzt ist.

Important

Das Retry-Intervall läuft bevor die Bedingung ausgewertet wird. Wenn Sie z. B. ein 1-Stunden-Wiederholungsintervall festlegen und die Wiederholungsbedingung nicht erfüllt ist, wartet die Pipeline immer noch die volle Stunde, bevor Sie mit der nächsten Aktivität fortfahren oder die Pipelineausführung beenden.

Tipp

Wenn keine Wiederholungsbedingungen angegeben sind, wiederholt die Aktivität alle Fehler. Fügen Sie Bedingungen hinzu, um selektiver zu sein, welche Fehler Wiederholungen auslösen.

Bekannte Wiederholungseinschränkungen

  • Aktivitätsunterstützung: Bedingte Wiederholungen werden für bestimmte Aktivitätstypen unterstützt, einschließlich Kopieren von Daten, Notizbuch, Datenfluss und gespeicherten Prozeduraktivitäten.
  • Fehlereigenschaften: Wiederholungsbedingungen können bei Fehlercode, Fehlermeldung und Fehlertyp übereinstimmen. Nicht alle connectorspezifischen Fehlerfelder sind für den Abgleich verfügbar.

Deaktivieren einer Aktivität

Sie können eine oder mehrere Aktivitäten aus einer Pipeline deaktivieren, um sie während der Überprüfung und Pipelineausführung zu überspringen. Dieses Feature verbessert die Effizienz von Pipelineentwicklern, sodass Sie einen Teil der Pipeline auskommentieren können, ohne ihn aus der Canvas zu löschen. Sie können Aktivitäten zu einem späteren Zeitpunkt reaktivieren.

Deaktivieren von Aktivitäten

Es gibt zwei Möglichkeiten zum Deaktivieren einer Aktivität: Deaktivieren einer einzelnen Aktivität über die Registerkarte " Allgemein " oder Deaktivieren mehrerer Aktivitäten mit der rechten Maustaste.

Speichern Sie die Änderungen, um die Aktivitäten während der nächsten geplanten Pipelineausführung zu deaktivieren.

Deaktivieren einer einzelnen Aktivität

  1. Wählen Sie die Aktivität aus, die Sie deaktivieren möchten.
  2. Wählen Sie auf der Registerkarte "Allgemein" die Option "Für den Aktivitätsstatusdeaktiviert" aus.
  3. Wählen Sie einen Status für "Aktivität markieren als" aus. Wählen Sie aus Erfolgreich, Fehlgeschlagen oder Übersprungen aus

Screenshot des Fabric Data Factory-Pipeline-Editors mit

Deaktivieren mehrerer Aktivitäten

  1. Drücken Sie die STRG-TASTE nach unten, um mehrfach auszuwählen. Klicken Sie mit der linken Maustaste auf alle Aktivitäten, die Sie deaktivieren möchten.
  2. Klicken Sie mit der rechten Maustaste, um das Dropdownmenü anzuzeigen.
  3. Wählen Sie "Deaktivieren" aus, um sie alle zu deaktivieren.
  4. Um die Einstellungen für "Aktivität markieren als" zu optimieren, wechseln Sie zur Registerkarte " Allgemein " der Aktivität, und nehmen Sie entsprechende Änderungen vor.

Screenshot, der zeigt, wie mehrere Aktivitäten gleichzeitig deaktiviert werden.

Reaktivieren von Aktivitäten

Wenn Sie die Aktivitäten reaktivieren möchten, wählen Sie "Für den Aktivitätsstatus aktiviert" aus, und kehren sie wie erwartet zu ihren vorherigen Verhaltensweisen zurück.

Inaktive Aktivitätsverhalten

Eine inaktive Aktivität verhält sich in einer Pipeline anders.

  • Auf der Leinwand ist die inaktive Aktivität abgeblendet, wobei das Inaktivitätszeichen neben dem Aktivitätstyp platziert wird.

  • Auf der Leinwand wird ein Statuszeichen (Erfolgreich, fehlgeschlagen oder übersprungen) auf dem Kästchen platziert, um die Aktivität als markieren-Einstellung zu visualisieren.

  • Die Aktivität wird von der Pipelineüberprüfung ausgeschlossen. Daher müssen Sie nicht alle erforderlichen Felder für eine inaktive Aktivität angeben.

  • Während des Debug-Modus und beim Pipeline-Lauf wird die Aktivität nicht wirklich ausgeführt. Stattdessen wird ein Platzhalterzeilenelement mit dem reservierten Status "Inaktiv" ausgeführt.

  • Die Verzweigungsoption wird durch die Option " Aktivität markieren" gesteuert. Anders ausgedrückt:

    • Wenn Sie die Aktivität als erfolgreich markieren, wird die UponSuccess- oder UponCompletion-Verzweigung ausgeführt.
    • Wenn Sie die Aktivität als fehlgeschlagen markieren, wird der UponFailure- oder UponCompletion-Zweig ausgeführt.
    • Wenn Sie die Aktivität als übersprungen markieren, wird die UponSkip-Verzweigung ausgeführt.

    Screenshot mit dem Ausführungsstatus einer inaktiven Aktivität.

Bewährte Methoden für die Deaktivierung

Die Deaktivierung ist ein leistungsfähiges Tool für Pipelineentwickler. Entwickler können einen Teil des Codes „auskommentieren“, ohne die Aktivitäten dauerhaft zu löschen. Es glänzt in folgenden Szenarien:

  • Bei der Entwicklung einer Pipeline kann der Entwickler Platzhalter für inaktive Aktivitäten hinzufügen, bevor er alle erforderlichen Felder ausfüllt. Ich benötige zum Beispiel eine Kopieraktivität von SQL Server zum Data Warehouse, habe aber noch nicht alle Verbindungen eingerichtet. Daher verwende ich eine inaktive Kopieraktivität als Platzhalter für iterative Entwicklungsprozesse.
  • Nach der Bereitstellung kann der Entwickler bestimmte Aktivitäten kommentieren, die immer Probleme verursachen, um kostspielige Wiederholungen zu vermeiden. Wenn zum Beispiel mein lokaler SQL-Server Probleme mit der Netzwerkverbindung hat, weiß ich, dass meine Kopiervorgänge mit Sicherheit fehlschlagen. Möglicherweise möchte ich die Kopieraktivität deaktivieren, um zu vermeiden, dass Wiederholungsanforderungen das spröde System überfluten.

Note

Eine inaktive Aktivität wird nie tatsächlich ausgeführt. Dies bedeutet, dass die Aktivität kein Fehlerfeld oder die typischen Ausgabefelder enthält. Alle Verweise auf fehlende Felder können Fehler nach unten auslösen.