Nota
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare ad accedere o modificare le directory.
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare a modificare le directory.
Importante
Le trasformazioni di mapping dei flussi di dati in dataflow gen2 sono attualmente in anteprima pubblica e sono soggette a modifiche.
Le trasformazioni Mapping Data Flow (MDF) in Dataflow Gen2 consentono di creare, eseguire e monitorare trasformazioni dei dati basate su Spark direttamente in Data Factory in Microsoft Fabric.
Le trasformazioni MDF portano in Microsoft Fabric le funzionalità di Azure Data Factory e dei flussi di dati di mapping di Azure Synapse Analytics tramite una familiare esperienza di creazione visuale low-code integrata con Dataflow Gen2.
Con le trasformazioni MDF, è possibile:
- Migrare le pipeline di Mapping Data Flow esistenti di Azure Data Factory e Azure Synapse Analytics in Fabric.
- Creare nuove trasformazioni basate su Spark direttamente in Fabric.
- Esegui trasformazioni MDF usando le pipeline di dati di Fabric.
- Monitorare l'esecuzione della trasformazione usando esperienze di monitoraggio integrate.
- Continua a usare i familiari modelli di trasformazione di Mapping Flusso di dati in Fabric.
Che cosa sono le trasformazioni nel flusso di dati di mapping?
Le trasformazioni MDF estendono dataflow gen2 con funzionalità di trasformazione basate su Spark per carichi di lavoro di preparazione e trasformazione dei dati su larga scala.
Le trasformazioni MDF offrono:
- Esperienza di creazione di oggetti visivi con poco codice
- Esecuzione basata su Spark
- Orchestrazione integrata tramite pipeline di Fabric
- Monitoraggio e informazioni dettagliate sull'esecuzione direttamente in Fabric
Utilizzare trasformazioni MDF per:
- Eseguire la migrazione a Fabric delle pipeline dei flussi di dati di mapping esistenti di Azure Data Factory o di Azure Synapse Analytics.
- Creare nuove pipeline di trasformazione basate su Spark in modo nativo in Fabric.
Le trasformazioni MDF si integrano pienamente con dataflow gen2 e offrono un'esperienza di creazione familiare simile a quella di Azure Data Factory e dei Mapping Data Flows di Azure Synapse Analytics.
Scenari supportati
Le trasformazioni MDF supportano attualmente gli scenari seguenti.
Eseguire la migrazione dei flussi di dati di mapping esistenti
È possibile eseguire la migrazione di flussi di dati di mapping esistenti Azure Data Factory e di Azure Synapse Analytics in Fabric usando l'esperienza di migrazione predefinita di Azure Data Factory/Synapse Analytics.
Durante la migrazione:
- I Flussi di dati di mapping vengono convertiti in trasformazioni MDF in Dataflow Gen2.
- Le pipeline e la logica di trasformazione vengono migrate insieme.
- Le trasformazioni MDF si aprono all'interno del canvas di trasformazione incorporato in Dataflow Gen2.
- La logica di trasformazione esistente può continuare a essere creata, convalidata, eseguita e monitorata in Fabric.
Creare nuove trasformazioni nei flussi di dati di mapping in Fabric
È anche possibile creare nuove trasformazioni MDF direttamente nel flusso di dati gen2. Questa esperienza consente di:
- Creare trasformazioni basate su Spark usando un'interfaccia visiva.
- Usa le familiari funzionalità di trasformazione di Mapping Flusso di dati.
- Esegui trasformazioni usando le pipeline di dati di Fabric.
- Monitorare l'esecuzione tramite esperienze di monitoraggio integrate.
Prerequisiti
Prima di usare trasformazioni MDF in DataFlow Gen2, assicurarsi che siano soddisfatti i prerequisiti seguenti:
- Una capacità Fabric.
- Autorizzazioni di Collaboratore o autorizzazioni superiori per l'area di lavoro di Fabric.
- Connessioni Fabric esistenti per le origini dati supportate.
- (Facoltativo) Un'area di lavoro Azure Data Factory o Azure Synapse Analytics esistente, se si usano scenari di migrazione.
Limitations
Le funzionalità seguenti non sono attualmente supportate nell'anteprima pubblica:
| Area | Limitation |
|---|---|
| Flowlets | Non supportato. |
| Libreria Flusso di dati | Non supportato. |
| Funzioni definite dall'utente | Non supportato. |
| Esecuzione del flusso di dati | Le trasformazioni MDF possono essere eseguite solo tramite l'attività Dataflow della pipeline. L'esecuzione diretta dal flusso di dati gen2 non è attualmente supportata. Solo l'azione Salva è disponibile dal menu Salva ed esegui . |
| Rete virtuale gestita | Il supporto per Managed Rete virtuale (Managed VNet) non è disponibile in questa versione preliminare. |
| Esecuzione del runtime | L'esecuzione delle trasformazioni MDF utilizza attualmente il runtime Synapse Spark sottostante, simile a quello usato da Azure Data Factory e dai Flussi di dati di mapping di Azure Synapse Analytics. |
| Parità delle funzionalità | Non tutte le funzionalità di mapping Flusso di dati sono disponibili in questa anteprima. |
Connettori supportati
Le trasformazioni MDF supportano i connettori di origine e di destinazione più comunemente usati disponibili in Azure Data Factory e nei flussi di dati di mapping di Azure Synapse Analytics.
Sono attualmente supportati i connettori seguenti:
| Categoria | Archiviazione dati | Trasformazioni MDF in Dataflow Gen2 (origine/destinazione) |
|---|---|---|
| Azure | Archiviazione BLOB di Azure (Servizio di archiviazione Blob di Azure) | ✓/✓ |
| Azure Cosmos DB per il NoSQL | ✓/✓ | |
| Esplora dati di Azure | ✓/✓ | |
| Azure Data Lake Storage Gen1 | ✓/✓ | |
| Azure Data Lake Storage Gen2 | ✓/✓ | |
| Database di Azure per MySQL | ✓/✓ | |
| Database di Azure per PostgreSQL | ✓/✓ | |
| Azure Databricks Delta Lake | ✓/✓ Usare il formato delta | |
| Database SQL di Microsoft Azure | ✓/✓ | |
| Istanza gestita di SQL di Azure (Istanza gestita di Azure SQL) | ✓/✓ | |
| Azure Synapse Analytics | ✓/✓ | |
| Banca dati | Snowflake | ✓/✓ |
| File | Amazon S3 | ✓/✓ |
| SFTP | ✓/✓ | |
| REST generico | ✓/✓ |
Durante la redazione:
- È possibile riutilizzare le connessioni Fabric esistenti.
- È possibile creare nuove connessioni direttamente dall'esperienza di creazione usando l'esperienza Recupera dati .
- La configurazione dell'origine e del sink segue i modelli di mapping Flusso di dati noti.
Trasformazioni supportate
Le trasformazioni MDF offrono una nota esperienza di trasformazione visiva a basso codice per creare pipeline scalabili di trasformazione dei dati basate su Spark in Fabric.
Sono attualmente supportate le trasformazioni seguenti:
| Name | Categoria | Description |
|---|---|---|
| Aggregate | Modificatore dello schema | Definire aggregazioni come SUM, MIN, MAX e COUNT raggruppate per colonne esistenti o calcolate. |
| Alter Row | Modificatore di riga | Consente di configurare i criteri di inserimento, eliminazione, aggiornamento e upsert sulle righe. |
| Assert | Modificatore di riga | Definire le regole di asserzione per le righe nel flusso di dati. |
| Cast | Modificatore dello schema | Modifica i tipi di dati delle colonne con il controllo dei tipi. |
| Suddivisione condizionale | Più input/output | Instradare le righe a flussi diversi in base alle condizioni corrispondenti. |
| Colonna derivata | Modificatore dello schema | Generare nuove colonne o modificare i campi esistenti usando le espressioni. |
| Chiamata esterna | Modificatore dello schema | Chiama endpoint esterni in linea per ogni riga. |
| Exists | Più input/output | Controllare se i dati esistono in un'altra origine o flusso. |
| Filter | Modificatore di riga | Filtrare le righe in base alle condizioni. |
| Flatten | Formattatori | Appiattire strutture gerarchiche come matrici JSON in righe. |
| Unisciti. | Più input/output | Consente di combinare dati da due origini o flussi. |
| Lookup | Più input/output | Dati di riferimento da un'altra origine o flusso. |
| Nuovo ramo | Più input/output | Applicare più percorsi di trasformazione nello stesso flusso. |
| Parse | Formattatori | Analizzare stringhe in formato JSON, testo delimitato o XML. |
| Pivot | Modificatore dello schema | Trasformare valori di riga distinti in colonne. |
| Rank | Modificatore dello schema | Generare classificazioni ordinate in base alle condizioni di ordinamento. |
| Select | Modificatore dello schema | Rinominare, riordinare o rimuovere colonne. |
| Sink | - | Definire la destinazione per i dati trasformati. |
| Sort | Modificatore di riga | Ordinare le righe nel flusso di dati corrente. |
| Source | - | Definire l'origine per il flusso di dati. |
| Stringify | Formattatori | Convertire i tipi complessi in valori stringa. |
| Chiave surrogata | Modificatore dello schema | Generare valori di chiave surrogata incrementati. |
| Union | Più input/output | Combinare più flussi di dati verticalmente. |
| Unpivot | Modificatore dello schema | Trasformare le colonne in valori di riga. |
| Window | Modificatore dello schema | Definire aggregazioni basate su finestre su flussi di dati. |
Creare una trasformazione del flusso di dati di mapping in DataFlow Gen2
Per creare una nuova trasformazione MDF in Fabric:
Aprire l'area di lavoro di Fabric.
Selezionare Nuovo elemento.
Selezionare Flusso di dati Gen2.
Specificare un nome per l'elemento dataflow gen2 e selezionare Crea.
Nell'area di disegno del flusso di dati gen2 usare una delle opzioni seguenti:
- Selezionare Esegui trasformazioni del flusso di dati di mappatura dal gruppo di azioni Nuovo nella barra multifunzione Home di Dataflow Gen2.
- Selezionare il riquadro Run Mapping Data Flow transforms (ADF Mapping Data Flows) (Esegui trasformazioni del flusso di dati mapping ADF) nell'area di disegno.
Compare una nuova azione di trasformazione MDF nel canvas di Dataflow Gen2 e si apre l'ambiente di creazione integrato per la trasformazione MDF.
Tip
L'esperienza di creazione delle trasformazioni MDF utilizza un'interfaccia visiva nota, simile a quella di Azure Data Factory e dei flussi di dati di mapping di Azure Synapse Analytics.
Creare trasformazioni del flusso di dati di mappatura
Dopo aver creato una trasformazione MDF, è possibile iniziare a creare la logica di trasformazione.
Abilitare la modalità di debug
Per la creazione interattiva e l'anteprima dei dati:
- Attiva l'opzione Debug del flusso di dati dalla barra degli strumenti fluttuante.
- Attendere che la sessione di debug venga inizializzata.
- Dopo l'abilitazione, è possibile visualizzare in anteprima i dati di origine e trasformazione durante la creazione.
Annotazioni
L'inizializzazione delle sessioni di debug potrebbe richiedere alcuni minuti a seconda della disponibilità del runtime spark.
Aggiungere un'origine
Per configurare un'origine:
- Selezionare Aggiungi origine.
- Selezionare il tipo di connessione.
- Selezionare una connessione Fabric esistente o creare nuove connessioni direttamente tramite l'esperienza Recupera dati, se necessario.
- Esplorare e selezionare il file di origine, la tabella o il set di dati.
Dopo aver configurato la connessione e il set di dati di origine, usare la scheda Anteprima dati per convalidare e visualizzare in anteprima i dati di origine durante la creazione interattiva.
Aggiungere trasformazioni
Per aggiungere trasformazioni:
- Selezionare l'icona + accanto a un'origine o a una trasformazione.
- Selezionare il tipo di trasformazione.
- Configurare le impostazioni di trasformazione.
È possibile continuare a creare la logica di trasformazione utilizzando il canvas di trasformazione visiva.
Configurare un sink
Al termine della logica di trasformazione:
- Aggiungere una trasformazione sink.
- Configurare la connessione di destinazione.
- Configurare le impostazioni di scrittura.
Convalidare e salvare
Prima dell'esecuzione:
Selezionare Convalida nella barra degli strumenti di trasformazione MDF.
Risolvere i problemi di convalida se vengono segnalati.
Selezionare Salva dal menu Salva ed esegui .
Annotazioni
Solo l'azione Salva è attualmente supportata per il flusso di dati gen2 con trasformazioni MDF in anteprima pubblica.
Eseguire trasformazioni del flusso di dati di mapping tramite le pipeline di Fabric
È possibile eseguire le trasformazioni MDF tramite le pipeline di dati di Fabric usando un'attività Dataflow.
Per eseguire una trasformazione MDF:
- Creare una nuova pipeline di Fabric.
- Aggiungere un'attività Flusso di dati alla pipeline.
- Nelle impostazioni dell'attività selezionare l'elemento dataflow gen2 contenente la trasformazione MDF.
- Selezionare la query di trasformazione MDF da eseguire.
- Configurare le impostazioni di runtime di Spark in base alle esigenze.
- Convalidare e pubblicare la pipeline.
- Esegui la pipeline manualmente o configura una pianificazione o attivatori.
Configurare le impostazioni di runtime di Spark
Le trasformazioni MDF vengono eseguite usando il runtime Spark gestito integrato con Data Factory in Microsoft Fabric. È possibile configurare le impostazioni di runtime di Spark durante l'esecuzione della pipeline, tra cui:
- Dimensionamento del calcolo
- Proprietà del ricettore
Monitorare le esecuzioni delle trasformazioni del flusso di dati di mapping
È possibile monitorare l'esecuzione della trasformazione MDF tramite:
Per visualizzare i dettagli di monitoraggio:
- Aprire i dettagli dell'esecuzione della pipeline.
- Selezionare l'attività Dataflow da Esecuzioni dell'attività.
- Esaminare lo stato di esecuzione e i dettagli del runtime.