Nota
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare ad accedere o modificare le directory.
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare a modificare le directory.
Questa pagina illustra come accedere ai dati condivisi con l'utente usando OpenSharing. OpenSharing supporta due modelli: la condivisione da Databricks a Databricks, per gli utenti delle aree di lavoro di Azure Databricks con Unity Catalog, e la condivisione da Databricks a Open, per qualsiasi destinatario che utilizzi qualsiasi strumento.
OpenSharing e destinatari dei dati
OpenSharing è uno standard aperto per la condivisione sicura dei dati. Un utente di Databricks, definito provider di dati in questo contesto, può usare OpenSharing su Azure Databricks per condividere dati con una persona o un gruppo all'esterno dell'organizzazione, denominato destinatario dati.
Condivisione da Databricks a Databricks e condivisione da Databricks a piattaforme aperte
Il modo in cui si accede ai dati dipende dal fatto che si sia un utente di Databricks e che il provider di dati abbia configurato o meno i dati condivisi con l'utente per la condivisione da Databricks a Databricks o la condivisione aperta.
Nel modello da Databricks a Databricks, è necessario essere un utente di un'area di lavoro Databricks abilitata per Unity Catalog. Un membro del team fornisce al provider di dati un identificatore univoco per il metastore di Unity Catalog e il provider di dati usa tale provider per creare una connessione di condivisione sicura. I dati condivisi diventano disponibili per l'accesso nell'area di lavoro. Se necessario, un membro del team configura il controllo di accesso granulare su tali dati.
Nel modello di condivisione da Databricks a Open è possibile usare qualsiasi strumento desiderato (incluso Databricks) per accedere ai dati condivisi. Il provider di dati invia un URL di attivazione o un collegamento al portale tramite un canale protetto. Seguire questa procedura per scaricare un file di credenziali o un URL che consente di accedere ai dati condivisi con l'utente.
I dati condivisi non vengono forniti direttamente da Databricks, ma dai provider di dati in esecuzione in Azure Databricks.
Note
Databricks può raccogliere informazioni sull'uso e l'accesso dei destinatari dei dati ai dati condivisi (inclusa l'identificazione di qualsiasi persona o azienda che accede ai dati usando il file di credenziali in relazione a tali informazioni) e può condividerla con il provider di dati applicabile.
Ottenere l'accesso ai dati condivisi con l'utente
Le modalità di accesso ai dati dipendono dal fatto che il fornitore di dati li abbia condivisi con te tramite il protocollo di condivisione Databricks-to-Open o il protocollo di condivisione Databricks-to-Databricks. Vedere Condivisione da Databricks a Databricks e condivisione da Databricks a Open.
Accedere al modello Databricks-to-Databricks
Nel modello Da Databricks a Databricks:
Il provider di dati ti invia istruzioni per trovare un identificatore univoco per il Unity Catalog metastore associato all'area di lavoro Databricks, e tu glielo invii.
L'identificatore di condivisione è una stringa costituita dal cloud, dall'area e dall'UUID del metastore (identificatore univoco per il metastore), nel formato
<cloud>:<region>:<uuid>. Ad esempio:aws:eu-west-1:b0c978c8-3e68-4cdf-94af-d05c120ed1ef.Per ottenere l'identificatore di condivisione tramite Esplora cataloghi:
Nell'area di lavoro di Azure Databricks fare clic
Catalogo.
Nella parte superiore del riquadro Catalogo, fare clic sull'
e selezionare OpenSharing.
In alternativa, nell'angolo superiore destro fare clic su Condividi > OpenSharing.
Nella scheda Condivisi con me, selezionare il nome dell'organizzazione di condivisione Databricks in alto a destra e selezionare Copia identificatore di condivisione.
Per ottenere l'identificatore di condivisione usando un notebook o una query SQL di Databricks, utilizzare la funzione SQL predefinita
CURRENT_METASTORE. Se si usa un notebook, deve funzionare in una modalità di accesso standard o dedicata nell'area di lavoro che si intende utilizzare per accedere ai dati condivisi.SELECT CURRENT_METASTORE();Il provider di dati crea:
- Un destinatario nel proprio account Databricks per rappresentare te e gli utenti della tua organizzazione che accederanno ai dati.
- Una condivisione , che rappresenta le tabelle, i volumi e le viste da condividere con te.
È possibile accedere ai dati condivisi con l'utente. Se necessario, tu o un membro del tuo team potete specificare l'accesso granulare ai dati per i vostri utenti. Vedi Leggere dati condivisi usando Databricks-to-Databricks OpenSharing (per i destinatari).
Ottenere l'accesso nel modello di condivisione da Databricks a Open
Nel modello di condivisione da Databricks a Open:
Il provider di dati crea:
- Un destinatario nel proprio account Databricks per rappresentare te e gli utenti della tua organizzazione che accederanno ai dati.
- Una condivisione, che è una rappresentazione delle tabelle e delle partizioni da condividere con te.
Il provider di dati invia un URL di attivazione (tramite un canale sicuro) o un URL del portale. Seguire questa procedura per scaricare un file di credenziali o un URL che consente di accedere ai dati condivisi con l'utente.
Sono supportati sia i token di connessione che le credenziali client OAuth.
Importante
Non condividere il collegamento di attivazione con nessuno. È possibile scaricare un file di credenziali una sola volta. Se si visita nuovamente il collegamento di attivazione dopo che il file delle credenziali è già stato scaricato, il pulsante Scarica file credenziali è disabilitato.
Se si perde il collegamento di attivazione prima di usarlo, contattare il provider di dati.
Archiviare il file delle credenziali in una posizione sicura.
Non condividere il file delle credenziali con altri utenti esterni al gruppo di utenti che devono avere accesso ai dati condivisi. Se è necessario condividerlo con un utente dell'organizzazione, Databricks consiglia di usare un gestore delle password.
Leggere i dati condivisi
La modalità di lettura dei dati che sono stati condivisi in modo sicuro con l'utente tramite OpenSharing dipende dal fatto che sia stato ricevuto un file di credenziali (il modello di condivisione Da Databricks a Open) o che si usi un'area di lavoro di Databricks e che il provider di dati abbia fornito l'identificatore di condivisione (il modello Databricks-to-Databricks).
Note
Se compare un errore che segnala che non esiste un asset di dati quando si tenta di leggere le tue condivisioni, consulta L'errore "non esiste" dell'asset di dati.
Leggere i dati condivisi usando un file di credenziali (condivisione da Databricks a open)
Se i dati sono stati condivisi con te tramite il protocollo di condivisione OpenSharing Databricks-to-Open con token bearer, usi il file di credenziali che hai scaricato per autenticarti all'account del fornitore di dati e leggere i dati condivisi. L'accesso viene mantenuto finché il token sottostante è valido e il provider continua a condividere i dati. I provider gestiscono la scadenza e la rotazione dei token. I token sono validi per un massimo di un anno dopo la creazione. Gli aggiornamenti ai dati sono disponibili quasi in tempo reale. È possibile leggere e creare copie dei dati condivisi, ma non è possibile modificare i dati di origine.
Per informazioni su come accedere e leggere i dati condivisi usando il file di credenziali in Azure Databricks, Apache Spark, pandas e Power BI, vedere Leggere i dati condivisi con OpenSharing Databricks-to-Open sharing con token di connessione.
Leggere i dati condivisi usando una federazione OIDC (condivisione da Databricks a Open)
Se i dati sono stati condivisi con l'utente usando il protocollo OpenSharing Databricks-to-Open con la federazione OIDC, usare l'URL inviato per eseguire l'autenticazione all'account del provider di dati e leggere i dati condivisi. L'accesso persiste finché il provider continua a condividere i dati. Gli aggiornamenti ai dati sono disponibili quasi in tempo reale. È possibile leggere e creare copie dei dati condivisi, ma non è possibile modificare i dati di origine.
Per informazioni su come accedere e leggere i dati condivisi usando il flusso di federazione dei token OIDC in Tableau e Power BI, vedere Read i dati condivisi usando la federazione OIDC (Open ID Connect) in un flusso U2M. Per informazioni su come accedere e leggere i dati condivisi usando il flusso di federazione dei token OIDC in un'app client Python, vedere Read i dati condivisi usando la federazione OIDC (Open ID Connect) in un flusso M2M.
Leggere i dati condivisi con la condivisione da Databricks a Databricks
Se i dati sono stati condivisi con l'utente usando il modello Databricks-to-Databricks, non è necessario alcun file di credenziali per accedere ai dati condivisi. Databricks si occupa della connessione sicura e i dati condivisi sono individuabili automaticamente nell'area di lavoro di Databricks.
Per informazioni su come trovare, leggere e gestire i dati condivisi nell'area di lavoro di Databricks, vedere Leggere i dati condivisi con Databricks-to-Databricks OpenSharing (per i destinatari).
Controllare l'utilizzo dei dati condivisi
Se si ha accesso a un'area di lavoro Azure Databricks, è possibile usare Azure Databricks log di controllo per comprendere chi nell'organizzazione accede ai dati usando OpenSharing. Vedere Controllare e monitorare la condivisione dei dati.