Configura OpenSharing per il tuo account (per i provider)

Questa pagina descrive come configurare OpenSharing in Azure Databricks per i provider di dati (organizzazioni che vogliono usare OpenSharing per condividere i dati in modo sicuro).

Se si è un destinatario di dati (un'organizzazione che riceve dati condivisi con OpenSharing), vedere Leggere i dati condivisi con Databricks-to-Databricks OpenSharing (per i destinatari).

Importante

OpenSharing richiede un'area di lavoro con Unity Catalog abilitato. È possibile creare un'area di lavoro abilitata per il catalogo unity per la gestione delle condivisioni. In alcuni account, le nuove aree di lavoro vengono abilitate automaticamente per Unity Catalog. Consulta Introduzione al Catalogo Unity.

Se la creazione di una nuova area di lavoro abilitata per Il catalogo unity non è un'opzione, è possibile usare il progetto OpenSharing open source per distribuire il proprio server OpenSharing per condividere tabelle Delta da qualsiasi piattaforma.

L'installazione iniziale del provider include i passaggi seguenti:

  1. Abilita OpenSharing in un metastore di Unity Catalog.
  2. (Facoltativo) Installare la CLI di Unity Catalog.
  3. Concedere privilegi per creare e gestire condivisioni e destinatari.
  4. Configurare la durata del tempo di vita (TTL) della materializzazione dei dati.
  5. Configurare l'accesso alla rete di archiviazione.

Requisiti

In qualità di provider di dati che configura l'account Azure Databricks per poter condividere i dati, è necessario disporre di:

Abilitare OpenSharing in un metastore

Non è necessario abilitare OpenSharing nel metastore se si intende usare OpenSharing solo per condividere i dati con gli utenti in altri metastore di Unity Catalog nell'account. La condivisione da metastore a metastore all'interno di un singolo account Azure Databricks è abilitata per impostazione predefinita.

In caso contrario, seguire questa procedura per ogni metastore di Unity Catalog che gestisce i dati che si prevede di condividere con OpenSharing.

  1. Come amministratore dell'account Azure Databricks accedere alla console account.

  2. Nella barra laterale fare clic sull'icona Dati.Catalogo.

  3. Fare Clic sul nome di un metastore per aprirne i dettagli.

  4. Fare clic sulla casella di controllo accanto a Consenti OpenSharing con parti esterne all'organizzazione.

  5. Configurare la durata del token del destinatario.

    Questa configurazione imposta il periodo di tempo dopo il quale tutti i token del destinatario scadono e devono essere rigenerati. I token dei destinatari vengono usati solo nel protocollo di condivisione da Databricks a Open . I token sono validi per un massimo di un anno dopo la creazione.

    Note

    La durata del token del destinatario per i destinatari esistenti non viene aggiornata automaticamente quando si modifica la durata predefinita del token del destinatario per un metastore. Per applicare una nuova durata del token a un determinato destinatario, è necessario ruotare il token. Vedere Gestire i token dei destinatari.

    Per impostare la durata predefinita del token del destinatario:

    1. Verificare che l'opzione Imposta scadenza sia abilitata (questa è l'impostazione predefinita).
    2. Immettere un numero di secondi, minuti, ore o giorni e selezionare l'unità di misura. I token sono validi per un massimo di un anno dopo la creazione.
    3. Fare clic su Abilita.

    Per altre informazioni, vedere Considerazioni sulla sicurezza per i token.

  6. Quando si condivide con un destinatario di Azure Databricks che non si trova nel tuo account, immettere un nome dell'organizzazione.

    Note

    Se si specifica un nome di organizzazione leggibile, i destinatari possono identificare i provider di condivisione e gli oggetti provider corrispondenti nell'elenco dei provider del destinatario.

  7. Fare clic su Abilita.

(Facoltativo) Installare la CLI di Unity Catalog

Per gestire condivisioni e destinatari, è possibile usare Esplora cataloghi, comandi SQL o l'interfaccia della riga di comando di Unity Catalog. La CLI viene eseguita nell'ambiente locale e non richiede risorse di calcolo Azure Databricks.

Per installare la CLI, consultare Databricks CLI.

Concedere l'autorizzazione per creare e gestire condivisioni e destinatari

Gli amministratori metastore hanno la possibilità di creare e gestire condivisioni e destinatari, inclusa la concessione di condivisioni ai destinatari. Molte attività del provider possono essere delegate da un amministratore del metastore usando i privilegi seguenti:

  • CREATE SHARE nel metastore concede la possibilità di creare condivisioni.
  • CREATE RECIPIENT nel metastore concede la possibilità di creare destinatari.
  • USE RECIPIENT consente la possibilità di elencare e visualizzare i dettagli di tutti i destinatari nel metastore.
  • USE SHARE nel metastore consente di elencare e visualizzare i dettagli di tutte le condivisioni nel metastore.
  • USE RECIPIENTe USE SHARE,SET SHARE PERMISSION offrono a un utente la possibilità di concedere l'accesso condiviso ai destinatari.
  • L'amministratore del metastore ha la possibilità di trasferire la proprietà di qualsiasi condivisione.
  • I proprietari delle condivisioni e i proprietari destinatari possono aggiornare tali oggetti e concedere condivisioni ai relativi destinatari. I creatori di oggetti ottengono la proprietà per impostazione predefinita, ma la proprietà può essere trasferita.
  • I proprietari della condivisione possono aggiungere tabelle e volumi alle condivisioni, purché abbiano SELECT accesso alle tabelle e READ VOLUME l'accesso ai volumi.

Per informazioni dettagliate, vedere Informazioni di riferimento sui privilegi del catalogo Unity e le autorizzazioni elencate per le attività OpenSharing descritte.

Configurare il TTL per la materializzazione dei dati

In qualità di amministratore dell'account di Azure Databricks o del metastore, puoi configurare il TTL della materializzazione dati, che determina per quanto tempo i risultati materializzati rimangono nella cache. Le materializzazioni si verificano quando un destinatario interroga viste dinamiche condivise, viste materializzate, tabelle di flusso e tabelle esterne. Per impostazione predefinita, la durata (TTL) è di otto ore. La cache stessa verrà rimossa dalla materializzazione dopo altre tre ore, fornendo tempo aggiuntivo per il completamento delle query esistenti.

Per modificare questo valore, eseguire le operazioni seguenti:

  1. Nell'area di lavoro Azure Databricks, fare clic su icona datiCatalogo per aprire Esplora Catalogo.

  2. Nella parte superiore del riquadro Catalogo, fare clic sull'icona a forma di ingranaggio. e selezionare OpenSharing.

    In alternativa, nell'angolo superiore destro fare clic su Condividi > OpenSharing.

  3. Nella scheda Condivisi con me, clicca sul nome dell'organizzazione nell'angolo superiore destro.

  4. Fare clic sull'icona a forma di ingranaggio. icona a forma di ingranaggio in alto a destra.

  5. Per Materialization TTL, immettere il valore TTL desiderato.

Consentire l'accesso alla rete di archiviazione

Se l'archiviazione cloud sottostante è configurata con i controlli di accesso, aggiungere la rete del destinatario all'elenco consenti in modo che possano leggere le tabelle condivise.

Tip

Anziché configurare manualmente le regole di rete e firewall per ogni destinatario, usare SecureConnect per brokerare l'accesso tramite un proxy gestito.

Per informazioni dettagliate, vedere Configurare firewall e reti virtuali di Archiviazione di Azure e Configurare un perimetro di sicurezza di rete Azure per le risorse di Azure.

Passaggi successivi