Che cos'è Azure Document Intelligence?

Completato

Suggerimento

Per altri dettagli, vedi la scheda Testo e immagini .

Azure Document Intelligence è un servizio di intelligenza artificiale basato sul cloud in Microsoft Foundry che usa modelli di OCR e Deep Learning per estrarre testo, coppie chiave-valore, contrassegni di selezione e tabelle dai documenti.

OCR acquisisce la struttura del documento creando rettangoli di selezione attorno agli oggetti rilevati in un'immagine. Le posizioni dei rettangoli di selezione vengono registrate come coordinate in relazione al resto della pagina. Azure Document Intelligence restituisce i dati del rettangolo delimitatore e altre informazioni in un formato JSON strutturato che mantiene le relazioni dal documento originale.

Screenshot che mostra Document Intelligence mentre analizza un documento di esempio con campi estratti e rettangoli di delimitazione.

Per creare un modello di estrazione di documenti ad alta accuratezza da zero, sono necessarie competenze di Deep Learning, grandi quantità di calcolo e tempi di training lunghi. Azure Document Intelligence offre modelli sottostanti già sottoposti a training su migliaia di esempi di modulo, in modo da ottenere un'estrazione dei dati con accuratezza elevata con un impegno minimo.

Componenti del servizio Document Intelligence

Azure Document Intelligence è costituito da tre categorie di modelli:

  • Modelli di analisi dei documenti: estrarre testo, struttura, tabelle e segni di selezione dai documenti. Il modello di lettura estrae il testo e rileva le lingue, mentre il modello di layout aggiunge l'estrazione di tabelle e strutture. Questi modelli verranno esaminati in dettaglio nell'unità Usa modelli predefiniti .

  • Modelli predefiniti: estrarre informazioni da tipi di documenti comuni, ad esempio fatture, ricevute, moduli fiscali, documenti ID e altro ancora, senza necessità di formazione. Verrà visualizzato l'elenco completo dei modelli predefiniti disponibili nell'unità Usa modelli predefiniti .

  • Modelli personalizzati: estrarre dati da moduli specifici dell'azienda usando set di dati etichettati personalizzati. Le opzioni includono modelli modello personalizzati (veloci ed economici per layout fissi), modelli neurali personalizzati (accuratezza più elevata per layout diversi), modelli composti e classificatori personalizzati. Verranno fornite informazioni sul training e sull'uso di modelli personalizzati nell'unità Eseguire il training e usare modelli personalizzati .

Accedere ai servizi di Intelligence sui documenti

È possibile accedere ad Intelligence documenti di Azure in diversi modi:

  • API REST: chiamare il servizio direttamente usando le richieste HTTP.
  • SDK della libreria client: usare SDK per Python, C#, Java e JavaScript.
  • Document Intelligence Studio: strumento online per l'esplorazione visiva, il test e la creazione di soluzioni di Business Intelligence per documenti.
  • Portale di Microsoft Foundry: integrare Document Intelligence con altri strumenti foundry.

Suggerimento

Questo esercizio del modulo è incentrato su Python SDK. I servizi REST sottostanti possono essere usati da qualsiasi linguaggio.

Creare una risorsa di Informazioni sui documenti

Per usare Azure Document Intelligence, è necessaria una risorsa di Azure. È possibile usare una delle due operazioni seguenti:

  • Una risorsa Foundry: un abbonamento multiservizio che fornisce l'accesso a più servizi di intelligenza artificiale attraverso un unico endpoint e una singola chiave.
  • Una risorsa di Intelligence sui documenti di Azure: una risorsa a servizio singolo usata solo con Document Intelligence.

Annotazioni

Creare una risorsa Foundry se hai intenzione di accedere a più strumenti Foundry tramite un unico endpoint e una singola chiave. Solo per l'accesso a Document Intelligence, creare una risorsa di Document Intelligence dedicata.

Requisiti di input

Azure Document Intelligence funziona sui documenti di input che soddisfano questi requisiti:

  • Il formato deve essere JPEG, PNG, BMP, PDF (testo o digitalizzato) o TIFF. Il modello di lettura accetta anche i formati di file di Microsoft Office.
  • Le dimensioni del file devono essere inferiori a 500 MB per il livello standard e 4 MB per il livello gratuito.
  • Per le immagini, le dimensioni devono essere comprese tra 50 x 50 pixel e 10.000 x 10.000 pixel.
  • I documenti PDF devono avere dimensioni inferiori a 17 x 17 pollici (formato carta A3).
  • I documenti PDF non devono essere protetti da password.

Ulteriori informazioni