Usare modelli predefiniti
Tip
Per altri dettagli, vedi la scheda Testo e immagini .
I modelli predefiniti in Azure Document Intelligence consentono di estrarre dati da tipi di modulo comuni senza eseguire il training dei propri modelli. Microsoft esegue il training di questi modelli su un numero elevato di documenti di esempio, in modo da poter prevedere risultati accurati e affidabili per i tipi di documento standard.
Modelli di analisi dei documenti
Prima di esaminare i modelli predefiniti specifici del dominio, è importante comprendere i modelli di analisi dei documenti che li supportano.
Modello di lettura
Il modello di lettura estrae testo stampato e scritto a mano da documenti e immagini. Rileva la lingua di ogni riga di testo e classifica se il testo viene scritto a mano o stampato. Il modello di lettura viene usato come base per l'estrazione di testo in tutti gli altri modelli di Document Intelligence.
Per i file PDF a più pagine o TIFF, è possibile usare il pages parametro nella richiesta per specificare un intervallo di pagine per l'analisi.
Il modello di lettura è ideale quando si vogliono estrarre parole e righe da documenti senza struttura fissa o prevedibile.
Modello di layout
Il modello di layout estende l'estrazione di testo del modello di lettura con il rilevamento di segni di selezione, tabelle e informazioni sulla struttura del documento. Supporta anche una funzionalità facoltativa keyValuePairs per estrarre coppie chiave-valore.
Quando si digitalizza un documento, potrebbe essere angolato o le tabelle potrebbero avere strutture complesse con celle unite o righe incomplete. Il modello di layout può gestire queste difficoltà. Ogni cella della tabella viene estratta con il contenuto, la posizione del rettangolo delimitatore e gli indici di riga/colonna.
Gli indicatori di selezione (caselle di controllo e pulsanti di opzione) vengono estratti con il rettangolo delimitatore, il livello di attendibilità e lo stato selezionato/non selezionato relativi.
Annotazioni
Il modello di documento generale era disponibile nelle versioni precedenti di Document Intelligence, ma era deprecato nella 2023-10-31-preview versione. La funzionalità per l'estrazione di coppie chiave-valore ed entità è stata incorporata nel modello di layout e in altre funzionalità.
Modelli predefiniti per tipi di documento specifici
Azure Document Intelligence include modelli predefiniti addestrati su tipi di documento specifici. I modelli predefiniti seguenti sono alcuni esempi disponibili per estrarre campi da documenti aziendali comuni:
Documenti finanziari e legali
| Modello | Descrizione |
|---|---|
| Fattura | Estrae il nome del cliente, i dettagli del fornitore, il numero dell'ordine di acquisto, le date di fatturazione e di scadenza, gli indirizzi di fatturazione e spedizione, gli articoli e i totali. |
| Ricevuta | Estrae i dettagli dei commercianti, la data e l'ora delle transazioni, gli elementi di riga e i totali. Supporta l'elaborazione della ricevuta di hotel a pagina singola. |
| Estratto conto bancario | Estrae informazioni sul conto, saldi iniziali e finali e dettagli delle transazioni. |
| Controlla | Estrae beneficiario, importo, data e altre informazioni pertinenti. |
| Bozza di pagamento | Estrae retribuzioni, ore, detrazioni, retribuzione netta e altri campi comuni della busta paga. |
| Carta di credito | Estrae le informazioni sulla carta di pagamento. |
| Contratto | Estratti dettagli del contratto e delle parti. |
Documenti fiscali statunitensi
| Modello | Descrizione |
|---|---|
| Imposta unificata degli Stati Uniti | Modello singolo che estrae da qualsiasi tipo di modulo fiscale degli Stati Uniti supportato. |
| W-2 | Estrae i dettagli del compenso imponibile. |
| 1098 e varianti | Estrae interessi ipotecari e dettagli correlati. |
| 1099 e varianti | Estrae il reddito da varie fonti. |
| 1040 e varianti | Estrae i dettagli della dichiarazione dei redditi individuale. |
Documenti ipotecari statunitensi
| Modello | Descrizione |
|---|---|
| 1003 (URLA) | Estrae i dettagli della domanda di prestito. |
| 1004 (URAR) | Estrae informazioni dalle valutazioni di proprietà. |
| 1005 | Estrae informazioni sulla convalida dell'impiego. |
| 1008 | Estrae i dettagli della trasmissione dei prestiti. |
| Informativa di chiusura | Estrae le condizioni finali della chiusura del prestito. |
Documenti di identificazione personali
| Modello | Descrizione |
|---|---|
| Documento di identità | Estrae i dettagli dalle licenze di conducente degli Stati Uniti, dagli ID dell'Unione europea e dalle licenze di guida e dai passaporti internazionali. Include nomi, date di nascita, numeri di documento e approvazioni o restrizioni. |
| Tessera sanitaria | Estrae campi comuni dalle carte di assicurazione sanitaria degli Stati Uniti. |
| Certificato di matrimonio | Estratte informazioni certificate sul matrimonio. |
Importante
Il modello di documento ID estrae le informazioni personali coperte dalle leggi sulla protezione dei dati nella maggior parte delle giurisdizioni. Assicurarsi di disporre dell'autorizzazione dell'utente per archiviare i propri dati e che siano conformi a tutti i requisiti legali applicabili.
Funzionalità dei modelli predefiniti
I modelli predefiniti sono progettati per estrarre tipi diversi di dati dai documenti. Queste funzionalità includono:
- Estrazione di testo: tutti i modelli predefiniti estraggono righe e parole da testo scritto a mano e stampato.
- Coppie chiave-valore: intervalli di testo che identificano un'etichetta e la relativa risposta. Ad esempio, Peso e 31 kg.
- Segni di selezione: caselle di controllo e pulsanti di opzione, incluso se sono selezionati o meno.
- Tabelle: dati in celle, inclusi il numero di colonne e righe, intestazioni di colonna e di riga e celle unite.
-
Campi: i modelli sottoposti a training per un tipo di modulo specifico identificano un set fisso di campi. Ad esempio, il modello di fattura estrae
CustomerNameeInvoiceTotal.
Quando usare modelli predefiniti e personalizzati
I modelli predefiniti coprono i tipi di documento più comuni. Se si dispone di un tipo di modulo specifico del settore o univoco, è possibile ottenere risultati più accurati con un modello personalizzato. Tuttavia, i modelli personalizzati richiedono tempo e dati di esempio per il training. Controllare sempre se esiste un modello predefinito per lo scenario prima di investire nello sviluppo di modelli personalizzati.
Ulteriori informazioni
- Modelli predefiniti di Document Intelligence di Azure
- Modello di lettura di Azure Document Intelligence
- Modello di layout di Azure Document Intelligence
- Modello di fattura di Azure Document Intelligence
- Modello di ricevuta di Azure Document Intelligence
- Modello di documento ID di Document Intelligence di Azure