Visione artificiale

Completato

Tip

Per altri dettagli, vedi la scheda Testo e immagini .

Visione artificiale è l'area dell'intelligenza artificiale che si occupa dell'analisi dell'input visivo; ad esempio fotografie, video e feed di fotocamere live.

Ad esempio, è possibile estendere il sito della cronologia di calcolo per consentire agli utenti di caricare immagini di computer vintage, che possono essere analizzati, identificati e descritti.

Screenshot di un sito sulla storia dell'informatica che esegue l'analisi delle immagini.

Come funziona visione artificiale?

La visione artificiale viene eseguita usando un numero elevato di immagini per eseguire il training di un modello.

Diagramma di un modello di visione artificiale sottoposto a training con un volume elevato di immagini.

Esistono più tipi di modello di visione artificiale.

  • La classificazione delle immagini è una forma di visione artificiale in cui viene eseguito il training di un modello con immagini etichettate con l'oggetto principale dell'immagine (in altre parole, quello di cui è un'immagine) in modo che possa analizzare immagini senza etichetta e prevedere l'etichetta più appropriata, identificando l'oggetto dell'immagine.
  • Il rilevamento degli oggetti è una forma di visione artificiale in cui viene eseguito il training del modello per identificare la posizione di oggetti specifici in un'immagine.
  • La segmentazione semantica è una forma avanzata di rilevamento degli oggetti in cui, anziché indicare la posizione di un oggetto disegnando una casella intorno, il modello può identificare i singoli pixel nell'immagine che appartengono a un oggetto specifico.
  • I modelli multi modali combinano caratteristiche visive e descrizioni di testo associate, consentendo loro di generare descrizioni complete delle immagini.

Scenari di visione artificiale

Gli usi comuni della visione artificiale includono:

  • Agenti di intelligenza artificiale che possono interpretare l'input visivo.
  • Creazione automatica di didascalie o generazione di tag per le fotografie.
  • Ricerca visiva.
  • Monitoraggio dei livelli delle scorte o identificazione degli articoli per il checkout negli scenari di vendita al dettaglio.
  • Monitoraggio video di sicurezza.
  • Autenticazione tramite riconoscimento facciale.
  • Robotica e veicoli auto-guida.