Introduzione
La trascrizione e la sintesi vocale sono funzionalità utili in molti scenari, tra cui:
- Documentare le conversazioni vocali nelle chiamate e nelle riunioni.
- Generazione di sottotitoli per video o presentazioni.
- Creazione di interfacce utente udibili per migliorare l'accessibilità delle applicazioni.
- Sviluppo di assistenti di intelligenza artificiale senza mani che leggono messaggi di testo o messaggi di posta elettronica ad alta voce.
In questo modulo verrà illustrato come usare modelli di intelligenza artificiale generativi con supporto vocale in Microsoft Foundry per convertire la voce in testo e testo in sintesi vocale.
Note
Sappiamo che persone diverse amano imparare in modi diversi. È possibile scegliere di completare questo modulo in formato basato su video oppure leggere il contenuto come testo e immagini. Il testo contiene maggiori dettagli rispetto ai video, quindi in alcuni casi potresti voler farvi riferimento come materiale supplementare alla presentazione video.