Criteri di manutenzione dei modelli di intelligenza artificiale generativi

Questo articolo descrive i criteri di manutenzione del modello per le API del modello di base con pagamento in base al token, le API del modello di base con portata provisionata e l'ottimizzazione fine-tuning del modello di base.

Per continuare a supportare i modelli più all'avanguardia, Databricks potrebbe aggiornare i modelli supportati o ritirare i modelli meno recenti per queste offerte.

Politica di pensionamento del modello

I criteri di ritiro del modello spiegano in che modo Databricks notifica quando un modello supportato viene impostato per il ritiro, cosa accade durante il periodo di transizione e cosa aspettarsi alla data di ritiro. Le sequenze temporali differiscono per offerta e categoria di modelli, come riepilogato nelle sezioni seguenti.

Per i modelli attualmente ritirati e le date di ritiro pianificate, vedere Modelli ritirati. Per i modelli di partner, vedere Criteri di ritiro del modello di partner.

Importante

Le politiche di ritiro che si applicano alle API del Modello di Base a pagamento per token e alle offerte di ottimizzazione del Modello di Base influiscono solo sui modelli di chat e di completamento supportati.

API del modello di base con pagamento in base al token

La tabella seguente riepiloga i criteri di ritiro per le API del modello foundation con pagamento in base al token.

Notifica di ritiro Transizione al ritiro Data di pensionamento
Databricks esegue i passaggi seguenti per notificare ai clienti un modello impostato per il ritiro:
  • Nella pagina Gestione dell'area di lavoro di Databricks viene visualizzato un messaggio di avviso nella scheda del modello che indica che il modello è pianificato per il ritiro.
  • La documentazione applicabile contiene un avviso che indica che il modello è previsto per il ritiro e la data a partire dalla quale non sarà più supportato.
Databricks ritirerà il modello in tre mesi. Durante questo periodo di tre mesi, i clienti possono:
  • Scegli la migrazione a un endpoint di throughput del modello foundation con API provisionate per continuare a usare il modello oltre la data di fine vita.
  • Eseguire la migrazione dei flussi di lavoro esistenti per usare i modelli di sostituzione consigliati.
Il modello non è più disponibile per l'uso e rimosso dal prodotto. La documentazione applicabile viene aggiornata per consigliare l'uso di un modello sostitutivo.

API per modelli fondamentali con throughput allocato

La tabella seguente riepiloga la politica di dismissione per le API del modello di base con throughput provisionato.

Notifica di ritiro Transizione al ritiro Data di pensionamento
Databricks esegue i passaggi seguenti per notificare ai clienti un modello impostato per il ritiro:
  • Per gli endpoint che servono un modello deprecato, viene visualizzato un messaggio di avviso nella pagina dei dettagli dell'endpoint che serve nell'area di lavoro di Databricks. Questo messaggio indica che il modello è pianificato per il ritiro e la data di ritiro applicabile.
  • Un tooltip fornisce modelli alternativi consigliati per il trasferimento dei carichi di lavoro.
  • La documentazione applicabile contiene un avviso che indica che il modello è previsto per il ritiro e la data a partire dalla quale non sarà più supportato.
Databricks ritirerà il modello in sei mesi. Durante questo periodo di sei mesi:
  • I clienti possono continuare a utilizzare gli endpoint di throughput con provisioning esistenti attraverso il modello deprecato fino alla data di cessazione.
  • I clienti che non utilizzano attivamente un modello deprecato non possono creare nuovi endpoint di throughput con provisioning o riavviare gli endpoint fermati per un modello deprecato.
Il modello non è più disponibile per l'uso e rimosso dal prodotto.
  • Tutti gli endpoint che usano il modello ritirato vengono trasferiti a uno stato di errore con un messaggio descrittivo. Eventuali richieste a questi endpoint avranno esito negativo.
  • Il cliente può eliminare gli endpoint che usano il modello ritirato, ma non può riavviarli.
  • La documentazione applicabile viene aggiornata per consigliare l'uso di un modello sostitutivo.

Criteri di ritiro del modello di partner

I modelli partner sono modelli forniti da partner di terze parti, in particolare OpenAI, Anthropic e Google, disponibili tramite le API del modello di base. Per questi modelli partner, Databricks segue in genere le stesse sequenze temporali e criteri di deprecazione descritti per i modelli di velocità effettiva con provisioning e pagamento per token.

Tuttavia, le date di ritiro fornite dai partner potrebbero essere più brevi dei periodi di transizione pubblicati da Databricks. In questi casi, Databricks tenta di colmare il divario reindirizzando temporaneamente i modelli a una versione simile, in modo che i clienti ricevano il tempo di transizione completo.

Ad esempio, se una deprecazione di un modello con pagamento in base al token viene annunciata con lead time di un mese anziché tre, Databricks reindirizza il modello per altri due mesi per evitare interruzioni immediate e consentire il tempo per la migrazione. Le query hanno esito negativo alla fine del periodo di tre mesi completo.

Note

Questo reindirizzamento può verificarsi solo se il modello di sostituzione ha lo stesso prezzo ed è compatibile con le versioni precedenti. Il modello di sostituzione è in genere una versione incrementale del modello, ad esempio 3.0 e 3.1.

Ottimizzazione del modello di base

La tabella seguente riepiloga la politica di pensionamento per l'ottimizzazione del modello di base.

Notifica di ritiro Transizione al ritiro Data di pensionamento
Databricks esegue i passaggi seguenti per notificare ai clienti un modello impostato per il ritiro:
  • Nella scheda Esperimenti viene visualizzato un messaggio di avviso nel menu a discesa per l'ottimizzazione del modello foundation che indica che il modello è pianificato per il ritiro.
  • La documentazione applicabile contiene un avviso che indica che il modello è previsto per il ritiro e la data a partire dalla quale non sarà più supportato.
Databricks ritira il modello in tre mesi. Durante questo periodo di tre mesi, i clienti possono eseguire la migrazione dei flussi di lavoro esistenti per usare i modelli di sostituzione consigliati. Il modello non è più disponibile per l'uso e rimosso dal prodotto. La documentazione applicabile viene aggiornata per consigliare l'uso di un modello sostitutivo.

Aggiornamenti del modello

Databricks potrebbe inviare aggiornamenti incrementali del modello per offrire ottimizzazioni. Quando un modello viene aggiornato, l'URL dell'endpoint rimane invariato, ma l'ID modello nell'oggetto risposta cambia in modo da riflettere la data dell'aggiornamento. Ad esempio, se un aggiornamento viene fornito a meta-llama/Meta-Llama-3.3-70B il 3/4/2024, il nome del modello nell'oggetto risposta viene aggiornato a meta-llama/Meta-Llama-3.3-70B-030424. Databricks gestisce una cronologia delle versioni degli aggiornamenti a cui è possibile fare riferimento.

modelli ritirati

Le sezioni seguenti riepilogano i ritiri dei modelli correnti e futuri per le offerte di funzionalità indicate.

Ritiri delle API del modello di base con pagamento in base al token

La tabella seguente illustra i ritiri dei modelli, le date di ritiro e i modelli di sostituzione consigliati da usare per le API modello di base che pagano per token i carichi di lavoro. Databricks consiglia di eseguire la migrazione delle applicazioni per l'uso di modelli sostitutivi prima della data di ritiro indicata.

Modello partner Data di ritiro Modello di sostituzione consigliato
Anthropic Claude 3.7 Sonnet 12 aprile 2026 Utilizza il modello Claude Sonnet più recente
Modello aperto Data di ritiro Modello di sostituzione consigliato
Meta Llama 3.1 405B 15 febbraio 2026 OpenAI GPT OSS 120B
DBRX Istruzioni 30 aprile 2025 Meta-Llama-4-Maverick
Mixtral-8x7B Istruzioni 30 aprile 2025 Meta-Llama-4-Maverick
Meta-Llama-3.1-70B-Instruct 11 dicembre 2024 Meta-Llama-4-Maverick
Meta-Llama-3-70B-Instruct 23 luglio 2024 Meta-Llama-4-Maverick
Meta-Llama-2-70B-Chat 30 ottobre 2024 Meta-Llama-4-Maverick
Istruzioni MPT 7B 30 agosto 2024 Meta-Llama-4-Maverick
Istruzioni MPT 30B 30 agosto 2024 Meta-Llama-4-Maverick

Se hai bisogno di supporto a lungo termine per una versione specifica del modello, Databricks consiglia di utilizzare le API del modello di base per la velocità effettiva con provisioning per i carichi di lavoro di servizio.

Disattivazione della capacità di throughput fornita nelle API del Modello Fondamentale

La tabella seguente illustra le dismissioni della famiglia di modelli, le date di dismissione e i modelli di sostituzione consigliati da usare per le API del modello foundation con fornitura di throughput per gestire carichi di lavoro. Databricks consiglia di eseguire la migrazione delle applicazioni per l'uso di modelli sostitutivi prima della data di ritiro indicata.

Modello partner Data di ritiro Modello di sostituzione consigliato
Gemini 3 Pro 26 marzo 2026 Gemini 3.1 Pro. Per consentire più tempo per la migrazione, tra il 26 marzo 2026 e il 7 giugno 2026, le chiamate API a Gemini 3 Pro verranno reindirizzate temporaneamente a Gemini 3.1 Pro. I prezzi per entrambi i modelli sono identici.
Apri famiglia di modelli Data di ritiro Modello di sostituzione consigliato
Meta Llama 3.1 405B 15 maggio 2026 OpenAI GPT OSS 120B
Meta Llama 3 70B 27 febbraio 2026 Modello paragonabile alla stessa offerta, ad esempio Llama 3.2, 3.3 o 4 di dimensioni simili.
Meta Llama 3 8B 27 febbraio 2026 Modello paragonabile alla stessa offerta, ad esempio Llama 3.2, 3.3 o 4 di dimensioni simili.
Meta Llama 2 70B 27 febbraio 2026 Modello paragonabile alla stessa offerta, ad esempio Llama 3.2, 3.3 o 4 di dimensioni simili.
Meta Llama 2 13B 27 febbraio 2026 Modello paragonabile alla stessa offerta, ad esempio Llama 3.2, 3.3 o 4 di dimensioni simili.
Meta Llama 2 7B 27 febbraio 2026 Modello paragonabile alla stessa offerta, ad esempio Llama 3.2, 3.3 o 4 di dimensioni simili.
Mixtral 8x7B 27 febbraio 2026 Modello paragonabile alla stessa offerta, ad esempio Llama 3.2, 3.3 o 4 di dimensioni simili.
Mistral 7B 27 febbraio 2026 Modello paragonabile alla stessa offerta, ad esempio Llama 3.2, 3.3 o 4 di dimensioni simili.
DBRX 19 dicembre 2025 Modello paragonabile alla stessa offerta, ad esempio Llama 3.2, 3.3 o 4 di dimensioni simili.
MPT 30B 19 dicembre 2025 Modello paragonabile alla stessa offerta, ad esempio Llama 3.2, 3.3 o 4 di dimensioni simili.
MPT 7B 19 dicembre 2025 Modello paragonabile alla stessa offerta, ad esempio Llama 3.2, 3.3 o 4 di dimensioni simili.

Ritiri del modello di base

La tabella seguente illustra le famiglie di modelli ritirati, le date di ritiro e le famiglie di modelli di sostituzione consigliate da usare per i carichi di lavoro di ottimizzazione del modello foundation. Databricks consiglia di eseguire la migrazione delle applicazioni per l'uso di modelli sostitutivi prima della data di ritiro indicata.

Famiglia di modelli Data di ritiro Famiglia di modelli di sostituzione consigliata
DBRX 30 aprile 2025 Llama-3.1-70B
Mixtral 30 aprile 2025 Llama-3.1-70B
Maestrale 30 aprile 2025 Llama-3.1-8B
Meta-Llama-3.1-405B 30 gennaio 2025 Llama-3.1-70B
Meta-Llama-3 7 gennaio 2025 Meta-Llama-3.1
Meta-Llama-2 7 gennaio 2025 Meta-Llama-3.1
Code Llama 7 gennaio 2025 Meta-Llama-3.1

Trovare carichi di lavoro che usano modelli ritirati

Usare la query seguente per trovare i carichi di lavoro che usano modelli deprecati e identificare i proprietari.

SELECT
   eu.requester,
   se.endpoint_name,
   se.entity_name,
   COUNT(*) AS request_count,
   SUM(eu.input_token_count) AS total_input_tokens,
   SUM(eu.output_token_count) AS total_output_tokens,
   MIN(eu.request_time) AS first_request,
   MAX(eu.request_time) AS last_request
 FROM system.serving.endpoint_usage eu
 JOIN system.serving.served_entities se
   ON eu.served_entity_id = se.served_entity_id
 WHERE LOWER(se.entity_name) LIKE '%<retired-model-name>%'
 GROUP BY eu.requester, se.endpoint_name, se.entity_name
 ORDER BY request_count DESC