Nota
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare ad accedere o modificare le directory.
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare a modificare le directory.
Questo articolo descrive i criteri di manutenzione del modello per le API del modello di base con pagamento in base al token, le API del modello di base con portata provisionata e l'ottimizzazione fine-tuning del modello di base.
Per continuare a supportare i modelli più all'avanguardia, Databricks potrebbe aggiornare i modelli supportati o ritirare i modelli meno recenti per queste offerte.
Politica di pensionamento del modello
I criteri di ritiro del modello spiegano in che modo Databricks notifica quando un modello supportato viene impostato per il ritiro, cosa accade durante il periodo di transizione e cosa aspettarsi alla data di ritiro. Le sequenze temporali differiscono per offerta e categoria di modelli, come riepilogato nelle sezioni seguenti.
Per i modelli attualmente ritirati e le date di ritiro pianificate, vedere Modelli ritirati. Per i modelli di partner, vedere Criteri di ritiro del modello di partner.
Importante
Le politiche di ritiro che si applicano alle API del Modello di Base a pagamento per token e alle offerte di ottimizzazione del Modello di Base influiscono solo sui modelli di chat e di completamento supportati.
API del modello di base con pagamento in base al token
La tabella seguente riepiloga i criteri di ritiro per le API del modello foundation con pagamento in base al token.
| Notifica di ritiro | Transizione al ritiro | Data di pensionamento |
|---|---|---|
Databricks esegue i passaggi seguenti per notificare ai clienti un modello impostato per il ritiro:
|
Databricks ritirerà il modello in tre mesi. Durante questo periodo di tre mesi, i clienti possono:
|
Il modello non è più disponibile per l'uso e rimosso dal prodotto. La documentazione applicabile viene aggiornata per consigliare l'uso di un modello sostitutivo. |
API per modelli fondamentali con throughput allocato
La tabella seguente riepiloga la politica di dismissione per le API del modello di base con throughput provisionato.
| Notifica di ritiro | Transizione al ritiro | Data di pensionamento |
|---|---|---|
Databricks esegue i passaggi seguenti per notificare ai clienti un modello impostato per il ritiro:
|
Databricks ritirerà il modello in sei mesi. Durante questo periodo di sei mesi:
|
Il modello non è più disponibile per l'uso e rimosso dal prodotto.
|
Criteri di ritiro del modello di partner
I modelli partner sono modelli forniti da partner di terze parti, in particolare OpenAI, Anthropic e Google, disponibili tramite le API del modello di base. Per questi modelli partner, Databricks segue in genere le stesse sequenze temporali e criteri di deprecazione descritti per i modelli di velocità effettiva con provisioning e pagamento per token.
Tuttavia, le date di ritiro fornite dai partner potrebbero essere più brevi dei periodi di transizione pubblicati da Databricks. In questi casi, Databricks tenta di colmare il divario reindirizzando temporaneamente i modelli a una versione simile, in modo che i clienti ricevano il tempo di transizione completo.
Ad esempio, se una deprecazione di un modello con pagamento in base al token viene annunciata con lead time di un mese anziché tre, Databricks reindirizza il modello per altri due mesi per evitare interruzioni immediate e consentire il tempo per la migrazione. Le query hanno esito negativo alla fine del periodo di tre mesi completo.
Note
Questo reindirizzamento può verificarsi solo se il modello di sostituzione ha lo stesso prezzo ed è compatibile con le versioni precedenti. Il modello di sostituzione è in genere una versione incrementale del modello, ad esempio 3.0 e 3.1.
Ottimizzazione del modello di base
La tabella seguente riepiloga la politica di pensionamento per l'ottimizzazione del modello di base.
| Notifica di ritiro | Transizione al ritiro | Data di pensionamento |
|---|---|---|
Databricks esegue i passaggi seguenti per notificare ai clienti un modello impostato per il ritiro:
|
Databricks ritira il modello in tre mesi. Durante questo periodo di tre mesi, i clienti possono eseguire la migrazione dei flussi di lavoro esistenti per usare i modelli di sostituzione consigliati. | Il modello non è più disponibile per l'uso e rimosso dal prodotto. La documentazione applicabile viene aggiornata per consigliare l'uso di un modello sostitutivo. |
Aggiornamenti del modello
Databricks potrebbe inviare aggiornamenti incrementali del modello per offrire ottimizzazioni. Quando un modello viene aggiornato, l'URL dell'endpoint rimane invariato, ma l'ID modello nell'oggetto risposta cambia in modo da riflettere la data dell'aggiornamento. Ad esempio, se un aggiornamento viene fornito a meta-llama/Meta-Llama-3.3-70B il 3/4/2024, il nome del modello nell'oggetto risposta viene aggiornato a meta-llama/Meta-Llama-3.3-70B-030424. Databricks gestisce una cronologia delle versioni degli aggiornamenti a cui è possibile fare riferimento.
modelli ritirati
Le sezioni seguenti riepilogano i ritiri dei modelli correnti e futuri per le offerte di funzionalità indicate.
Ritiri delle API del modello di base con pagamento in base al token
La tabella seguente illustra i ritiri dei modelli, le date di ritiro e i modelli di sostituzione consigliati da usare per le API modello di base che pagano per token i carichi di lavoro. Databricks consiglia di eseguire la migrazione delle applicazioni per l'uso di modelli sostitutivi prima della data di ritiro indicata.
| Modello partner | Data di ritiro | Modello di sostituzione consigliato |
|---|---|---|
| Anthropic Claude 3.7 Sonnet | 12 aprile 2026 | Utilizza il modello Claude Sonnet più recente |
| Modello aperto | Data di ritiro | Modello di sostituzione consigliato |
|---|---|---|
| Meta Llama 3.1 405B | 15 febbraio 2026 | OpenAI GPT OSS 120B |
| DBRX Istruzioni | 30 aprile 2025 | Meta-Llama-4-Maverick |
| Mixtral-8x7B Istruzioni | 30 aprile 2025 | Meta-Llama-4-Maverick |
| Meta-Llama-3.1-70B-Instruct | 11 dicembre 2024 | Meta-Llama-4-Maverick |
| Meta-Llama-3-70B-Instruct | 23 luglio 2024 | Meta-Llama-4-Maverick |
| Meta-Llama-2-70B-Chat | 30 ottobre 2024 | Meta-Llama-4-Maverick |
| Istruzioni MPT 7B | 30 agosto 2024 | Meta-Llama-4-Maverick |
| Istruzioni MPT 30B | 30 agosto 2024 | Meta-Llama-4-Maverick |
Se hai bisogno di supporto a lungo termine per una versione specifica del modello, Databricks consiglia di utilizzare le API del modello di base per la velocità effettiva con provisioning per i carichi di lavoro di servizio.
Disattivazione della capacità di throughput fornita nelle API del Modello Fondamentale
La tabella seguente illustra le dismissioni della famiglia di modelli, le date di dismissione e i modelli di sostituzione consigliati da usare per le API del modello foundation con fornitura di throughput per gestire carichi di lavoro. Databricks consiglia di eseguire la migrazione delle applicazioni per l'uso di modelli sostitutivi prima della data di ritiro indicata.
| Modello partner | Data di ritiro | Modello di sostituzione consigliato |
|---|---|---|
| Gemini 3 Pro | 26 marzo 2026 | Gemini 3.1 Pro. Per consentire più tempo per la migrazione, tra il 26 marzo 2026 e il 7 giugno 2026, le chiamate API a Gemini 3 Pro verranno reindirizzate temporaneamente a Gemini 3.1 Pro. I prezzi per entrambi i modelli sono identici. |
| Apri famiglia di modelli | Data di ritiro | Modello di sostituzione consigliato |
|---|---|---|
| Meta Llama 3.1 405B | 15 maggio 2026 | OpenAI GPT OSS 120B |
| Meta Llama 3 70B | 27 febbraio 2026 | Modello paragonabile alla stessa offerta, ad esempio Llama 3.2, 3.3 o 4 di dimensioni simili. |
| Meta Llama 3 8B | 27 febbraio 2026 | Modello paragonabile alla stessa offerta, ad esempio Llama 3.2, 3.3 o 4 di dimensioni simili. |
| Meta Llama 2 70B | 27 febbraio 2026 | Modello paragonabile alla stessa offerta, ad esempio Llama 3.2, 3.3 o 4 di dimensioni simili. |
| Meta Llama 2 13B | 27 febbraio 2026 | Modello paragonabile alla stessa offerta, ad esempio Llama 3.2, 3.3 o 4 di dimensioni simili. |
| Meta Llama 2 7B | 27 febbraio 2026 | Modello paragonabile alla stessa offerta, ad esempio Llama 3.2, 3.3 o 4 di dimensioni simili. |
| Mixtral 8x7B | 27 febbraio 2026 | Modello paragonabile alla stessa offerta, ad esempio Llama 3.2, 3.3 o 4 di dimensioni simili. |
| Mistral 7B | 27 febbraio 2026 | Modello paragonabile alla stessa offerta, ad esempio Llama 3.2, 3.3 o 4 di dimensioni simili. |
| DBRX | 19 dicembre 2025 | Modello paragonabile alla stessa offerta, ad esempio Llama 3.2, 3.3 o 4 di dimensioni simili. |
| MPT 30B | 19 dicembre 2025 | Modello paragonabile alla stessa offerta, ad esempio Llama 3.2, 3.3 o 4 di dimensioni simili. |
| MPT 7B | 19 dicembre 2025 | Modello paragonabile alla stessa offerta, ad esempio Llama 3.2, 3.3 o 4 di dimensioni simili. |
Ritiri del modello di base
La tabella seguente illustra le famiglie di modelli ritirati, le date di ritiro e le famiglie di modelli di sostituzione consigliate da usare per i carichi di lavoro di ottimizzazione del modello foundation. Databricks consiglia di eseguire la migrazione delle applicazioni per l'uso di modelli sostitutivi prima della data di ritiro indicata.
| Famiglia di modelli | Data di ritiro | Famiglia di modelli di sostituzione consigliata |
|---|---|---|
| DBRX | 30 aprile 2025 | Llama-3.1-70B |
| Mixtral | 30 aprile 2025 | Llama-3.1-70B |
| Maestrale | 30 aprile 2025 | Llama-3.1-8B |
| Meta-Llama-3.1-405B | 30 gennaio 2025 | Llama-3.1-70B |
| Meta-Llama-3 | 7 gennaio 2025 | Meta-Llama-3.1 |
| Meta-Llama-2 | 7 gennaio 2025 | Meta-Llama-3.1 |
| Code Llama | 7 gennaio 2025 | Meta-Llama-3.1 |
Trovare carichi di lavoro che usano modelli ritirati
Usare la query seguente per trovare i carichi di lavoro che usano modelli deprecati e identificare i proprietari.
SELECT
eu.requester,
se.endpoint_name,
se.entity_name,
COUNT(*) AS request_count,
SUM(eu.input_token_count) AS total_input_tokens,
SUM(eu.output_token_count) AS total_output_tokens,
MIN(eu.request_time) AS first_request,
MAX(eu.request_time) AS last_request
FROM system.serving.endpoint_usage eu
JOIN system.serving.served_entities se
ON eu.served_entity_id = se.served_entity_id
WHERE LOWER(se.entity_name) LIKE '%<retired-model-name>%'
GROUP BY eu.requester, se.endpoint_name, se.entity_name
ORDER BY request_count DESC