Nota
O acesso a esta página requer autorização. Pode tentar iniciar sessão ou alterar os diretórios.
O acesso a esta página requer autorização. Pode tentar alterar os diretórios.
Important
Este recurso está em versão Beta. Os administradores do espaço de trabalho podem controlar o acesso a esse recurso na página Visualizações . Ver Gerir as pré-visualizações de Azure Databricks.
Os exemplos seguintes são cargas de trabalho completas, de ponta a ponta, que submete a partir da air CLI com air run -f train.yaml. Cada exemplo mostra uma configuração real multi-GPU em GPUs H100, incluindo o ficheiro YAML da carga de trabalho, os comandos de inicialização e o código. Começa pelo quickstart se nunca enviaste uma tentativa antes.
| Example | Description |
|---|---|
| Afinação de LLM em vários nós com FSDP | Ajuste fino supervisionado do Llama-3.1-8B em 16 GPUs H100 (2 nós) usando torchrun e PyTorch Fully Sharded Data Parallel (FSDP). Regista em MLflow e pontos de verificação num volume do Unity Catalog. |
| Treino distribuído com Ray Train | Afinação fina distribuída com paralelismo de dados com o Ray Train TorchTrainer em 8 GPUs H100 num único nó, com um worker por GPU. |
| Inferência em lote com Ray Data e vLLM | Inferência em lote offline de LLM com Ray Data e vLLM em 8 GPUs H100 num único nó, executando uma réplica vLLM por GPU e escrevendo resultados num volume do Unity Catalog como Parquet. |