Azure Instância Gerenciada para o modelo de responsabilidade compartilhada do Apache Cassandra

Introdução

Este documento define a divisão de responsabilidades entre Microsoft e clientes ao usar Azure Instância Gerenciada para o Apache Cassandra (MI do Cassandra).

O objetivo é fornecer clareza sobre:

  • Limites de propriedade operacional
  • Expectativas de desempenho e disponibilidade
  • Responsabilidades de segurança e conformidade

Important

  • Não há SLA de latência. O desempenho depende do SKU selecionado e das características da carga de trabalho.
  • Microsoft garante a disponibilidade do processo Cassandra, não o desempenho em nível de API nem a latência das consultas.
  • Problemas causados pela saturação de recursos (CPU, disco, memória, rede) devem ser investigados e mitigados pelo cliente. Microsoft fornece métricas e logs para dar suporte a essa análise.

Responsabilidades Microsoft

Microsoft opera e gerencia a infraestrutura subjacente do Cassandra MI. Esta responsabilidade inclui:

Infraestrutura e plataforma

  • Provisionamento de clusters, datacenters e nós do Cassandra
  • Gerenciamento do sistema operacional, patch e atualizações de segurança
  • Gerenciamento do ciclo de vida da infraestrutura de hardware e host
  • Isolamento de rede usando redes virtuais Azure (VNets)

Disponibilidade e SLA

  • Disponibilidade com suporte de SLA somente para datacenters de produção
  • O SLA aplica-se a:
    • Sistema operacional
    • Processo do Cassandra
    • Falhas de hardware
  • O SLA não aborda:
    • Esgotamento de recursos (CPU, disco, memória, rede)
    • Falhas no nível do aplicativo ou da consulta
  • Nenhum SLA para:
    • Clusters ou datacenters não de produção ou desalocados

Escalabilidade e versionamento

  • Dimensionamento de nós (adição ou remoção de nós) acionado por meio do portal do Azure ou de APIs
  • Disponibilidade de novas versões do Cassandra após versões estáveis do OSS
  • Remoção de versões preteridas das opções de provisionamento

Segurança e criptografia

  • Criptografia em repouso e em trânsito
  • Gerenciamento e rotação de certificados para TLS ou SSL
  • Verificação e correção contínuas de vulnerabilidades

Monitoramento e suporte

  • Integração com Azure Monitor para logs e métricas
  • Alertas proativos para interrupções no nível da plataforma
  • RCA (análise de causa raiz) para incidentes de plataforma que afetam a produção

Backup e restauração

  • Backups online automatizados com base em suas preferências de agendamento e retenção
  • Restauração de backup por meio de uma solicitação de suporte

Note

  • As CMK (Chaves Gerenciadas pelo Cliente) têm suporte para dados inativos.
  • No momento, o CMK não tem suporte para backups.

Responsabilidades do cliente

Você é responsável por todos os dados, esquema e operações no nível do aplicativo.

Modelagem de dados e design de consulta

  • Criando chaves de partição ideais e modelos de dados
  • Evitar partições quentes e consultas ineficientes
  • Ajuste de consulta e otimização de desempenho

Esquema e configuração

  • Gerenciamento de keyspaces, fatores de replicação e níveis de consistência
  • Realizando alterações no schema
  • Ajuste de estratégias de compactação e coleta de lixo (GC)
  • Sobrescrevendo as configurações padrão do Cassandra quando necessário

Desempenho e monitorização

  • Monitorização:

    • Uso da CPU
    • Uso de memória
    • Utilização de disco
    • IOPS e taxa de transferência
  • Investigando a latência usando:

    • Azure Monitor
    • Prometheus
    • Métricas do Cassandra
  • Tomando ações corretivas e preventivas

Planejamento de capacidade

  • Planejando o crescimento da taxa de transferência e do armazenamento
  • Dimensionamento de datacenters para cima ou para baixo conforme necessário

Note

Limitação de dimensionamento de armazenamento Você não pode modificar diretamente o tamanho do disco. Para alterar o tamanho do disco, você deve:

  • Criar um novo datacenter com o tamanho de disco desejado
  • Migrar cargas de trabalho

Atualizações de versão

  • Iniciando atualizações principais e secundárias (por exemplo, Cassandra 3.x → 5.x)
  • Validando a compatibilidade do aplicativo antes das atualizações

Note

Você é responsável pela indisponibilidade causada por versões desatualizadas ou descontinuadas.

Estratégia de backup

  • Defina agendas de backup e políticas de retenção.
  • Implementando a estratégia de recuperação de desastre (DR)

Rede

  • Configurando:

    • VNets, sub-redes e NSGs
    • Resolução de DNS
    • Regras de firewall
  • Configuração:

    • PN / ExpressRoute (se híbrido)

Segurança e acesso

  • Gerenciando usuários e funções de banco de dados
  • Implementando a criptografia no nível do aplicativo (se necessário)
  • Garantindo a conformidade com os requisitos regulatórios

Operations

  • Lidar com problemas no nível do aplicativo:

    • Tempos limite de consulta
    • Acúmulo de marca de exclusão
    • Inconsistências de dados
  • Usando ferramentas aprovadas (sem acesso SSH/JMX)

  • Analisando logs e agindo diante de anomalias


Responsabilidades compartilhadas

Algumas áreas exigem colaboração entre Microsoft e o cliente:

Monitoramento de segurança

  • Microsoft fornece logs e telemetria
  • Os clientes devem:
    • Revisar alertas
    • Investigar anomalias
    • Executar ações corretivas

Note

Se mTLS (TLS mútuo) for usado:

  • O ciclo de vida e a renovação do certificado do lado do cliente são responsabilidade do cliente

Implantações híbridas

  • A Microsoft gerencia nós hospedados no Azure
  • Os clientes gerenciam nós locais do Cassandra
  • A conectividade entre ambientes é uma responsabilidade compartilhada

Compliance

  • Microsoft garante a conformidade no nível da plataforma
  • Os clientes possuem:
    • Conformidade no nível do aplicativo
    • Políticas de governança de dados

Instruções de configuração

Espera-se que os clientes sigam as configurações recomendadas Microsoft, incluindo:

  • Regras de rede de saída obrigatórias
  • Práticas recomendadas de segurança e rede

Matriz de responsabilidades

Task Microsoft Customer
Provisionamento e gerenciamento de infraestrutura
Aplicação de patch no sistema operacional e no Cassandra
Backup (gerenciado pela plataforma)
Agendamento de backup de longo prazo
Design e otimização do modelo de dados
Atualizações de versão
Configuração de rede
Monitoramento e revisão de alertas
Conformidade e governança
Disponibilidade (SLA da plataforma)
Segurança

Alternativa: Azure Cosmos DB para NoSQL API

Azure Cosmos DB (API NoSQL) é uma alternativa totalmente gerenciada e nativa de nuvem com benefícios adicionais:

Benefit Description
Disponibilidade do SDK nativo SDKs para Java, .NET, Python, Node.js
Suporte de nível empresarial Suporte da Microsoft 24×7 com fluxos de escalonamento
Experiência Totalmente Gerenciada Aplicação de patch automatizada, backups, conformidade
Garantias <Latência de 10 ms, 99,999% de disponibilidade, garantias de consistência, consulte contratos de nível de serviço do Azure
Segurança Integrada > Conformidade Criptografia, identidade, certificações de conformidade global
Distribuição Global & Escalonamento Automático Replicação de várias regiões e dimensionamento automático