RAID 5: O Equilíbrio entre Desempenho e Custo Ainda Vale a Pena?
Descubra se o RAID 5 ainda vale a pena. Análise técnica de paridade, performance e riscos de reconstrução para Sysadmins veteranos.
O Cavalo de Batalha do Storage
Durante décadas, o RAID 5 foi a resposta automática para qualquer departamento de TI que queria redundância sem estourar o orçamento. A premissa vendida pelos fabricantes é sedutora: você sacrifica a capacidade de apenas um disco para ter tolerância a falhas.
Tecnicamente, ele se posiciona como o meio-termo: exige no mínimo 3 discos e distribui a paridade entre todos os drives. É a alternativa econômica ao desperdício de espaço do RAID 1 (espelhamento) e à roleta russa do RAID 0 (desempenho bruto). No papel, parece o equilíbrio perfeito. Na prática, foi o rei do storage na era dos discos pequenos, mas a realidade atual transformou essa "economia" em um risco calculado que muitos ignoram.
Arquitetura: Como Funciona a Paridade Distribuída

Esqueça a ideia de um "disco de backup" dedicado. O RAID 5 opera com striping em nível de bloco combinado com paridade rotativa. Diferente do RAID 3 ou 4, que criam um gargalo de escrita num único drive de paridade, o RAID 5 espalha essa responsabilidade (e o desgaste) por todos os membros do array.
O funcionamento é pura matemática booleana (XOR). O controlador divide os dados em blocos e os grava sequencialmente nos discos, reservando um bloco em cada "stripe" (faixa) para a paridade. Essa paridade nunca fica no mesmo disco consecutivamente; ela rotaciona.
O resultado prático:
Redundância: Se um drive falha, o controlador lê os dados e a paridade dos discos sobreviventes e reconstrói os bits perdidos "on the fly".
Capacidade: Você sacrifica a capacidade equivalente a um disco. Em um array de 5 drives de 1TB, você tem 4TB úteis. A fórmula é sempre (N-1).
A segurança reside na matemática, não na duplicidade física. O sistema aguenta a perda de apenas um drive. Perdeu o segundo durante o rebuild? Seus dados viraram lixo digital.
Vantagens: Leitura Rápida e Custo-Benefício

Vamos ser honestos: a única razão pela qual o RAID 5 ainda respira em datacenters modernos é a planilha de custos.
Para leitura, ele entrega o que promete. Como os dados são distribuídos via striping por todos os discos, as cabeças de leitura trabalham em paralelo. O desempenho em reads sequenciais é excelente, chegando muito perto de um RAID 0. Se o seu workload é 90% leitura (servidores web estáticos, arquivos mortos), ele funciona.
A "mágica" econômica está na capacidade. Enquanto o RAID 10 devora 50% do seu armazenamento bruto para redundância, o RAID 5 sacrifica apenas a capacidade de um único disco (N-1), independentemente do tamanho do array. Isso faz com que o custo por Gigabyte seja imbatível para arrays grandes.
No entanto, essa eficiência cobra um preço alto quando a física entra em jogo.
O marketing vende a economia de espaço, mas esquece de mencionar que essa paridade distribuída transforma a reconstrução em um pesadelo matemático para a controladora, expondo o array ao momento de maior vulnerabilidade possível.
O Pesadelo do Sysadmin: Penalidade de Escrita e URE
Esqueça o folheto de vendas. O RAID 5 esconde dois problemas estruturais que transformam sua infraestrutura em uma bomba relógio.
Primeiro, a Penalidade de Escrita. Não existe "apenas gravar" em RAID 5. O sistema é forçado ao ciclo Read-Modify-Write: ler o dado antigo, ler a paridade antiga, calcular a nova, gravar o novo dado e gravar a nova paridade. Uma única solicitação de escrita gera quatro operações de I/O no disco. Se você colocar um banco de dados transacional ou VMs aqui, o desempenho vai rastejar.
Segundo, e fatal: o URE (Unrecoverable Read Error). Quando um disco falha, sua redundância é zero. Para o rebuild, a controladora precisa ler cada bit dos discos restantes.
A matemática é cruel com discos mecânicos acima de 4TB. A taxa de erro padrão de discos SATA (1 erro a cada $10^{14}$ bits lidos) garante estatisticamente que você encontrará um setor ilegível durante a leitura intensiva de um rebuild de alta capacidade. Se isso acontecer, o processo para. O array quebra. RAID 5 com discos grandes não é segurança, é roleta russa.
Veredito: Cenários de Uso Modernos
Vamos ser curtos e grossos: a matemática do RAID 5 é impiedosa. A economia de um disco extra não paga o custo do downtime ou da perda de dados em cenários errados. O marketing adora vender capacidade, mas esquece de mencionar o risco de URE (Erro de Leitura Irrecuperável) durante a reconstrução.
Aqui está a realidade nua e crua:
Onde Ainda Faz Sentido:
Arrays All-Flash (SSDs/NVMe): É a única salvação do RAID 5 em produção. A velocidade insana dos SSDs reduz o tempo de rebuild drásticamente, fechando a janela de vulnerabilidade antes que um segundo disco falhe.
Servidores de Mídia/Arquivos Estáticos (WORM): Cenários de "Write Once, Read Many". Se a carga é 90% leitura e os dados não são críticos para a sobrevivência da empresa (ex: streaming local), o risco é aceitável.
Backups Secundários: Apenas para a cópia da cópia. Se o seu backup primário está em RAID 5 com discos mecânicos, você está jogando roleta russa.
Onde é Negligência:
HDDs SATA de Alta Capacidade (>4TB): Evite como a peste. O tempo de reconstrução de um disco de 10TB ou 16TB leva dias. Estatisticamente, a chance de um erro de leitura ocorrer no meio desse processo e destruir o array inteiro é altíssima. Use RAID 6 ou 10.
Bancos de Dados e VMs Transacionais: A penalidade de cálculo de paridade na escrita vai destruir sua performance de IOPS. Não importa o cache que o vendedor prometeu, a física não muda.
Resumo: Se não for Flash ou dados descartáveis, pague pelo disco extra e use RAID 6 ou 10.
Priya Patel
Data Center Operations Lead
Gerencia milhares de discos físicos. Sabe exatamente qual modelo de HDD vibra mais e qual SSD morre primeiro.