HAMR vs PMR: A verdade sobre a confiabilidade dos discos de 30TB+

      Carlos Ornelas 10 min de leitura
      HAMR vs PMR: A verdade sobre a confiabilidade dos discos de 30TB+

      Análise de campo detalhada comparando a confiabilidade da tecnologia HAMR (Seagate Mozaic 3+) contra o padrão PMR/ePMR. Dados de durabilidade do laser, densidade de área e TCO para data centers.

      Compartilhar:

      A barreira dos 30TB em um único disco rígido de 3,5 polegadas não é apenas um marco numérico; é o fim da linha para a física convencional como a conhecemos nas últimas duas décadas. Enquanto o mercado de consumo migra quase inteiramente para o armazenamento flash, o data center e o armazenamento frio (cold storage) enfrentam uma crise existencial de densidade. A tecnologia PMR (Perpendicular Magnetic Recording), e sua variante refinada ePMR, atingiram o que chamamos de limite superparamagnético.

      Para ir além, a indústria precisou recorrer a algo que parece saído de um filme de ficção científica, mas que agora reside dentro dos servidores: lasers. A tecnologia HAMR (Heat-Assisted Magnetic Recording) é a aposta da Seagate com a plataforma Mozaic 3+, enquanto a Western Digital ainda espreme os últimos bits da gravação magnética convencional assistida por energia. Mas a pergunta que todo engenheiro de infraestrutura e entusiasta de storage deve fazer não é "cabe mais dados?", e sim "esse laser vai queimar meus dados?".

      Resumo em 30 segundos

      • O Muro da Física: A tecnologia PMR/CMR tradicional não consegue gravar bits menores sem perder estabilidade magnética. O HAMR resolve isso usando lasers para aquecer mídias de alta coercividade (Ferro-Platina) no momento da escrita.
      • O Fator Medo: A introdução de um diodo laser e um transdutor de campo próximo (NFT) adiciona novos pontos de falha. Embora a Seagate prometa confiabilidade igual à PMR, o estresse térmico em escala de nanosegundos é uma variável nova em ambientes 24/7.
      • TCO é Rei: O argumento final não é velocidade, mas densidade. Discos de 30TB+ permitem consolidar racks, reduzindo drasticamente o consumo de energia por Petabyte, o que justifica o risco inicial para hyperscalers.

      A física da coercividade: Laser versus campo magnético puro

      Para entender por que estamos arriscando colocar lasers dentro de discos mecânicos, precisamos revisitar o trilema da gravação magnética: legibilidade, gravabilidade e estabilidade.

      Em discos PMR tradicionais, para aumentar a capacidade, precisamos diminuir o tamanho dos grãos magnéticos (os bits). O problema é que, se os grãos ficarem pequenos demais, a energia térmica ambiente pode invertê-los espontaneamente, corrompendo os dados. Para evitar isso, usamos materiais com maior coercividade (resistência à mudança magnética).

      No entanto, chegamos a um ponto onde a coercividade necessária para manter bits minúsculos estáveis é tão alta que o cabeçote de gravação magnética tradicional não consegue gerar campo suficiente para escrever os dados. É uma parede intransponível.

      Comparação do processo de escrita: O campo magnético puro do PMR vs. a assistência térmica do HAMR. Figura: Comparação do processo de escrita: O campo magnético puro do PMR vs. a assistência térmica do HAMR.

      Como vemos na representação acima, o HAMR contorna isso mudando o material do prato para uma liga de Ferro-Platina (FePt). Esta liga é incrivelmente estável e magneticamente "dura" à temperatura ambiente (impossível de gravar com cabeçotes normais).

      O truque do HAMR é aquecer uma área minúscula (menor que o limite de difração da luz) até a temperatura de Curie (aproximadamente 400°C a 450°C) em menos de um nanosegundo. Nesse instante de calor, a coercividade cai drasticamente, permitindo que o cabeçote magnético grave o bit. O resfriamento ocorre tão rápido quanto o aquecimento, "congelando" o dado no lugar.

      💡 Dica Pro: Não confunda HAMR com MAMR (Microwave-Assisted Magnetic Recording). O MAMR, defendido historicamente pela Toshiba e parcialmente pela WD, usa micro-ondas para excitar os elétrons e facilitar a gravação, sem o calor extremo do HAMR. É uma tecnologia de transição, enquanto o HAMR é o destino final da densidade.

      Desgaste térmico e a durabilidade do diodo laser

      Aqui entramos no território da desconfiança. A engenharia de confiabilidade odeia calor, e o HAMR introduz ciclos térmicos extremos bilhões de vezes por segundo.

      A Seagate, com sua plataforma Mozaic 3+, afirma que seus discos Exos de 30TB+ possuem a mesma classificação de confiabilidade que os discos PMR: 2,5 milhões de horas de MTBF (Mean Time Between Failures) e uma garantia de 5 anos. Mas como isso é possível?

      O componente crítico não é apenas o laser em si, mas o NFT (Near Field Transducer). O NFT é uma antena plasmônica que pega a luz do laser e a foca em um ponto de nanômetros. Nos primeiros protótipos de HAMR (há mais de uma década), o NFT derretia ou se deformava após pouco uso.

      A "verdade" atual, baseada em testes laboratoriais e deployments iniciais em hyperscalers, sugere que a ciência dos materiais evoluiu. O aquecimento é extremamente localizado e a dissipação é imediata. O disco não "esquenta" como um todo devido ao laser; o calor é dissipado no prato e absorvido pelo ambiente interno do drive (hélio).

      No entanto, há ceticismo válido sobre a longevidade do diodo laser em si. Lasers degradam com o tempo e com o calor. Em um ambiente de data center rodando a 40°C ou 50°C de temperatura ambiente, a margem de operação do diodo diminui.

      O componente crítico: O Transdutor de Campo Próximo (NFT) é onde a mágica e o risco de falha residem. Figura: O componente crítico: O Transdutor de Campo Próximo (NFT) é onde a mágica e o risco de falha residem.

      Se o laser falhar ou perder potência, o drive não consegue mais escrever. Ele se torna efetivamente um dispositivo read-only (na melhor das hipóteses) ou um peso de papel caro. Diferente de um cabeçote magnético que degrada gradualmente, a falha de um componente óptico pode ser mais abrupta. Até termos dados de campo de 5 anos de uso real, a paridade de confiabilidade é uma projeção estatística, não um fato histórico comprovado.

      Densidade de área e o impacto na performance

      Há um mito de que discos maiores são mais lentos. Em termos de latência de busca (seek time), isso é parcialmente verdade devido à física do braço atuador, mas em taxa de transferência sequencial, o oposto ocorre.

      O aumento da densidade de área (bits por polegada quadrada) significa que, para cada rotação do disco, mais dados passam sob o cabeçote.

      Nos discos de 30TB+ baseados em HAMR, estamos vendo densidades de área superando 1.5 Tb/in² (Terabits por polegada quadrada). Isso resulta em taxas de transferência sustentada que podem roçar ou superar os 300 MB/s na borda externa do disco. Isso é território que antigamente exigia discos de 10.000 ou 15.000 RPM.

      O problema do IOPS por TB

      O "elefante na sala" da performance é o IOPS (Input/Output Operations Per Second). Um disco de 30TB tem o mesmo único atuador (ou dois, no caso de drives Dual Actuator como o Mach.2) que um disco de 10TB.

      Isso significa que o IOPS por Terabyte caiu drasticamente.

      • Disco 10TB (7200 RPM): ~8 IOPS/TB

      • Disco 30TB (7200 RPM): ~2.6 IOPS/TB

      Para cargas de trabalho aleatórias, esses discos são abismais se não houver uma camada de cache robusta ou se não forem usados estritamente para throughput sequencial (backup, streaming, big data).

      ⚠️ Perigo: Implementar discos de 30TB em arrays RAID tradicionais (como RAID 5 ou 6) sem considerar o tempo de reconstrução (rebuild) é suicídio de dados. A reconstrução de um disco de 30TB pode levar dias, durante os quais o array está degradado e a performance é inutilizável. O uso de tecnologias como Erasure Coding ou RAID distribuído (dRAID) é obrigatório nesta classe.

      Análise de TCO: O verdadeiro motor da mudança

      Nenhum CIO aprova a compra de discos HAMR porque a tecnologia é "legal". A aprovação vem da planilha de Excel. É aqui que o HAMR vence a batalha contra o PMR/ePMR estagnado.

      Vamos analisar o cenário com a plataforma Mozaic 3+ da Seagate em comparação com discos legados de 16TB ou 20TB PMR.

      1. Densidade de Rack: Substituir discos de 16TB por 32TB permite dobrar a capacidade de armazenamento no mesmo footprint físico. Em um data center onde o metro quadrado custa milhares de dólares, isso é vital.

      2. Eficiência Energética (Watts/TB): Um disco rígido mecânico consome cerca de 6 a 9 Watts em operação, independentemente de ter 10TB ou 30TB (o motor e a eletrônica são os maiores consumidores, não os pratos adicionais).

      A métrica que importa para o CFO: O consumo de energia por Terabyte cai drasticamente com o aumento da densidade. Figura: A métrica que importa para o CFO: O consumo de energia por Terabyte cai drasticamente com o aumento da densidade.

      Ao saltar para 30TB+, o consumo de Watts por TB cai quase pela metade em comparação com drives de gerações anteriores. Mesmo que o HAMR consuma ligeiramente mais energia para alimentar o laser e a eletrônica de controle avançada, o ganho de densidade dilui esse custo massivamente.

      Para um hyperscaler com 100.000 discos, a economia de energia e refrigeração paga a transição de tecnologia em pouco tempo. Para o usuário de Home Lab ou pequena empresa, o ganho é menos perceptível no curto prazo, dado o custo inicial elevado ("early adopter tax") das unidades HAMR.

      O cenário competitivo: WD e Toshiba

      Enquanto a Seagate foi "all-in" no HAMR, a Western Digital (WD) adotou uma postura mais conservadora, focando em ePMR (Energy-assisted PMR) e UltraSMR.

      A WD argumenta que o custo e a complexidade do HAMR só se justificam quando não houver mais nenhuma outra opção (provavelmente acima de 40TB). Atualmente, a WD consegue entregar discos de 24TB+ (e até 28TB com SMR agressivo) usando tecnologias mais maduras e baratas de fabricar.

      Isso cria uma bifurcação no mercado:

      • Seagate (HAMR): Maior densidade potencial, maior risco tecnológico, custo de produção inicial mais alto (novos materiais, lasers), mas um roteiro claro até 50TB+.

      • WD (ePMR/UltraSMR): Evolução segura, menor custo por unidade hoje, mas atingirá um muro físico em breve.

      • Toshiba (MAMR/MAS-MAMR): Corre por fora, utilizando micro-ondas para tentar acompanhar a densidade sem a complexidade térmica do laser.

      Para o comprador hoje, a escolha é entre a estabilidade comprovada do ePMR e a densidade futurista do HAMR. Se você precisa de 32TB em um único slot agora, o HAMR é a única opção viável. Se você pode escalar horizontalmente (scale-out) com mais unidades de 22TB ou 24TB, o ePMR ainda oferece um custo por TB (e paz de espírito) superior.

      Veredito Técnico: O futuro é quente, mas requer cautela

      A transição para HAMR não é apenas uma atualização de produto; é uma mudança de paradigma comparável à transição de SLC para MLC/TLC em SSDs. A complexidade aumentou para permitir que a capacidade continuasse crescendo.

      A confiabilidade dos discos de 30TB+ baseados em HAMR, como a linha Exos com Mozaic 3+, parece sólida nos papéis brancos e nos testes acelerados. A física do FePt e a precisão dos lasers nanofotônicos são maravilhas da engenharia. No entanto, a desconfiança é uma virtude no armazenamento de dados.

      Minha recomendação divide-se em dois perfis:

      1. Para Enterprise e Hyperscalers: A migração é inevitável. A economia de TCO (energia e espaço) supera o risco teórico de falha do laser. A redundância de software (Erasure Coding) mitiga o risco de falha de unidade única. Podem adotar, mas mantenham monitoramento rigoroso dos atributos SMART relacionados à temperatura e horas de voo do laser.

      2. Para SMBs e Home Labs (NAS/TrueNAS): Esperem. A primeira geração de qualquer tecnologia de armazenamento radical carrega riscos ocultos. Deixem os gigantes da nuvem serem as cobaias da durabilidade do NFT a longo prazo. Por enquanto, discos de 20TB-24TB baseados em ePMR/CMR oferecem o melhor equilíbrio entre densidade, custo e confiabilidade comprovada de décadas.

      O HAMR funciona e é o futuro. Mas em storage, o tédio e a previsibilidade são as melhores features — e o HAMR ainda é emocionante demais para dados críticos sem backup triplo.

      #HAMR vs PMR #Seagate Mozaic 3+ #Confiabilidade HDD #Western Digital ePMR #Backblaze Drive Stats #Storage Enterprise #Densidade de Área
      Carlos Ornelas
      Assinatura Técnica

      Carlos Ornelas

      Mecânico de Datacenter

      "Vivo nos corredores frios instalando racks e organizando cabeamento estruturado. Para mim, a nuvem é feita de metal, silício e ventoinhas que precisam girar sem parar."