Roberto Lemos

Arquiteto de Workloads

Projeto infraestrutura onde o perfil de I/O dita as regras. Sei que a latência do acesso aleatório de um banco difere da vazão sequencial de vídeos. Mapeio o hardware exato para cada aplicação.

Artigos publicados (33)

Bit Rot E Silent Data Corruption Como Detectar E Corrigir

A corrupção silenciosa de dados ocorre quando informações são alteradas sem que o sistema ou o usuário percebam. Diferente de uma falha de disco completa, onde ...

12/11/2025

Latência p95/p99: Por que a Média Engana

A latência média mente. Se você está gerenciando sistemas distribuídos, confiando apenas na latência média, está construindo sobre areia movediça. A latência mé...

22/06/2025

Monitoramento de Discos em RAID: Indo Além do Status SMART e Prevendo Falhas Reais

Não confie apenas no LED verde. Aprenda a monitorar atributos SMART críticos através de controladoras RAID, interpretar valores RAW e antecipar falhas de disco antes da perda de dados.

17/12/2025

Storage Compartilhado no Proxmox: Ceph, NFS ou ZFS over iSCSI? Arquitetura para HA Real

Não escolha seu storage no cara ou coroa. Compare arquitetura, latência e complexidade entre Ceph, ZFS over iSCSI e NFS para clusters Proxmox HA de alta performance.

19/12/2025

Migração VMware para Proxmox: Guia de Engenharia de Storage (vmdk para qcow2/zvol)

Fuja do lock-in sem perder dados. Guia técnico para migrar VMs do ESXi para Proxmox VE, focando na conversão correta de vmdk, drivers VirtIO e escolha entre qcow2 ou ZFS raw.

19/12/2025

Ceph Networking: 10GbE vs 25GbE vs 100GbE e a Verdade sobre Gargalos

Pare de desperdiçar orçamento em placas 100GbE sem motivo. Descubra onde o gargalo real do Ceph se esconde: latência, CPU ou rede, e quando migrar de 10GbE para 25GbE.

19/12/2025

Ceph Scrubbing: Otimizando Integridade de Dados sem Matar a Latência

O Scrubbing do Ceph previne bit rot, mas pode derrubar a performance. Aprenda a ajustar janelas de manutenção, prioridades e deep-scrub para evitar instabilidade no cluster.

02/01/2026

NVMe Nativo no Windows 11: O Guia Definitivo via Registro (Sem BSOD)

Aprenda a forçar o driver NVMe Padrão da Microsoft no Windows 11 via Registro. Entenda os riscos, ganhos de latência e como evitar o erro INACCESSIBLE_BOOT_DEVICE.

02/01/2026

ZFS Special VDEVs: Arquitetura, Dimensionamento e a Cura para a Latência

Descubra como os Special VDEVs do OpenZFS eliminam o gargalo de IOPS em pools de HDDs. Guia avançado de arquitetura, dimensionamento (0.3% rule) e riscos de implementação.

03/01/2026

Special VDEVs no ZFS: O Botão Turbo que Pode Implodir seu Storage

Acelerar metadados e blocos pequenos com SSDs parece mágica, mas uma falha aqui significa perda total do pool. Aprenda a arquitetura de sobrevivência com espelhamento triplo e dimensionamento correto.

03/01/2026

Blindando Dados: Como Criar um Repositório Imutável com Linux e XFS

Chega de teatro de segurança. Aprenda a configurar um Linux Hardened Repository (LHR) com XFS e reflinks para criar backups à prova de ransomware e deleção acidental.

03/01/2026

Defesa contra ransomware Akira: blindando VMware e Veeam

Guia de resposta a incidentes para proteger infraestruturas VMware ESXi e Veeam contra o ransomware Akira. Análise da CVE-2024-37085, táticas de imutabilidade e recuperação.

03/01/2026

NVMe over TCP: Escalando IOPS em Ethernet padrão sem a complexidade do RDMA

Abandone o iSCSI. Guia técnico para arquitetos de banco de dados sobre como implementar NVMe/TCP, eliminar gargalos de CPU e reduzir a latência de cauda (p99) em redes Ethernet padrão.

03/01/2026

CVE-2024-40711: Protocolo de resposta a incidentes para Veeam Backup

Guia técnico de mitigação para a falha crítica CVE-2024-40711 no Veeam Backup & Replication (CVSS 9.8). Proteja seu storage de ataques RCE e ransomware.

03/01/2026

Acelerando ZFS: Como Configurar Special VDEVs para Metadados e Blocos Pequenos

Transforme a performance do seu pool HDD movendo metadados para NVMe. Guia completo sobre Special VDEVs no OpenZFS: configuração, riscos e benchmarking.

03/01/2026

Acelerando Pools ZFS com VDEVs Especiais de Metadados

Aprenda a eliminar o gargalo de IOPS em pools de HDDs movendo metadados e pequenos blocos para NVMe com a classe de alocação especial do OpenZFS.

03/01/2026

CXL 3.1: O fim do gargalo de memória em bancos de dados de alta performance

Descubra como o CXL 3.1 e a memória desagregada eliminam o 'Memory Wall' em bancos de dados, reduzindo o TCO e permitindo pools de RAM de múltiplos terabytes.

03/01/2026

Perfis de IO: a guerra invisível entre DB, VDI e Backup no seu storage

Entenda como o 'efeito liquidificador' destrói a performance do seu storage. Uma análise técnica sobre latência, throughput e isolamento de workloads críticos.

04/01/2026

Latência ou throughput: por que seu banco de dados ignora a velocidade da rede

Descubra por que upgrades de largura de banda falham em resolver lentidão de bancos de dados. Um guia técnico para arquitetar storage baseado em IOPS, latência e Queue Depth.

04/01/2026

O custo oculto da paridade: quando o storage de leitura mata a performance de escrita

Uma análise técnica para DBAs sobre por que RAID 5 e SSDs QLC destroem a latência de bancos de dados transacionais e como arquitetar a solução correta.

04/01/2026

NVMe-oF/TCP vs iSCSI: Análise crítica de latência e overhead para DBAs

Descubra por que o iSCSI é o gargalo dos seus SSDs modernos. Comparativo técnico de NVMe-oF/TCP vs iSCSI focado em latência, CPU e filas de comando.

06/01/2026

Modernizando o terminal Linux: ferramentas Rust para administradores de storage

Abandone o ls e o cat. Descubra como ferramentas baseadas em Rust (eza, dust, bat) transformam a gestão de discos, logs e performance em servidores Linux.

08/01/2026

O fim da memória isolada: desagregação via CXL 3.1 em workloads de IA

Análise técnica sobre como o CXL 3.1 elimina o gargalo de memória em clusters de IA, superando as limitações de HBM3e e DDR5 com pools compartilhados de baixa latência.

08/01/2026

NVMe-oF sobre TCP vs RDMA: o impacto real no overhead de CPU em alta densidade

Análise técnica profunda sobre NVMe-oF: comparamos o custo de processamento (CPU overhead) entre transportes TCP e RDMA (RoCEv2). Entenda como o kernel bypass reduz a latência de cauda em bancos de dados críticos.

08/01/2026

CXL e a convergência de memória: O fim do gargalo de IO em infraestrutura de IA

Análise técnica sobre como o Compute Express Link (CXL) elimina a latência entre memória e armazenamento, transformando a arquitetura de dados para LLMs e workloads de alta performance.

09/01/2026

NVMe over TCP no Kubernetes: O Fim do Gargalo de Storage para Bancos de Dados

Descubra como o NVMe over TCP elimina a latência do iSCSI e resolve o dilema da persistência no Kubernetes. Uma análise técnica para arquitetos de workloads críticos.

09/01/2026

O fim do abismo de latência: Como o CXL redefine a hierarquia de memória

Análise técnica para arquitetos de workload: como o protocolo CXL elimina o gargalo entre DRAM e NVMe, transformando o barramento PCIe em extensão de memória coerente.

09/01/2026

NVMe-oF e IA Generativa: O Fim da Ociosidade das GPUs

Descubra como a arquitetura de armazenamento desagregado com NVMe-oF e GPUDirect elimina gargalos de I/O em clusters de IA, maximizando o ROI de GPUs H100.

09/01/2026

Afinidade NUMA: eliminando a latência oculta em storage NVMe multi-socket

Descubra como o desalinhamento NUMA mata a performance de arrays NVMe em servidores multi-socket e aprenda a configurar a afinidade de CPU e IRQ corretamente.

07/02/2026

NVMe FDP: o fim da latência de cauda em bancos de dados de alta concorrência

Entenda como o Flexible Data Placement (FDP) do NVMe isola workloads no nível do NAND, reduz o WAF e estabiliza o QoS sem a complexidade do ZNS.

17/02/2026

Zdb: o guia definitivo para auditar metadados e estruturas do ZFS

Aprenda a usar o zdb para dissecar estruturas on-disk do ZFS, simular deduplicação e auditar metadados sem comprometer seus dados. Tutorial avançado para sysadmins.

20/02/2026

Tempestades de escrita em LLM checkpointing: como arquitetar storage NVMe para clusters de GPU

Entenda a anatomia do gargalo de I/O no treinamento de IA e aprenda a projetar topologias NVMe-oF com GPUDirect Storage para eliminar a ociosidade das GPUs.

12/03/2026

O impacto da compactação do RocksDB na vida útil de SSDs QLC em workloads NoSQL

Descubra como o ajuste fino das estratégias de compactação no RocksDB reduz o write amplification e previne a exaustão prematura de SSDs QLC em bancos de dados.

31/03/2026