Roberto Lemos

      Roberto Lemos

      Arquiteto de Workloads

      Projeto infraestrutura onde o perfil de I/O dita as regras. Sei que a latência do acesso aleatório de um banco difere da vazão sequencial de vídeos. Mapeio o hardware exato para cada aplicação.

      Artigos publicados (31)

      Bit Rot E Silent Data Corruption Como Detectar E Corrigir

      Bit Rot E Silent Data Corruption Como Detectar E Corrigir

      A corrupção silenciosa de dados ocorre quando informações são alteradas sem que o sistema ou o usuário percebam. Diferente de uma falha de disco completa, onde ...

      Latência p95/p99: Por que a Média Engana

      Latência p95/p99: Por que a Média Engana

      A latência média mente. Se você está gerenciando sistemas distribuídos, confiando apenas na latência média, está construindo sobre areia movediça. A latência mé...

      Monitoramento de Discos em RAID: Indo Além do Status SMART e Prevendo Falhas Reais

      Monitoramento de Discos em RAID: Indo Além do Status SMART e Prevendo Falhas Reais

      Não confie apenas no LED verde. Aprenda a monitorar atributos SMART críticos através de controladoras RAID, interpretar valores RAW e antecipar falhas de disco antes da perda de dados.

      Storage Compartilhado no Proxmox: Ceph, NFS ou ZFS over iSCSI? Arquitetura para HA Real

      Storage Compartilhado no Proxmox: Ceph, NFS ou ZFS over iSCSI? Arquitetura para HA Real

      Não escolha seu storage no cara ou coroa. Compare arquitetura, latência e complexidade entre Ceph, ZFS over iSCSI e NFS para clusters Proxmox HA de alta performance.

      Migração VMware para Proxmox: Guia de Engenharia de Storage (vmdk para qcow2/zvol)

      Migração VMware para Proxmox: Guia de Engenharia de Storage (vmdk para qcow2/zvol)

      Fuja do lock-in sem perder dados. Guia técnico para migrar VMs do ESXi para Proxmox VE, focando na conversão correta de vmdk, drivers VirtIO e escolha entre qcow2 ou ZFS raw.

      Ceph Networking: 10GbE vs 25GbE vs 100GbE e a Verdade sobre Gargalos

      Ceph Networking: 10GbE vs 25GbE vs 100GbE e a Verdade sobre Gargalos

      Pare de desperdiçar orçamento em placas 100GbE sem motivo. Descubra onde o gargalo real do Ceph se esconde: latência, CPU ou rede, e quando migrar de 10GbE para 25GbE.

      Ceph Scrubbing: Otimizando Integridade de Dados sem Matar a Latência

      Ceph Scrubbing: Otimizando Integridade de Dados sem Matar a Latência

      O Scrubbing do Ceph previne bit rot, mas pode derrubar a performance. Aprenda a ajustar janelas de manutenção, prioridades e deep-scrub para evitar instabilidade no cluster.

      NVMe Nativo no Windows 11: O Guia Definitivo via Registro (Sem BSOD)

      NVMe Nativo no Windows 11: O Guia Definitivo via Registro (Sem BSOD)

      Aprenda a forçar o driver NVMe Padrão da Microsoft no Windows 11 via Registro. Entenda os riscos, ganhos de latência e como evitar o erro INACCESSIBLE_BOOT_DEVICE.

      ZFS Special VDEVs: Arquitetura, Dimensionamento e a Cura para a Latência

      ZFS Special VDEVs: Arquitetura, Dimensionamento e a Cura para a Latência

      Descubra como os Special VDEVs do OpenZFS eliminam o gargalo de IOPS em pools de HDDs. Guia avançado de arquitetura, dimensionamento (0.3% rule) e riscos de implementação.

      Special VDEVs no ZFS: O Botão Turbo que Pode Implodir seu Storage

      Special VDEVs no ZFS: O Botão Turbo que Pode Implodir seu Storage

      Acelerar metadados e blocos pequenos com SSDs parece mágica, mas uma falha aqui significa perda total do pool. Aprenda a arquitetura de sobrevivência com espelhamento triplo e dimensionamento correto.

      Blindando Dados: Como Criar um Repositório Imutável com Linux e XFS

      Blindando Dados: Como Criar um Repositório Imutável com Linux e XFS

      Chega de teatro de segurança. Aprenda a configurar um Linux Hardened Repository (LHR) com XFS e reflinks para criar backups à prova de ransomware e deleção acidental.

      Defesa contra ransomware Akira: blindando VMware e Veeam

      Defesa contra ransomware Akira: blindando VMware e Veeam

      Guia de resposta a incidentes para proteger infraestruturas VMware ESXi e Veeam contra o ransomware Akira. Análise da CVE-2024-37085, táticas de imutabilidade e recuperação.

      NVMe over TCP: Escalando IOPS em Ethernet padrão sem a complexidade do RDMA

      NVMe over TCP: Escalando IOPS em Ethernet padrão sem a complexidade do RDMA

      Abandone o iSCSI. Guia técnico para arquitetos de banco de dados sobre como implementar NVMe/TCP, eliminar gargalos de CPU e reduzir a latência de cauda (p99) em redes Ethernet padrão.

      CVE-2024-40711: Protocolo de resposta a incidentes para Veeam Backup

      CVE-2024-40711: Protocolo de resposta a incidentes para Veeam Backup

      Guia técnico de mitigação para a falha crítica CVE-2024-40711 no Veeam Backup & Replication (CVSS 9.8). Proteja seu storage de ataques RCE e ransomware.

      Acelerando ZFS: Como Configurar Special VDEVs para Metadados e Blocos Pequenos

      Acelerando ZFS: Como Configurar Special VDEVs para Metadados e Blocos Pequenos

      Transforme a performance do seu pool HDD movendo metadados para NVMe. Guia completo sobre Special VDEVs no OpenZFS: configuração, riscos e benchmarking.

      Acelerando Pools ZFS com VDEVs Especiais de Metadados

      Acelerando Pools ZFS com VDEVs Especiais de Metadados

      Aprenda a eliminar o gargalo de IOPS em pools de HDDs movendo metadados e pequenos blocos para NVMe com a classe de alocação especial do OpenZFS.

      CXL 3.1: O fim do gargalo de memória em bancos de dados de alta performance

      CXL 3.1: O fim do gargalo de memória em bancos de dados de alta performance

      Descubra como o CXL 3.1 e a memória desagregada eliminam o 'Memory Wall' em bancos de dados, reduzindo o TCO e permitindo pools de RAM de múltiplos terabytes.

      Perfis de IO: a guerra invisível entre DB, VDI e Backup no seu storage

      Perfis de IO: a guerra invisível entre DB, VDI e Backup no seu storage

      Entenda como o 'efeito liquidificador' destrói a performance do seu storage. Uma análise técnica sobre latência, throughput e isolamento de workloads críticos.

      Latência ou throughput: por que seu banco de dados ignora a velocidade da rede

      Latência ou throughput: por que seu banco de dados ignora a velocidade da rede

      Descubra por que upgrades de largura de banda falham em resolver lentidão de bancos de dados. Um guia técnico para arquitetar storage baseado em IOPS, latência e Queue Depth.

      O custo oculto da paridade: quando o storage de leitura mata a performance de escrita

      O custo oculto da paridade: quando o storage de leitura mata a performance de escrita

      Uma análise técnica para DBAs sobre por que RAID 5 e SSDs QLC destroem a latência de bancos de dados transacionais e como arquitetar a solução correta.

      NVMe-oF/TCP vs iSCSI: Análise crítica de latência e overhead para DBAs

      NVMe-oF/TCP vs iSCSI: Análise crítica de latência e overhead para DBAs

      Descubra por que o iSCSI é o gargalo dos seus SSDs modernos. Comparativo técnico de NVMe-oF/TCP vs iSCSI focado em latência, CPU e filas de comando.

      Modernizando o terminal Linux: ferramentas Rust para administradores de storage

      Modernizando o terminal Linux: ferramentas Rust para administradores de storage

      Abandone o ls e o cat. Descubra como ferramentas baseadas em Rust (eza, dust, bat) transformam a gestão de discos, logs e performance em servidores Linux.

      O fim da memória isolada: desagregação via CXL 3.1 em workloads de IA

      O fim da memória isolada: desagregação via CXL 3.1 em workloads de IA

      Análise técnica sobre como o CXL 3.1 elimina o gargalo de memória em clusters de IA, superando as limitações de HBM3e e DDR5 com pools compartilhados de baixa latência.

      NVMe-oF sobre TCP vs RDMA: o impacto real no overhead de CPU em alta densidade

      NVMe-oF sobre TCP vs RDMA: o impacto real no overhead de CPU em alta densidade

      Análise técnica profunda sobre NVMe-oF: comparamos o custo de processamento (CPU overhead) entre transportes TCP e RDMA (RoCEv2). Entenda como o kernel bypass reduz a latência de cauda em bancos de dados críticos.

      CXL e a convergência de memória: O fim do gargalo de IO em infraestrutura de IA

      CXL e a convergência de memória: O fim do gargalo de IO em infraestrutura de IA

      Análise técnica sobre como o Compute Express Link (CXL) elimina a latência entre memória e armazenamento, transformando a arquitetura de dados para LLMs e workloads de alta performance.

      NVMe over TCP no Kubernetes: O Fim do Gargalo de Storage para Bancos de Dados

      NVMe over TCP no Kubernetes: O Fim do Gargalo de Storage para Bancos de Dados

      Descubra como o NVMe over TCP elimina a latência do iSCSI e resolve o dilema da persistência no Kubernetes. Uma análise técnica para arquitetos de workloads críticos.

      O fim do abismo de latência: Como o CXL redefine a hierarquia de memória

      O fim do abismo de latência: Como o CXL redefine a hierarquia de memória

      Análise técnica para arquitetos de workload: como o protocolo CXL elimina o gargalo entre DRAM e NVMe, transformando o barramento PCIe em extensão de memória coerente.

      NVMe-oF e IA Generativa: O Fim da Ociosidade das GPUs

      NVMe-oF e IA Generativa: O Fim da Ociosidade das GPUs

      Descubra como a arquitetura de armazenamento desagregado com NVMe-oF e GPUDirect elimina gargalos de I/O em clusters de IA, maximizando o ROI de GPUs H100.

      Afinidade NUMA: eliminando a latência oculta em storage NVMe multi-socket

      Afinidade NUMA: eliminando a latência oculta em storage NVMe multi-socket

      Descubra como o desalinhamento NUMA mata a performance de arrays NVMe em servidores multi-socket e aprenda a configurar a afinidade de CPU e IRQ corretamente.

      NVMe FDP: o fim da latência de cauda em bancos de dados de alta concorrência

      NVMe FDP: o fim da latência de cauda em bancos de dados de alta concorrência

      Entenda como o Flexible Data Placement (FDP) do NVMe isola workloads no nível do NAND, reduz o WAF e estabiliza o QoS sem a complexidade do ZNS.

      Zdb: o guia definitivo para auditar metadados e estruturas do ZFS

      Zdb: o guia definitivo para auditar metadados e estruturas do ZFS

      Aprenda a usar o zdb para dissecar estruturas on-disk do ZFS, simular deduplicação e auditar metadados sem comprometer seus dados. Tutorial avançado para sysadmins.