Backup Full Incremental E Diferencial Em Storage
---...
Backup Full Incremental E Diferencial Em Storage
Resumo: Entenda as diferenças críticas entre estratégias de backup Full, Incremental e Diferencial e aprenda a implementá-las usando ferramentas nativas do Linux como
tar,rsyncerdiff-backup.
A proteção de dados é o pilar de qualquer infraestrutura confiável. No entanto, simplesmente "copiar arquivos" não é uma estratégia viável quando lidamos com Terabytes ou Petabytes de dados. É aqui que entram as diferentes metodologias de backup, cada uma com seus trade-offs entre espaço de armazenamento, tempo de backup e tempo de recuperação (RTO).
1. Backup Full (Completo)
O backup full é a base de tudo. Ele copia todos os dados selecionados, independentemente de terem sido modificados ou não desde o último backup.
Vantagens: Recuperação mais rápida e simples (basta um arquivo). Desvantagens: Mais lento para executar e consome mais espaço.
Exemplo com tar:
tar -cvzf /backup/full_backup.tar.gz /data
-c: Cria um novo arquivo.-v: Modo verbose (exibe os arquivos sendo processados).-z: Comprime o arquivo usando gzip.-f: Especifica o nome do arquivo de backup.
2. Backup Incremental
O backup incremental copia apenas os dados que foram alterados desde o último backup (seja ele full ou incremental).
Vantagens: Backup muito rápido e economiza espaço. Desvantagens: Recuperação lenta e complexa (precisa do Full + todos os Incrementais em ordem).
Exemplo com tar e find:
Este método requer o registro da data do último backup.
# Define a data do último backup (substitua pela data real)
LAST_BACKUP_DATE="2024-01-01"
# Encontra os arquivos modificados desde a data do último backup
find /data -newermt "$LAST_BACKUP_DATE" -print0 | tar -cvzf /backup/incremental_backup.tar.gz --null -T -
find /data -newermt "$LAST_BACKUP_DATE": Encontra arquivos modificados após a data especificada.-print0: Imprime os nomes dos arquivos separados por null (para evitar problemas com nomes contendo espaços).tar --null -T -: Lê os nomes dos arquivos dofinde os adiciona ao arquivo tar.
3. Backup Diferencial
O backup diferencial copia todos os dados alterados desde o último backup FULL.
Vantagens: Recuperação mais rápida que o incremental (precisa apenas do Full + último Diferencial). Desvantagens: Ocupa mais espaço que o incremental ao longo do tempo (duplicação de dados entre diferenciais).
Exemplo com tar e find:
# Define a data do último backup FULL (substitua pela data real)
LAST_FULL_BACKUP_DATE="2024-01-01"
# Encontra os arquivos modificados desde a data do último backup FULL
find /data -newermt "$LAST_FULL_BACKUP_DATE" -print0 | tar -cvzf /backup/differential_backup.tar.gz --null -T -
4. Backup Moderno com rsync
O rsync é a ferramenta padrão da indústria para sincronização eficiente.
# Primeiro backup (full)
rsync -av /data /backup/full_backup
# Backups incrementais usando Hard Links (economia extrema de espaço)
rsync -av --link-dest=/backup/full_backup /data /backup/incremental_backup
--link-dest: Cria hard links para arquivos que não mudaram. O sistema de arquivos "pensa" que é uma cópia completa, mas ocupa apenas o espaço das mudanças. Permite restauração como se fosse um Full.
5. Backup com rdiff-backup
rdiff-backup combina o poder do rsync com um histórico de versões fácil de navegar.
# Backup inicial (cria a estrutura)
rdiff-backup /data /backup/rdiff_backup
# Backups subsequentes (apenas as diferenças são armazenadas)
rdiff-backup /data /backup/rdiff_backup
Recuperação de Desastre (Disaster Recovery)
A estratégia de restauração depende do método escolhido:
Backup Full:
tar -xvzf /backup/full_backup.tar.gz -C /dataBackup Incremental: (Requer restauração em cadeia)
tar -xvzf /backup/full_backup.tar.gz -C /data tar -xvzf /backup/incremental_backup1.tar.gz -C /data tar -xvzf /backup/incremental_backup2.tar.gz -C /dataBackup Diferencial:
tar -xvzf /backup/full_backup.tar.gz -C /data tar -xvzf /backup/differential_backup.tar.gz -C /data
Considerações Finais
- Regra 3-2-1: Tenha 3 cópias dos dados, em 2 mídias diferentes, com 1 cópia off-site.
- Teste de Restauração: Um backup que não foi testado não existe.
- Monitoramento: Use ferramentas para alertar se o job de backup falhar (ex: Healthchecks.io, Zabbix).


Priya Patel
Data Center Operations Lead
Gerencia milhares de discos físicos. Sabe exatamente qual modelo de HDD vibra mais e qual SSD morre primeiro.