1.3 学习备份代理服务器配置与调优
备份代理服务器是Veeam Backup & Replication v11a应用程序的主力组件,备份和恢复操作中所有繁重的工作和处理任务均由它来完成。开始使用Veeam前,应确保备份代理服务器已按照最佳实践进行配置:
❑ https://bp.veeam.com/vbr/VBP/2_Design_Structures/D_Veeam_Components/D_backup_proxies/vmware_proxies.html
❑ https://helpcenter.veeam.com/docs/backup/vsphere/backup_ proxy.html?ver=110
部署备份代理服务器时,Veeam Backup & Replication将在服务器上安装两个软件组件:
❑ Veeam Installer Service:用于检查服务器并根据需要升级软件。
❑ Veeam Data Mover:备份代理服务器的数据处理引擎,完成下达给它的各种数据传输处理相关任务。
Veeam Backup & Replication代理服务器在备份时会用到不同的传输模式来获取数据。有三种标准模式,这里从最高效的模式开始将它们依次列出:
❑ 直接存储访问:备份代理服务器与存储阵列位于同一网络中,且备份代理服务器可以直接从存储阵列中读取数据。
❑ 虚拟设备:这种模式将服务器的VMDK文件挂载到备份代理服务器上,从而实现服务器数据备份,通常称为热添加模式(Hot-Add Mode)。
❑ 网络:这种模式效率最低,但当前面的方法不可用时可以采取这种模式。它通过网络来传输数据。针对这种模式,建议不要使用1GB带宽的网络,而应使用10GB带宽的网络。
除了这些为VMware环境提供的标准传输模式,Veeam还提供了另外两种传输模式:Backup from Storage Snapshots(从存储快照备份)和Direct NFS(直接NFS访问)。这些模式为NFS文件系统和与Veeam集成的存储系统提供了更多与特定存储相关的传输模式选择。
更多详情请参见存储系统集成指南:https://helpcenter.veeam.com/docs/backup/vsphere/storage_integration.html?ver=110。
除了选择传输模式,备份代理服务器还要执行以下任务:
❑ 从存储中获取虚拟机数据
❑ 数据压缩
❑ 重复数据删除(即去重)
❑ 数据加密
❑ 将数据发送至备份存储库服务器(备份作业)或另一个备份代理服务器(复制作业)在使用除从存储快照备份、直接NFS访问之外的其他传输模式时,Veeam备份代理服务器获取数据所采用的是被称为VMware存储数据保护存储API(VMware vStorage APIs for Data Protection,VADP)的接口协议。
关于备份代理服务器,需要考虑以下几个方面:
1.操作系统。大多数软件供应商总是会推荐最新和功能最强的操作系统,所以如果你使用的是Windows操作系统,那么建议你选择Windows Server 2022。或者,也可以选择Linux,使用最新的版本(例如Ubuntu 20.04.1 LTS)。请注意,对于VMware环境的Linux虚拟机来说,从Veeam Backup & Replication v11a版开始,备份代理支持所有传输模式。
2.备份代理的位置。根据备份代理服务器的传输模式,你需要将其放置在尽可能离所要备份的服务器更近的位置,例如在特定的VMware主机上,离源数据越近越好!
3.备份代理服务器规模测算。这可能是一个棘手的问题,它取决于所用的是物理服务器还是虚拟机。各项备份任务都在Veeam备份代理服务器上完成,包括处理虚拟机的虚拟磁盘,或处理物理服务器的物理磁盘。因此,Veeam建议针对每个任务分配一个物理CPU核心或一个vCPU,以及2GB的内存。
Veeam有一个公式用于计算备份代理服务器所需的资源:
❑ D=源数据,以MB为单位
❑ W=备份窗口,以s为单位
❑ T=吞吐量,以MB/s为单位,T=D/W
❑ CR=数据变化率
❑ CF=Full Backup(完全备份,又称完整备份,简称全备份)所需的CPU核心数,CF=T/100
❑ CI=增量备份所需的CPU核心数,CI=(T×CR)/25
根据这些要求,我们可以结合一个样本数据来进行计算:
❑ 1000个虚拟机
❑ 400TB的数据
❑ 8小时的备份窗口
❑ 5%的数据变化率
采用这些数据进行计算如下:
D=400 TB×1024×1024=419430400MB(数据被转换成MB)
W=8h×3600s=28800s
T=419430400/28800=14564MB/s
我们可以使用算出的结果来确定运行完全备份和增量备份所需的CPU核心数量,以满足我们要求的服务等级协议(Service Level Agreement,SLA)。
CF=T/100→CF(完全备份)=14564/100,约需146个核心
CI=(T×CR)/25→CI(增量备份)=(14564×5%)/25,约需29个核心
根据上述计算,并考虑到每个任务需要2GB的内存,则需要一个有146个vCPU和292GB内存的虚拟服务器。这看起来是一个配置相当高的服务器,但是请记住,这里是基于样本数据进行估算的。实际环境里的需求可能会低得多,或者更高,这取决于所要备份的数据集的具体情况。
如果打算用物理服务器做备份代理,比如你已有的两路10核CPU的服务器。在当前这个样本数据的情况下,至少需要8台物理服务器。如果使用虚拟服务器作为备份代理,最佳实践是将每台虚拟服务器配置为最多8个vCPU,并根据环境需要增加数量——在这个例子中,需要19个虚拟服务器。
如果只根据增量备份来确定备份代理服务器所需资源的多少,那么其需求不到完全备份所需服务器资源的一半,即29个vCPU和58GB的内存。
在作业处理和性能方面,备份代理服务器有一些限制需要注意。正如我们之前指出的,备份代理服务器执行任务相关的操作,且为这些任务分配CPU资源。并发任务的处理过程取决于基础架构中的可用资源和所部署的备份代理服务器的数量。如图1.14所示,在向Veeam Backup & Replication添加备份代理服务器时,有一个Max concurrent tasks(最大并发任务数)选项,它与分配的CPU数量相关。
图1.14 备份代理服务器的最大并发任务数限制
任务限制相关的文档可在以下官网文档栏目查看:https://helpcenter.veeam.com/docs/backup/vsphere/limiting_tasks.html?ver=110。
重要提示
作业的性能会受备份代理服务器任务选项设置的影响。例如,如果有一台8 CPU的备份代理服务器,并添加了两个用于备份的虚拟机,一个虚拟机有4个磁盘,另一个虚拟机有6个磁盘,则备份代理服务器将只并行处理10个磁盘中的8个,剩下的两个磁盘将不得不在备份开始之前等待资源。
现在你知道了如何正确调整备份代理服务器的CPU和内存大小,并明白备份代理服务器的位置,以及它是如何处理任务的。下一节的重点内容是备份代理服务器如何向存储库服务器发送数据。