三分钟读懂备份相关知识
备份是数据或系统的备份,它是容灾的基础,是指为防止系统出现操作失误或故障导致的数据丢失,而将全部或部分数据集合从应用主机的硬盘或阵列复制到其它存储介质的过程。根据中国灾备行业白皮书的汇总,备份分类有多种方式。
A.按照备份时间频率分为:定时备份、实时备份。
定时备份:是指有时间间隔的数据备份方式,比如一天一次,一周一次,或一个月一次,定时备份会出现数据丢失的情况。
实时备份:是指无时间间隔的数据备份方式,通过数据实时复制技术,保证主备两端的数据读写一致,确保数据的丢失量最少,甚至不丢失。
持续数据保护(continuous data protection,CDP),也称作持续备份,是一个在任何变化发生时,能准实时地备份企业数据。CDP技术是对传统数据备份技术的一次革命性的重大突破。传统的数据备份解决方案专注在对数据的周期性备份上,因此一直伴随有备份窗口、数据一致性以及对生产系统的影响等问题。
B.按照备份数据量分为:全量备份、增量备份、差量备份。
全量备份:用存储介质对整个数据及系统进行完全备份。这种备份方式的好处是很直观,容易被人理解,易恢复;缺点是在备份数据中有大量重复数据,由于需要备份的数据量相当大,因此备份所需时间较长。
增量备份:每次备份的数据只是相当于上一次备份后增加和修改后的数据。这种备份的优点很明显 , 重复数据少,即节省存储空间,又缩短了备份时间。
差量备份:是拷贝所有新产生或更新的数据,这些数据都是最近一次全量备份后产生或更新的。
增量备份与差量备份的区别是,增量备份判断数据更新标准是依据上一次备份检查点,而差量备份一定是依据全量备份检查点。如没有全量备份,就没有差量备份。差量备份的主要目的是限制完全恢复时使用的介质数量。
数据副本管理(Copy Data Management,CDM),是一种能节约存储资源、有效管理数据生命周期的技术方式,包括消除不必要的重复生产数据。由于传统备份软件和企业应用程序独立运行,经常会创建多个相同数据的副本,数据副本管理技术也因此得名。
目前,行业比较常见的CDM产品,通常采用“首次全量+永久增量”的备份方式,在系统层、数据库层、系统层等进行数据快速采集,然后根据用户环境设置备份周期和规则,通过挂载恢复的方式,快速恢复用户的数据及业务。CDM结合分级保护、分级容灾的概念,开始在政企、金融等领域推广使用。
Image备份:指映像级备份,Image备份可对整个文件卷进行数据块级别备份,备份传输的是数据块而不是文件。这种备份不仅做全备份时效率提高,而且在增量备份时会更快。它采用快照技术来创建一个近似于及时的数据映像,然后对快照数据映像进行备份,对应用的影响很小。适合文件个数在百万量级以上的大型文件系统,以及更多要求恢复整个文件卷的应用环境。
映像级备份还包括Ghost备份,常用于操作系统的备份,在系统不能正常启动的时候用来恢复。Ghost备份需要借助预安装环境PE工具进行,缺点是要停机的。Image备份在Ghost备份的基础上进行优化,可在做整机备份时不停机备份,优点是帮助用户在备端接管的情况下,如果要进行在线回迁到生产服务器时,业务可无缝切换。
另外,传统的备份非常强调两类技术:重删和压缩。
重删:即重复数据删除,是一种可自动搜索重复数据,将相同数据只保留唯一的一个副本,并使用指向单一副本的指针替换掉其他重复副本,已达到消除数据冗余,降低存储容量需求的技术。通常用于基于磁盘的备份系统,旨在减少存储系统中使用的存储容量。重删技术涵盖源端去重和宿端去重,技术分类包括相同数据的检测技术、相似数据的检测与编码技术。
压缩:是指在不丢失信息的前提下,缩减数据量以减少存储空间,提高其传输、存储和处理效率的一种技术,或者指按照一定的算法对数据进行重新组织,减少数据的冗余和存储的空间。压缩可以分为无损压缩和有损压缩。
备份技术在不断进步,行业应该用发展的眼光去看待备份技术的进步,并非所有的备份技术都需要进行重删或压缩,例如CDP技术。
C.按照备份对象分为:块级备份、文件级备份、数据库备份。
我们需要了解,什么叫做块级、文件级。首先看物理块与文件系统之间映射关系:扇区→物理块→逻辑块→文件系统。
块级是指以扇区为基础,一个或连续的扇区组成一个块,也称为物理块。它是在文件系统与块设备(如磁盘驱动器)之间。块级别访问是直接通过读写存储空间(磁盘、逻辑单元号Lun、文件集Volume)中的一个或者一段地址来存取数据。如存储设备将LUN1上的0-127这128个扇区的数据给主机即完成读写。(映射关系:VOLUME ≤ LUN ≤ RAID ≤ 存储设备中硬盘的总容量)
文件级是指文件系统,单个文件可能由一个或多个逻辑块组成,且逻辑块之间是不连续分布。逻辑块大于或等于物理块整数倍。文件级别访问是通过读写某个文件中的一段数据完成,如主机发出指令,需要存储设备将C盘下A文件的前128字节进行复制。
块级备份:以磁盘块为基本单位,将数据从源端复制到备端,即每次备份数据以一个扇区或多个连续扇区为单位来进行备份。
文件级备份:以文件为基本单位,将数据以文件的形式读出,通过文件系统接口调用备份到另一个介质上。
两者比较,相比传统的文件级备份,块级备份效率高,备份时间短,且增量备份时,只备份修改过的物理块。而传统文件级备份,首先会查找每个文件逻辑块,其次物理块,由于逻辑块是分散在物理块上,而物理块也是分散在不同扇区上。需要一层一层往下查找,最后才完成整个文件复制。
数据库备份:围绕数据库对各种表、索引、视图、事务日志等进行定时或实时的备份,按照备份数据库的大小,数据库备份可以分为完全备份、事务日志备份、差异备份等类型。
此外,根据备份时服务器是否停机又可分为冷备、热备、温备;按照数据存储介质之间的距离又可以分为本地备份和异地备份,以及按照数据备份量大小及路径所划分的LAN(局域网)、LAN free备份、Server Free备份等等。
三二一备份原则:这是灾备行业比较常见的一条基本原则,指企业应存有3 份备份数据,其中一份在生产环境的原数据,存放于2种不同存储媒介,例如硬盘、光盘、云盘等,且同一存储媒介在不同的地方存放,并有1份数据存于异地环境。异地环境可以是异地灾备,也可以是云端。
世界备份日(World Backup Day):通常是指由美国网络社区Reddit在4月1日愚人节前一天发起的,也号召网友建议各种在线备份程序,来帮助大家安全的备份资料。他们的口号是:不要当一个傻瓜,注意备份资料!(Don’t Be An April Fool. Backup Your Data.)