一般而言,传统的大型数据中心的容灾建设都采用“两地三中心”模式,即生产中心、同城备份中心及异地灾备中心,该模式的最大好处在于数据的完备保护和灾备保障,但其日益显现出一些问题。
双活数据中心是指两个数据中心之间并没有明确的主备之分,每个中心都有生产、互为灾备的任务。双活数据中心减少了IT资源和资金的浪费,可以更好地保证数据和应用的实时性以及业务连续性。
双活数据中心是一种灾备数据中心和主用数据中心的热备方式。灾备数据中心和主用数据中心之间的部署方式经历了冷备方式、半热备方式和热备方式三个发展演变过程。
(1)冷备方式
主用数据中心和灾备数据中心配置相同的硬件、系统、网络访问、数据存储等资源,当主用数据中心发生故障时,需要手动启用灾备数据中心的上述资源和服务。因此,衡量容灾能力的2个重要参数——RTO和RPO会很高,容易造成服务访问的长时间中断和数据的大量丢失。
(2)半热备方式
该模式下,灾备数据中心的应用已经启动,当主用数据中心故障时,应用访问的数据流自动切换到灾备数据中心,这时需要手动启用灾备数据中心的服务。半热备方式在冷备模式的基础上有效降低了RTO和RPO,但是仍旧不能满足当前应用零中断的要求,而且这种切 换是非透明的,用户能够感知。
(3)热备方式
互联网的快速发展促使用户提高对应用访问的要求,因此行业对数据中心之间服务端的容灾能力要求越来越高。在这种环境下,一般要运用新的网络技术和虚拟化技术来支持主用数据中心和灾备数据中心之间的快速切换。热备模式下两个数据中心之间的数据复制是实时的,它能保障服务瞬间切换的安全性和准确性,用户对于这种切换是感知不到的。
相比传统的灾备方式,双活数据中心是实现了最高级别的可用性。双活/多活中心可以实现数据零丢包、实时切换。双活数据中心不再设置专用的灾备资源,不同中心的资源同时承担生产和灾备,提高了设备利用率。由于日常双活数据中心的运维资源都在进行生产,当一个中心发生灾难时,其他中心所有的流程、职责、设备资源、系统资源都不需做大的改动即可接管,只是运维工作量有所增加。传统的灾备只做数据层面的同步、异步复制,在其他技术层面不需要互联太多,而双活数据中心则要求在信息系统的各个层面都要紧密互联、互动。
要实现完备的双活数据中心,则需要在数据中心的各个层面都要考虑双活设计。一般的数据中心可以分为服务器群、存储群、网络架构、应用层四大部分。需要对每个部分都进行双活设计才能实现数据中心整体上的双活。
双活模式下的网络架构要实现两个数据中心之间路由、交换信息的自动切换。需要双活数据中心间全部互通,数据中心之间部署单独的光纤通道,保证数据同步。外界不会感知到有两个数据中心的存在,数据中心之间可以实现零丢包、自动无缝切换。
双活模式下的存储设备要完成数据在两个数据中心之间的实时备份。比如采用基于主机卷复制技术、基于存储虚拟化技术或者基于SAN网络复制技术完成。无论采用哪种复制技术,根本上是完成两个数据中心的存储数据完全一致。
双活模式下的服务器设备要完成业务的自动切换,当一个数据中心内的服务器群出现宕机时,业务会自动切换到另一个数据中心的服务器群上。在服务器上应用虚拟化技术。虚拟机可以在零停机且用户毫无察觉的情况下完成实时迁移,通过不间断地自动优化资源池中的虚拟机,可达到最佳性能和用户体验,虚拟化是双活数据中心必备的重要技术。
双活模式下的应用系统要具有自动切换功能,当一个数据中心应用系统瘫痪时,另一个数据中心可以马上接管。在正常情况下,两边的应用系统同时工作,提升了工作效率,应用系统的数据实时保存到两个数据中心的存储设备上。
除了以上四大部分,还有数据库的双活、防火墙安全系统的双活等等,所以要实现真正的双活数据中心,要对数据中心的每个部分都要进行重新部署,虽然技术实现复杂,但这正是数据中心灾备技术发展的必然趋势。
除了双活数据中心,还有多活数据中心,顾名思义多活数据中心就是多个数据中心同时承担用户的业务,一个是主用数据中心,另外的数据中心是备用。主用数据中心的负载可能会多一些,比如分担60%~70%的业务,备数据中心只分担40%~30%的业务,通过负载均衡控制。主用数据中心实时向多个备用数据中心进行各种信息备份。相比双活,多活数据中心的建设成本更高,当然稳定性也越高。
建设双活/多活数据中心的目的之一就是要充分的利用现有数据中心资源,充分利用现有网络带宽资源,提高数据中心的系统利用率。当前人们对数据中心业务零中断的需要越来越强烈,双活数据中心技术的出现,为这种需求提供了可能。双活/多活数据中心是数据中心灾备技术发展的重要趋势。