jueves, 22 de marzo de 2012

Distancia entre datacenters: condicionantes tecnológicos

Una de las preguntas frecuentes cuando de diseña un plan de continuidad para el serivicio IT es la distancia que debe haber entre datacenters. La respuesta es sencilla: aquella distancia suficientemente alejada para que un mismo evento no afecte a ambos datacenters pero suficientemente cercana para que puedan seguir prestandose los servicios con normalidad, sobre todo en aquellos servicios en los que también intervienen personas.
La madurez de los sistemas de información han hecho que en la mayoría de las empresas los procesos que forman el servicio IT tengan gran autonomía o gestionados de forma remota. Un ejemplo claro de esto ha sido la cada vez más extendida práctica del cloud computing. Esto supone que el único condicionante para la elección de la ubicación del centro de respaldo sea el Riesgo. Entonces, llevemoslo lo más alejado posible.¿no?

Sin embargo hay dos derivadas más  que influyen a la hora de establecer la distancia: El coste, como todo, y de la propia tecnología.

Tecnología

Las comunicaciones entre centros de respaldo se realiza en la práctica totalidad de las conexiones mediante fibra óptica, aunque dependiendo de los requisitos de los sistemas a interconectar se utilizarán unos tipos de tecnología u otros. Básicamente existen tres tipos:
  • Conexiones a nivel 3: se utiliza para conexiones con CPDs con pocos requisitos de latencia y transparencia. En este tipo de conexiones se engloban, por ejemplo, las conexiones MacroLan de Telefónica, LanLink de Colt o LanExtension de BT.
  • Conexiones a nivel 2: se basan en el transporte de protocolos de enlace, sobre todo ethernet. Este tipo de conexiones son más transparentes que las anteriores y con técnicas como FCoE permiten cubrir la gran mayoría de los escenarios de conectividad cuando las aplicaciones de cliente no tengan excesivos requisitos de latencia.
  • Conexiones a nivel 1: La trasmisión de señales por fibra óptica multiplexada mediante DWDM o CWDM permite la interconexion de canales a altas velocidades (actualmente 40Gb y hasta 100Gb) sin apenas introducir latencia, más que la que producirá la propia longitud de la fibra. 
La mayoria de los datacenters estan conectados utilizando estas técnicas, siendo las distancias habituales entre 10 y 80 kilómetros. Para distancias más largas los proyectos se complican: para una distancia interprovincial se deben utilizar redes de larga distancia, con protocolos como SDH, que permiten una regeneración continua de la señal, aunque introducen latencia y se pierde transparencia.

La solución por la que han optado la mayoría de las grandes multinacionales es la de tener parejas de datacenters con respaldos cruzados, de tal forma que cada pareja de datacenters estarán activo-activo a poca distancia (1 a 5 kms) y el respaldo para contingencias extremas se realiza por otra pareja de datacenters a varios cientos de kilómetros, o incluso en otro continente. Por ejemplo, el Santander tiene bajo esta estructura datacenters en  Madrid, Cantabria (de próxima inauguración), Londres, Sao Paulo (Brasil) y Querétaro (México). En el siguiente video se muestra una visita virtual por el CPD del Santander en Brasil.


Coste

Es fácil deducir que a mayor distancia que cubrir, mayor coste. Dependiendo de los parámetros de atenuación de la fibra se deberá implementar la solución con láseres de mayor o menor potencia. Además para distancias mayores de 80Km es necesaria regeneración o amplificación de la señal y, por lo tanto, más equipamiento y más coste. Si hablamos ya de distancias de cientos de kilómetros (como Madrid-Cantabria del Santander) o transporte de lambdas internacionales, la factura puede llegar a ser bastante elevada y complicada de justificar frente al Riesgo.

Además cuanto mayor es la distancia más probabilidades hay de que la fibra sea interceptada y la comunicación sea escuchada, con lo cual se deben incorporar mecanismos de cifrado como se explica en mi entrada de secuirtybydefault .



2 comentarios:

Anónimo dijo...

Hola,

Respecto los elementos tecnológicos del plan de continuidad parece clara la solución de 2 datacenters separados... Para los datos y centro de trabajo las soluciones también suelen ser claras, pero para empleados y proveedores he visto diferentes soluciones teóricas pero si se tienen que poner en práctica sería más que dudosa su funcionalidad.

¿Tienes algunos referentes de soluciones para estos elementos que estén bien contrastadas?

Por ejemplo para empleados se suelen identificar backups, pero luego no se revisa si en vacaciones coinciden, o aspectos similares.

Gracias.

Jorge Gª Carnicero dijo...

Gracias por tu comentario.

Las soluciones de respaldo para empleados y proveedores son muy dependientes del negocio y de las actividades que realice cada empleado o proveedor.

Por ejemplo, no es lo mismo un proveedor de de material para una fábrica que un proveedor de seguridad física. Ambos son proveedores, pero el respaldo es completamente diferente.

Respecto a las soluciones de backup que comentas, es cierto que las empresas desarrollan planes de continuidad muy aparentes sobre el papel pero que después dejan de lado este tipo de circunstancias temporales y que muchas veces se escapan a las pruebas. En función de la madurez de los planes así deberían tenerse en cuenta este tipo de circunstancias. En muchos casos todavía les queda muy lejos a las empresas.