| Artículos | 01 DIC 2007

Duerma tranquilo: Estrategias de copias de seguridad y recuperación

Tags: Histórico
Daniel Matey.
Muchas veces me preguntan qué es lo primero que hay que hacer cuando uno se tiene que encargar de una nueva red. Para mí sólo hay una respuesta: preguntar por los backups. Las redes pueden ser de muchos tipos. Pueden ser grandes, pequeñas, homogéneas, heterogéneas, seguras, inseguras, estables o caóticas, pero en cualquier caso lo más importante es que se disponga de copias de seguridad. Si los backups están bien, se puede seguir trabajando.

Murphy tenía razón, si algo es susceptible de romperse, se romperá, y cuando se rompa querrás tener un backup a mano. Recuerdo especialmente un caso; una gran empresa dueña de una cabina de discos SAN último modelo, controladoras redundantes, switches de fibra redundantes y 48 discos duros en diferentes niveles de RAID. La cabina parecía tan robusta que hasta hacían los backups en ella. El problema vino cuando, un día, los 48 discos duros mostraron unas brillantes lucecitas rojas y todo dejo de funcionar. Misteriosamente, la información necesaria para que las controladoras entendieran los RAIDS se había corrompido y aunque los 48 discos contenían esa información replicada, los 48 la tenían mal. Ni el fabricante pudo arreglarlo. Dada la complejidad de la solución, las empresas que se dedican a la recuperación de discos duros averiados tampoco podían recuperar esa información y las pocas empresas que se aventuraban a intentarlo pedían cifras astronómicas por adelantado sin garantizar más que la información extraída en ficheros planos.
Me llamaron para ver si podía ayudar en algo. El caso es que la empresa no tenía una buena solución de backups: usaban la misma cabina para hacer backups a disco, apenas tenían cintas y las que tenían valían para poco. Finalmente, perdieron 48 horas de servicio y mucha información; la empresa sobrevivió, aunque las estadísticas dicen que más de la mitad de las empresas que pasan por una situación de este tipo terminan teniendo que cerrar.
Recuerdo el día que se quemó el edificio Windsord en Madrid. Yo veía esas imágenes y no podía dejar de pensar en cómo me sentiría si yo fuera el responsable de un CPD localizado dentro de esa masa de acero llameante.
No es fácil tener una buena estrategia de backups y recuperación. Desde luego, cuando se tiene mucha información tampoco es barato y, definitivamente, es muy trabajoso y rutinario. Pero es esencial y la más importante de las tareas que hay que hacer cada día.
Es cierto que hoy en día muchas empresas tienen planes de reacción ante desastres y planes de contingencias, aspectos estos que trataremos en otros artículos, y que la existencia de estos planes está relajando en cierta forma la actitud hacia los backups más típicos. Pero, siendo sincero, los centros de respaldo son muy complejos: algo puede fallar y nada me hace sentir más seguro que saber que, en última instancia, si fallan el resto de planes, puedo recuperar una situación conocida.
Por otra parte, también hay que tener en cuenta que los centros de respaldo funcionan en tiempo real y que hay situaciones en la que es necesario reponer una situación de un tiempo atrás. Un ejemplo de esto es el típico error en el cual un desarrollador se confunde de entorno y hace un cambio en producción. En cuestión de segundos el centro de respaldo ha replicado los cambios y la única forma de sortear la situación exitosamente es recuperar un backup cercano al momento y recorrer los logs hasta el instante anterior al error.
Yo tengo un lema, un mantra que repito incansablemente en mis redes: “ni un día sin backups”, todo puede esperar, nada es excusa para no tener un backup.

El backup más básico
¿Qué es un buen backup? Aquel que contiene lo que tiene que contener, está hecho, es recuperable, localizable, accesible y seguro. Cumplir con este conjunto de requisitos es normalmente mucho más difícil de lo que se piensa. A lo largo de este artículo iremos viendo cómo desarrollar un sistema de backup y recuperación capaz de cumplir con estos requisitos.

Piénselo bien; ¿qué tiene que contener el backup?
Por ejemplo, si hace backup de una base de datos, al tener un incidente grave se dará cuenta de que daría lo que fuera por haber hecho un backup de las bases de datos de sistema, la configuración del servidor, usuarios, y permisos. Es muy común que los backups se queden a medias; es mejor pasarse que quedarse cortos. Sus límites son dos; primero el tiempo que tienes para realizar la copia de seguridad, también conocido como “ventana de backup”, y que viene determinado principalmente por la velocidad a la que puedas copiar datos; y segundo, la capacidad de su sistema de backup.
La ventana de backup de las empresas puede variar sustancialmente. En una PYME seguramente tengamos toda la noche para realizar backups, pero en una multinacional nos podemos llegar a encontrar con una ventana inexistente. La razón por la que definimos una ventana es porque el rendimiento de los sistemas se ve afectado por el hecho de realizar las copias: los backups a cinta son lentos. Por esta razón, la copia se puede alargar afectando a la experiencia de los usuarios y, por lo tanto, a la calidad del servicio. Este problema tiene soluciones que iremos viendo en este artículo.
Los tipos de backups son muchos, principalmente tenemos: las típicas copias a cinta, las copias a discos duros y las copias a sistemas remotos. Después tenemos las diferentes combinaciones que veremos más adelante. Siguiendo con aspectos básicos, podríamos decir que, además, las copias pueden ser completas (lo ideal si se puede), diferenciales o incrementales, aspecto éste que se ve complicado además por el uso cada vez mayor de instantáneas o snapshots.
Para definir de una forma muy simple lo que es una snapshot, tendríamos que decir que es una copia en la que el tamaño ocupado será igual a las modificaciones realizadas en los datos de los que se ha realizado la copia desde que se realizó la misma hasta la realización de la siguiente instantánea. Esto significa que si hacemos una snapshot de un fichero de 1 GB, la copia no ocupará nada hasta que empecemos a escribir en el fichero.
La copia a cinta tiene, a su vez, muchas variantes. Dependiendo de su capacidad y velocidad de acceso, tenemos cintas desde pocos gigas a cientos de ellos. La velocidad de grabación de las cintas siempre es lenta. Este aspecto es especialmente determinante a la hora de establecer el volumen de datos que podremos copiar en nuestra ventana de backup, pero no hay que dejarse engañar sólo por el dato de la velocidad máxima de escritura en cinta. Aspectos tales como el nivel de ocupación de los servidores de los que hagamos copia, la carga del propio servidor de backups, el tráfico y el estado de la red así como otros aspectos pueden hacer que nos quedemos muy lejos de esos límites teóricos. La capacidad de una cinta también es cuestionable. Por ejemplo, es común que la capacidad de las cintas se exprese con cifras del tipo “110/220”, lo que significa que la cinta soporta 110 gigas y 220 si se comprime. Esta compresión se puede realizar por software o por hardware si la unidad de cinta lo soporta, pero, una vez más, la capacidad en compresión es teórica, ya que presupone un ratio de 2 a 1 que, aunque en muchos casos se puede superar, en la mayoría de los casos no se cons

Contenidos recomendados...

Comentar
Para comentar, es necesario iniciar sesión
Se muestran 0 comentarios
X

Uso de cookies

Esta web utiliza cookies técnicas, de personalización y análisis, propias y de terceros, para facilitarle la navegación de forma anónima y analizar estadísticas del uso de la web. Consideramos que si continúa navegando, acepta su uso. Obtener más información