Los recientes incidentes provocados por los desastres naturales,
especialmente el huracán Katrina, han puesto de manifiesto lo importante
que resulta disponer de un buen plan de continuidad en las empresas
cuyos procesos críticos reposan en sistemas de la información.

Es frecuente que muchas organizaciones, desde pequeñas cuentas a las más
grandes corporaciones, no contemplen éste tipo de planes, o los eludan
en su puesta al día por el simple hecho de que en las zonas de operación
no sean frecuentes o sean poco probables eventos indeseables que
pudieran tumbar nuestro despliegue informático, como podrían ser los
desastres naturales o los ataques terroristas. Muchas veces, una copiosa
lluvia puede dejarnos sin actividad, y en lo referente al factor humano,
un boicot interno o la acción vandálica de un ladrón podrían ser
suficientes para paralizar la actividad de nuestra empresa.

También se considera error pensar sólo en grandes desastres como fuentes
de la ruptura de la continuidad: huracanes, tsunamis, terremotos,
inundaciones … son sin duda aspectos a considerar, pero no
menos importantes son otros problemas no naturales que podrían
dejar en el dique seco nuestras operaciones. Incrementos de la tensión
eléctrica, derrames químicos y/o tóxicos en entornos industriales, o la
simple acción humana pueden poner en jaque nuestra capacidad de operar,
tal y como explicábamos en el párrafo anterior.

En sistemas de la información, la estrategia más habitual de
recuperación es aquella que implica el levantamiento de una réplica de
la infraestructura en otro sitio, alejado del emplazamiento habitual,
donde haya podido acontecer el desastre. Así hablamos de sitios
calientes, templados, fríos y sitios espejo calientes. Hay otra
estrategia importante, que es la relativa a la pérdida del personal,
pero esa está vinculada a la gestión de recursos humanos, con lo que no
entraremos en ella. Tampoco diferenciaremos entre sitios remotos,
próximos o instalaciones de recuperación internas, quedando ésta
elección a criterio de los responsables implicados.

Los sitios fríos son los indicados para sistemas con alta tolerancia a
la indisponibilidad, cuando la recuperación se puede restablecer en dos
o tres días. Los sitios templados están indicados para tolerancias de uno
o dos días, y los calientes son aquellos emplazamientos cuya tolerancia
ante la indisponibilidad es muy limitada, requiriéndose una recuperación
total en el plazo de cuatro a 24 horas. Los sitios calientes tipo espejo
son los indicados para tolerancia cero ante los tiempos de recuperación,
y por tanto, funcionan de un modo paralelo entrando en acción
inmediatamente después de que el centro de datos principal haya
colapsado. Son por tanto, sistemas redundantes.

Recuperarse ante un desastre no es fácil. Una vez que hemos
salvaguardado los datos, toca decidir en qué orden vuelven a la
normalidad los procesos abatidos. Normalmente, los procesos que más
rentabilidad ofrecen son los que deberían ser activados primero, si bien
el orden de la recuperación varía sustancialmente en función de muchos
parámetros.

Otra tarea común es la recuperación de las líneas de contacto y de
servicio a los clientes, la cual obviamente es vital. La telefonía o los
sistemas de atención online a la clientela deben ser rápidamente
levantados, por motivos obvios.

Para elaborar un plan de recuperación no existe una metodología fija.
Cada cuenta es independiente de las demás en cuanto a sus requisitos de
recuperación y los impactos que la discontinuidad puede tener en sus
operaciones. No obstante, es frecuente contemplar, al menos, éstos ocho
pasos o fases de alto nivel a la hora de establecer una estrategia de
recuperación ante desastres:

1) Inicialización del plan. Es el punto de comienzo, donde deberían
definirse la meta del plan y los objetivos específicos que sean necesarios.

2) Gestión del riesgo y evaluación de los potenciales emergencias. La
única manera de poder ordenar adecuadamente los procesos de recuperación
es ordenando previamente los desastres que podemos sufrir, así como la
evaluación de los mismos en términos de discontinuidad, así como su
impacto técnico-económico en la organización.

3) Preparación para las posibles emergencias, identificado claramente
los métodos de recuperación de copias de seguridad y otras técnicas de
recuperación colaterales que pudieran ser necesarias.

4) Recuperación tras los desastres, donde deben quedar claramente
definidos los pasos a seguir por los equipos de recuperación,
especialmente en los casos donde haya riesgo de pérdida de vidas humanas.

5) Recuperación del negocio, ya que una vez aplicado el plan se pretende
que el negocio como conjunto vuelva a la normalidad.

6) Pruebas del proceso de recuperación, en las que se pueden
diagnosticar fallos y corregir deficiencias en las fases anteriores.

7) Entrenamiento del personal para el proceso de recuperación, ya que a
fin de cuentas, el personal es el que ejecuta los planes.

8) Actualización constante del plan de recuperación, para mantener al
día los procedimientos establecidos, así como la lista de emergencias
potenciales y su valoración probabilística de riesgo.

Los planes de recuperación son un enfoque que corrige un error
frecuente, que es aquel en el que caen muchas organizaciones que estiman
que la recuperación consiste únicamente en levantar los backups y paliar
los daños en infraestructura. Son sin duda factores importantes, pero no
son los únicos.

Y para vencer las reticencias que provoca la inversión en consultoría y
mantenimiento de un plan de recuperación, sólo hay que pensar que
sucedería si usted perdiera todos sus activos de información y no
tuviera posibilidad de recuperarlos, o si no los recuperase a tiempo, o
si al recuperarlos los datos no fueran consistentes. ¿Merece la pena?

 

Sergio Hernando
shernando@hispasec.com

Más información:

Business Continuity Planning Guidelines
http://yourwindow.to/business%2Dcontinuity/bcpindex.htm

Hispasec Sistemas. La Gestión del Riesgo
http://www.hispasec.com/unaaldia/2417

Hispasec Sistemas. El enemigo puede estar dentro
http://www.hispasec.com/unaaldia/2448

Hispasec Sistemas. El coste de los problemas de seguridad
http://www.hispasec.com/unaaldia/2473

Compártelo: