Diferencias entre durabilidad y disponibilidad en los servicios Cloud

No hay nada inmutable o libre de errores, ni tan siquiera si hablamos de las más avanzadas tecnologías. Cualquier sistema tecnológico es susceptible de errores, ya sean fallos hardware o software, del suministro eléctrico, un error humano o un desastre natural. En este terreno entran en juego dos conceptos clave: disponibilidad y durabilidad. Son tan importantes como diferentes pues, aunque están muy relacionados y tienen que ver con la accesibilidad de los datos, nos aproximamos a su significado de maneras muy distintas. Veremos qué significa cada concepto y en qué se diferencian.

En lo que se refiere a los Servicios en la Nube, una de las prioridades esenciales es la de garantizar que la información esté siempre accesible para los usuarios en todo momento. En concreto, en el sector del Almacenamiento en la Nube, se trabaja muy duro para garantizar la fiabilidad de las arquitecturas de almacenamiento asumiendo que sus componentes fallarán en algún momento.

Cualquier elemento de la cadena, ya sean cables, fuentes de alimentación, refrigeración, unidades, software o los propios administradores del sistema, pueden fallar sin previo aviso e interrumpir el acceso a los datos de los usuarios.

Disponibilidad

El concepto de disponibilidad se refiere a cuánto tiempo el proveedor de almacenamiento garantiza que los datos y servicios están disponibles para el cliente.  Se puede expresar de muchas maneras, ya sea como un porcentaje de tiempo disponible, o bien garantizar la disponibilidad del servicio en una franja horaria determinada. Este es uno de los puntos principales del SLA, o Acuerdo de Nivel de Servicio.

Por tanto, la disponibilidad se refiere al tiempo de actividad del sistema, durante el que está operativo y puede entregar datos bajo petición. Lo más normal es que esto se consiga gracias a la redundancia del hardware. Si falla un componente cualquiera, la redundancia garantizará que siempre exista otra vía para llegar a completar la operación.

Durabilidad

La durabilidad, por otro lado, se refiere a la protección de datos a largo plazo. Esto se traduce en garantizar que los datos seguirán existiendo, literalmente, y que estarán protegidos de eventos como la degradación del soporte físico en el que se encuentran almacenados (por corrosión, lesiones mecánicas, por un incendio o una inundación) o de cualquier tipo de corrupción posible.

Para poder garantizar esto no nos fijamos tanto en la redundancia del hardware, sino que hablamos de redundancia de datos, de forma que los datos nunca se pierdan, ni se vean comprometidos de ninguna manera posible.

Cómo garantizar disponibilidad y durabilidad

Cuando se produce un fallo de algún componente o cuando se cae por completo un Centro de Datos, la prioridad es restablecer el servicio lo más pronto posible. El sistema debe estar disponible para los clientes cumpliendo a rajatabla con el SLA, pero una vez que todo está de nuevo en funcionamiento, la prioridad cambia.

En ese momento, es crítico restablecer inmediatamente el acceso a los datos no corruptos. En un momento en el que el Big Data vive la gran explosión en cuanto a cantidad de datos generados, velocidad de adquisición e importancia crucial para el negocio, nos podemos imaginar que la durabilidad de los datos puede llegar a tener una relevancia todavía más grande que la disponibilidad de estos.

La durabilidad de los datos puede verse comprometida por varios motivos, entre los que destacan dos principales:

  1. La pérdida de datos, que puede ocurrir por error humano, desastre natural o por acciones maliciosas. Para proteger los datos, lo más habitual es que las instalaciones dispongan de ubicación geográfica lo más segura posible, tener instalaciones seguras con acceso controlado y monitorizar y mantener correctamente la infraestructura de almacenamiento físico.
  2. La corrupción de los datos puede ocurrir ya sea por la degradación física de los sistemas más tradicionales de discos duros o por errores en el proceso de copia, entre otros motivos. A nivel software, los sistemas operativos y las utilidades tienen formas de verificar que los datos se están manipulando correctamente durante las operaciones comunes. Los sistemas de almacenamiento de objetos monitorizarán cualquier cambio en los datos y, a menudo, los reparan automáticamente o proporcionan advertencias cuando los datos hayan cambiado.

Es importante conocer estos conceptos y darles el valor que merecen, pero hay algo que debemos comprender: no existe la protección infalible y absoluta de los datos. Los errores humanos siempre pueden suceder, igual que los desastres (aunque sea muy, muy poco probable dependiendo de dónde estén localizados los Centros de Datos).

En general, tener múltiples copias de los datos en diferentes lugares, trabajar con proveedores de almacenamiento fiables y asegurarse de que la infraestructura que almacena sus datos y su acceso a ellos sean compatibles será primordial para garantizar que los datos continúen intactos y disponibles cuando sean necesarios.