Cómo mejorar la disponibilidad de las aplicaciones
Garantizar la disponibilidad de nuestras aplicaciones es, como empresa, algo de vital importancia por diversidad de buenos motivos. Y hay algo que entender para mejorar esa disponibilidad, y es que tiene mucho más que ver con la mejora de los procesos operativos, los procedimientos y la cultura de su organización, que de otros temas más técnicos.
Disponemos de multitud de herramientas para garantizar la disponibilidad de los servidores (y nos certificamos para ello). Tejemos elaboradas redes de redundancia para mantenerlo todo en orden. Pero, un día, algo se cae. Y arrastra consigo decenas o centenares de negocios. Sitios web que no están disponibles, aplicaciones que no responden y, en el otro lado, miles de clientes que sufren algún tipo de perjuicio, desde la simple frustración de no poder acceder a donde desean, hasta las pérdidas económicas o de reputación en los peores casos, al no cumplir con el SLA.
Por ese motivo, garantizar la disponibilidad de nuestras aplicaciones es, como empresa, algo de vital importancia por diversidad de buenos motivos. Y hay algo que entender para mejorar esa disponibilidad, y es que tiene mucho más que ver con la mejora de los procesos operativos, los procedimientos y la cultura de su organización, que de otros temas más técnicos.
La disponibilidad de las aplicaciones es clave para el negocio. Veamos cuatro claves para mejorar este aspecto y minimizar daños. V
1. Conocer los riesgos propios
Estimar correctamente el riesgo propio es una carta ganadora. No debemos subestimarlo en ningún caso. Hay problemas conocidos (es decir, que sabemos que se pueden dar), y otros desconocidos. Los problemas que no sabemos que no conocemos son aquellos que, a la hora de la verdad, fuerzan la indisponibilidad de las aplicaciones. Y esos son los que nos tienen que preocupar, y que debemos conocer.
Por eso, la gestión de riesgos consiste en identificar las áreas de preocupación, etiquetarlas, cuantificarlas y priorizarlas, es decir, abordar primero los riesgos de mayor impacto en el negocio. La matriz de riesgos es la herramienta adecuada, ya que nos permite disponer de una lista de todos los problemas conocidos, y los potenciales posibles, a los que asignamos un nivel de gravedad (en caso de darse el problema), y una probabilidad de que dicho riesgo se dé.
Es evidente que los riesgos que más nos deben preocupar son los que tienen una alta probabilidad y una alta gravedad. Gracias a la matriz de riesgos podemos priorizar y saber en qué es más importante trabajar y en qué no. Esta herramienta nos puede ayudar a reducir los problemas de disponibilidad de las apps.
2. Analizar el software y la infraestructura operacional es vital
Saber exactamente qué hace el software y cómo se relaciona con la infraestructura en todo momento nos permitirá saber cómo está funcionando la aplicación. Esto permite ajustar y optimizar el entorno operativo, detectar y resolver problemas operativos, y comprender quién y cómo utiliza el software.
La capacidad de analizar el software y su funcionamiento de este modo nos permite supervisar el sistema continuamente, examinar los cambios de rendimiento en los despliegues (donde se pueden introducir problemas), detectar anomalías y ayudar a resolver un incidente en curso.
3. Reducir la deuda técnica
En pocas palabras, la deuda técnica es un concepto en desarrollo de software que viene a indicar el coste implícito del trabajo adicional que se debe hacer al elegir inicialmente una solución fácil en lugar de un enfoque más complejo en su desarrollo e implementación.
No es algo malo por sí mismo, y muchas veces es necesario asumir esa deuda para sacar adelante los proyectos. Pero en este caso, para maximizar la disponibilidad de las aplicaciones, debemos intentar reducirla. Volvemos a la matriz de riesgos, a por uno de los que son probables y graves. Como lo más probable es que no podamos eliminar ese riesgo sin más, debemos trabajar para reducir su gravedad, o reducir su probabilidad de ocurrencia.
4. Recuperación rápida
Detectar un problema es importante, pero disponer de mecanismos de recuperación lo más rápidos posible es todavía más crítico. «Levantar» la aplicación rápido implica menos riesgo de pérdidas económicas o de reputación, menos impacto en el negocio (que es lo que buscamos minimizar todo el tiempo).
El tiempo entre que detectamos un problema y lo resolvemos se denomina tiempo medio en reparar (o, en inglés, Mean Time to Repair). Cuanto mayor sea, peor. En ocasiones, de todos modos, existen problemas que podemos anticipar (sí, gracias a la matriz de riesgos) y que pueden solucionarse de manera automatizada, sin apenas llegar a ser percibidos por nadie.
En Arsys nos preocupamos de acompañar a nuestros clientes en el proceso de Transformación Digital, ofreciéndoles no solo las herramientas adecuadas, sino un asesoramiento constante y el apoyo de un nutrido grupo de profesionales que dan servicio las 24 horas. ¡Dar el paso a la digitalización es muy sencillo con nosotros!