Apache Cassandra, una de las mejores opciones NoSQL para almacenamiento masivo en Cloud

Apache Cassandra es un sistema gestor para bases de datos NoSQL distribuidas. Está especialmente diseñado para el almacenamiento masivo, entornos donde la escalabilidad y disponibilidad suele ser las principales preocupaciones para los equipos técnicos, algo que podemos resolver muy fácilmente cuando lo instalamos en los  Servidores Cloud de Arsys.

Desarrollada inicialmente por Facebook, ahora es uno de los proyectos más avanzados de la fundación Apache. Cassandra tiene la habilidad de trabajar con múltiples nodos, que pueden estar distribuidos en centros de datos separados geográficamente. Sus nodos se comunican mediante protocolo P2P y su redundancia es máxima. Esto implica que cualquier nodo puede responder una solicitud y asegura una gran tolerancia a fallos. Debido a su arquitectura, no necesita de un nodo maestro, lo que ofrece también una baja latencia para cualquier cliente que se conecte a la base de datos.

Su modelo de datos consiste en tablas (llamadas así a partir de las últimas versiones), donde se almacenan datos mediante clave-valor. Como otros sistemas NoSQL, tiene la habilidad de conseguir almacenar en una tabla valores con distintos juegos de datos, de modo que permite una gran versatilidad a los desarrolladores. Las tablas se pueden gestionar en tiempo de ejecución, permitiendo incluso operaciones de creación, borrado, alteración, etc. sin detener actualizaciones o consultas.

En cuanto a escalabilidad es una de las mejores bases de datos NoSQL disponibles, ya que su rendimiento aumenta linealmente a medida que se agregan nuevos nodos. También su arquitectura distribuida nos asegura una alta tolerancia a fallos. Incluso, en caso de fallo en uno de sus nodos, es posible desconectarlo o reemplazarlo por otra máquina en caliente, sin que la base de datos necesite detenerse para realizar la operación.

Para el acceso a la información el sistema usa un lenguaje propio llamado CQL (Cassandra Query Language), que permite una sintaxis similar al conocido SQL, aunque el número de posibilidades es mucho menor. Por ejemplo, Cassandra no permite joins y en lugar de ello, para aumentar el rendimiento de las aplicaciones y facilitar el acceso a la información, se recomienda optar por la desnormalización de los datos.

Otros proyectos de Apache como Hadoop MapReduce, Apache Pig o Apache Hive son compatibles con la base de datos Cassandra.

Despliegue de Cassandra en Cloud

Cassandra es una base de datos pensada para la Nube, pues podremos explotar su potencial únicamente cuando se trabaja en entornos Cloud. Repasando algunas de sus algunas de sus características podremos apreciarlo mejor:

  • Descentralización.  No hay un nodo central que maneje nodos secundarios, todos tienen el mismo rol dentro de un clúster y pueden dar respuesta a cualquier solicitud.
  • Replicación. Diseñada para el despliegue en gran cantidad de nodos, permite incluso la replicación en diversos centros de datos.
  • Tolerancia a fallos. cuando un nodo no funciona la base de datos sigue trabajando normalmente con los restantes, se pueden añadir y quitar nodos sin detener el servicio.
  • Escalabilidad. Es una de las bases de datos más escalables y para conseguirlo únicamente se deben instanciar más nodos.

Como se puede comprobar, para el despliegue, optimización y mantenimiento en el día a día de Cassandra es esencial la creación ágil de nodos. Los servidores Cloud son los únicos que nos permiten instanciación de máquinas en minutos, lo que facilita la operativa en el aprovisionamiento de nuevos nodos cuando sea necesario.

Además, poner en marcha Apache Cassandra sobre los Servidores Cloud de Arsys es tan fácil como seleccionar esta aplicación desde el Catálogo de Aplicaciones o desde el propio panel de control. Con sólo unos clics y en sólo unos minutos, tendremos este software Open Source desplegado sobre una plataforma IaaS de alto rendimiento.

Compartir

Share on FacebookTweet about this on TwitterShare on LinkedInEmail this to someoneShare on Google+
0 comentarios

Dejar un comentario

¿Quieres unirte a la conversación?
Siéntete libre de contribuir

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *