Entradas

Instalación Apache Accumulo (Pseudo Distribuido)

Imagen
Una vez que tenemos la teoría lista procederemos a instalar este componente de Apache, que será nuestra primera Base NoSQL, para esto necesitamos descargar el binario que como siempre se puede descargar del siguiente link:  https://www.apache.org/dyn/closer.lua/accumulo/1.8.1/accumulo-1.8.1-bin.tar.gz  como se muestra en la siguiente imagen. Una vez descargado el binario y lo podemos ver en nuestra máquina como en la imagen siguiente. Se procederá a descomprimirlo y a mover la carpeta a la localización de /usr/local/accumulo (Como estos ya son post muy adelantados omitiré ciertos comandos que hemos usado a lo largo del post y los daré por obvios) Una vez que se encuentra en la carpeta procedemos a configurar la instancia de Apache Accumulo que sera de forma pseudo distribuida, para eso comenzamos en caso de intentar hacer una instalación distribuida deberán realizarse estos pasos en todas las máquinas de nuestro clúster. Antes de realizar los siguientes pasos deb...

Apache Accumulo

Imagen
Accumulo es una Base de Datos NoSQL que esta basada en la definición de Big Table de Google, es una de las 3 Bases de Datos más populares abajo de Apache HBase y de Apache Cassandra, siendo la primera Base de Datos NoSQL en el mercado. Data Model La forma de almacenamiento de Apache Accumulo es de la forma key-value , como se muestra a continuación. Y aunque es almacenado de una forma key-value no solo se limita a esta estructura, ya que la llave esta compuesta de los siguientes componentes, donde la key se compone de un rowID , Column y un Timestamp como se muestra a continuación. Pero si ustedes creen que esto es todo, déjenme decirles que no es así, ya que Column cuenta con otras tres características más las cuales son Family , Qualifier y Visibility , si alguna vez han escuchado que a las Bases de Datos NoSQL les llaman Bases de Datos no estructuradas, esta es la razón de que las llamen así. Pero bueno, por que tiene esta estructura nuestra Tabla,...

Teorema CAP

Imagen
Hasta este punto deberíamos tener un panorama general de lo que es un clúster, como es que funcionan los diferentes servicios distribuidos y para que podemos usar cada uno de estos, pero bueno, llego la hora de incrementar un poco el nivel, y procederemos al apartado de almacenamiento, las bases de datos NoSQL y para descontrolarnos un poco describiré y demostraré la esencia del teorema CAP, que es un teorema que es de utilidad para esta área y poder elegir una base de datos NoSQL y no solo por decir un nombre por que es la única que conocemos, y a partir de aquí comienza la sección relacionada a NoSQL. Este teorema trata tres puntos esenciales en un sistema distribuido los cuales son consistency, availability y partition tolerance. Antes de empezar a jugar con este teorema empezaré por definir las 3 características anteriores. Consistency (Consistencia): Cualquier operación de lectura que se realice después de una operación de escritura se complete debe regresar el v...

Regresión Lineal Simple MapReduce

Imagen
Yo creo inmensamente que el Big Data aunque en mi país México es muy joven esta tecnología aún, en grandes potencias esta tecnología se utiliza para encontrar patrones en grandes volúmenes de información, hacer algoritmos predictivos, de clasificación, clusterización y más, creo inmensamente que esta tecnología será el futuro, junto con el Internet de las cosas y el cloud, hoy en día ya no es ningún impedimento hacer perdiciones de inmensos volúmenes de información y si saben programar bajo este framework, las posibilidades son inmensas, ya que puedes tratar cualquier tipo de información existente en el mundo lógico y darle algún sentido. Empezaremos estudiando que es una regresión lineal y ajustar la mejor recta de acuerdo a nuestros datos el ejemplo más sencillo de predicción, pero también el más representativo para explicar toda la teoría del post anterior, una regresión lineal no representa rectas, más bien tiene el nombre por que los parámetros que se estiman son lineales, con ...