Big Data

Entradas

Apache Accumulo

noviembre 25, 2017

Accumulo es una Base de Datos NoSQL que esta basada en la definición de Big Table de Google, es una de las 3 Bases de Datos más populares abajo de Apache HBase y de Apache Cassandra, siendo la primera Base de Datos NoSQL en el mercado. Data Model La forma de almacenamiento de Apache Accumulo es de la forma key-value , como se muestra a continuación. Y aunque es almacenado de una forma key-value no solo se limita a esta estructura, ya que la llave esta compuesta de los siguientes componentes, donde la key se compone de un rowID , Column y un Timestamp como se muestra a continuación. Pero si ustedes creen que esto es todo, déjenme decirles que no es así, ya que Column cuenta con otras tres características más las cuales son Family , Qualifier y Visibility , si alguna vez han escuchado que a las Bases de Datos NoSQL les llaman Bases de Datos no estructuradas, esta es la razón de que las llamen así. Pero bueno, por que tiene esta estructura nuestra Tabla,...

Teorema CAP

noviembre 21, 2017

Hasta este punto deberíamos tener un panorama general de lo que es un clúster, como es que funcionan los diferentes servicios distribuidos y para que podemos usar cada uno de estos, pero bueno, llego la hora de incrementar un poco el nivel, y procederemos al apartado de almacenamiento, las bases de datos NoSQL y para descontrolarnos un poco describiré y demostraré la esencia del teorema CAP, que es un teorema que es de utilidad para esta área y poder elegir una base de datos NoSQL y no solo por decir un nombre por que es la única que conocemos, y a partir de aquí comienza la sección relacionada a NoSQL. Este teorema trata tres puntos esenciales en un sistema distribuido los cuales son consistency, availability y partition tolerance. Antes de empezar a jugar con este teorema empezaré por definir las 3 características anteriores. Consistency (Consistencia): Cualquier operación de lectura que se realice después de una operación de escritura se complete debe regresar el v...

Regresión Lineal Simple MapReduce

noviembre 07, 2017

Yo creo inmensamente que el Big Data aunque en mi país México es muy joven esta tecnología aún, en grandes potencias esta tecnología se utiliza para encontrar patrones en grandes volúmenes de información, hacer algoritmos predictivos, de clasificación, clusterización y más, creo inmensamente que esta tecnología será el futuro, junto con el Internet de las cosas y el cloud, hoy en día ya no es ningún impedimento hacer perdiciones de inmensos volúmenes de información y si saben programar bajo este framework, las posibilidades son inmensas, ya que puedes tratar cualquier tipo de información existente en el mundo lógico y darle algún sentido. Empezaremos estudiando que es una regresión lineal y ajustar la mejor recta de acuerdo a nuestros datos el ejemplo más sencillo de predicción, pero también el más representativo para explicar toda la teoría del post anterior, una regresión lineal no representa rectas, más bien tiene el nombre por que los parámetros que se estiman son lineales, con ...

Buscar este blog

Big Data

Entradas

Instalación Apache Accumulo (Pseudo Distribuido)

Apache Accumulo

Teorema CAP

Regresión Lineal Simple MapReduce