Instalación Apache Sqoop
Ahora procederemos a instalar Apache Sqoop, como en la parte de teoría vimos, este es un Job que implementa solo el Mapper, entonces la Instalación de esta herramienta será muy sencillo. Para empezar necesitamos descargar los Binarios de Apache Sqoop de la siguiente página con el siguiente link: http://sqoop.apache.org/

Como podemos observar, hay dos formas de extraer los binarios de Apache Sqoop, la del recuadro rojo y la del recuadro verde, como la documentación dice, descargaremos el del recuadro rojo, ya que la versión del recuadro verde aún no se recomienda para un ambiente productivo, por esa razón descargaremos el del recuadro rojo.

Podemos descargar cualquier tar.gz de los que aparecen aquí, pero yo descargaré la versión dentro del recuadro verde.

Una vez descargados el binario de Apache Sqoop, procedemos a descomprimirlo y mover la carpeta resultante a /usr/local/ con el siguiente comando:
Una vez terminando de ejecutar los comandos anteriores, configuramos nuestro archivo de usuario donde hemos dado de alta las variables de ambiente de Apache Hadoop, Apache Hive, ahora agregaremos la de Apache Sqoop, para eso se deberán ejecutar los siguientes comandos.
nano ~/.bashrc
Agregamos las siguientes variables al archivo dentro de los recuadros verdes.

Y aplicamos los cambios.
source ~/.bashrc

Después de que aplicamos los cambios, podemos escribir la palabra reservada sqoop para verificar que la instalación ha sido exitosa.

Como podemos ver, el comando sqoop ya funciona correctamente, aunque marca 3 warnings esos no afectan el desempeño de la herramienta, esos warnings los eliminaremos conforme instalemos esas herramientas en el futuro.
Ahora tenemos habilitada la herramienta sqoop en nuestra distribución, si tienes un clúster multinodo y quieres esta herramienta en más de un nodo, deberás seguir los mismos pasos en cada nodo donde quieras tener habilitada esta herramienta.

Como podemos observar, hay dos formas de extraer los binarios de Apache Sqoop, la del recuadro rojo y la del recuadro verde, como la documentación dice, descargaremos el del recuadro rojo, ya que la versión del recuadro verde aún no se recomienda para un ambiente productivo, por esa razón descargaremos el del recuadro rojo.

Podemos descargar cualquier tar.gz de los que aparecen aquí, pero yo descargaré la versión dentro del recuadro verde.

Una vez descargados el binario de Apache Sqoop, procedemos a descomprimirlo y mover la carpeta resultante a /usr/local/ con el siguiente comando:
- tar -xzvf sqoop-1.4.6.bin__hadoop-2.0.4-alpha.tar.gz
- su
- mv sqoop-1.4.6.bin__hadoop-2.0.4-alpha/ /usr/local/sqoop/
- exit
Una vez terminando de ejecutar los comandos anteriores, configuramos nuestro archivo de usuario donde hemos dado de alta las variables de ambiente de Apache Hadoop, Apache Hive, ahora agregaremos la de Apache Sqoop, para eso se deberán ejecutar los siguientes comandos.
nano ~/.bashrc
Agregamos las siguientes variables al archivo dentro de los recuadros verdes.

Y aplicamos los cambios.
source ~/.bashrc

Después de que aplicamos los cambios, podemos escribir la palabra reservada sqoop para verificar que la instalación ha sido exitosa.

Como podemos ver, el comando sqoop ya funciona correctamente, aunque marca 3 warnings esos no afectan el desempeño de la herramienta, esos warnings los eliminaremos conforme instalemos esas herramientas en el futuro.
Ahora tenemos habilitada la herramienta sqoop en nuestra distribución, si tienes un clúster multinodo y quieres esta herramienta en más de un nodo, deberás seguir los mismos pasos en cada nodo donde quieras tener habilitada esta herramienta.
Comentarios
Publicar un comentario