Tutorial - Instalación de Apache Hadoop en Ubuntu Linux [ Paso a paso ]

¿Le gustaría aprender a hacer una instalación de Apache Hadoop en Ubuntu Linux? En este tutorial, vamos a mostrarle cómo descargar e instalar Apache Hadoop en un equipo que ejecuta Ubuntu Linux.

• Ubuntu 18.04
• Ubuntu 19.04
• Ubuntu 19.10
• Apache Hadoop 3.1.3
• Openjdk versión 11.0.4

Lista de hardware:

En la siguiente sección se presenta la lista de equipos utilizados para crear este tutorial de Apache Hadoop.

Cada pieza de hardware mencionada anteriormente se puede encontrar en el sitio web de Amazon.

Tutorial relacionado con Apache Hadoop:

En esta página, ofrecemos acceso rápido a una lista de tutoriales relacionados con Apache Hadoop.

Lista de tutoriales - Apache Hadoop

Tutorial - Instalación de Apache Hadoop en Ubuntu Linux

Instale el paquete JDK de Java.

Copy to Clipboard

Utilice el siguiente mandato para buscar el directorio de instalación Java JDK.

Copy to Clipboard

Esta salida del comando debe mostrarle el directorio de instalación de Java.

Copy to Clipboard

En nuestro ejemplo, nuestro JDK Java se instala en la carpeta: /usr/lib/jvm/java-11-openjdk-amd64

Ahora, debe crear una variable de entorno denominada JAVA_HOME.

Vamos a crear un archivo para automatizar la configuración de variables de entorno necesarias

Copy to Clipboard

Aquí está el contenido del archivo java.sh.

Copy to Clipboard

Reinicie el equipo.

Copy to Clipboard

Utilice el siguiente comando para comprobar si se creó la variable JAVA_HOME.

Copy to Clipboard

Aquí está la salida del comando:

Copy to Clipboard

Utilice el siguiente mandato para probar la instalación de Java.

Copy to Clipboard

Aquí está la salida del comando:

Copy to Clipboard

Cree una cuenta de usuario local denominada hadoop.

Copy to Clipboard

Aquí está la salida del comando.

Tome nota de la contraseña de usuario de Hadoop.

Copy to Clipboard

Utilice el comand SU para convertirse en el usuario de Haddop.

Genere una clave SSH para la cuenta de usuario de Hadoop.

Copy to Clipboard

Aquí está la salida del comando.

Copy to Clipboard

Como usuario Haddop, agregue la clave de usuario de Hadoop a la lista de claves ssh autorizadas.

Deberá introducir la contraseña de usuario de Hadoop.

Copy to Clipboard

Aquí está la salida del comando.

Copy to Clipboard

Como la cuenta de usuario de Hadoop, intente iniciar sesión en el host local.

Copy to Clipboard

Cierre la sesión de la cuenta de usuario de Hadoop y vuelva a la cuenta raíz.

Copy to Clipboard

Descargue el paquete de Hadoop desde el sitio web oficial.

Copy to Clipboard

Instale el software Hadoop en su servidor Linux.

Copy to Clipboard

Ahora, debe crear las variables de entorno requeridas por Apache Haddop.

Vamos a crear un archivo para automatizar la configuración de variables de entorno necesarias.

Copy to Clipboard

Aquí está el hadoop.sh contenido del archivo.

Copy to Clipboard

Debe establecer la variable de entorno JAVA_HOME en el archivo hadoop.sh.

Edite el archivo hadoop-env.sh.

Copy to Clipboard

Agregue la siguiente línea al final de este archivo.

Copy to Clipboard

Reinicie el equipo.

Copy to Clipboard

Utilice el siguiente comando para comprobar si se crearon las variables de entorno de Apache Hadoop.

Copy to Clipboard

Aquí está la salida del comando:

Copy to Clipboard

Compruebe la versión de Apache Hadoop instalada.

Copy to Clipboard

Aquí está la salida del comando.

Copy to Clipboard

Se completó la instalación del software Apache Hadoop.

Tutorial - Ejemplo de configuración de Apache Hadoop

En nuestro ejemplo, vamos a configurar una configuración de clúster de nodo único de Apache Hadoop.

Edite el archivo core-site.xml.

Copy to Clipboard

Aquí está el archivo original, antes de nuestra configuración.

Copy to Clipboard

Aquí está el nuevo archivo con nuestra configuración.

Copy to Clipboard

Edite el archivo hdfs-site.xml.

Copy to Clipboard

Aquí está el archivo original, antes de nuestra configuración.

Copy to Clipboard

Aquí está el nuevo archivo con nuestra configuración.

Copy to Clipboard

Edite el archivo mapred-site.xml.

Copy to Clipboard

Aquí está el archivo original, antes de nuestra configuración.

Copy to Clipboard

Aquí está el nuevo archivo con nuestra configuración.

Copy to Clipboard

Edite el archivo yarn-site.xml.

Copy to Clipboard

Aquí está el archivo original, antes de nuestra configuración.

Copy to Clipboard

Aquí está el nuevo archivo con nuestra configuración.

Copy to Clipboard

Cree los directorios necesarios denominados namenode y datanode.

Copy to Clipboard

Utilice el siguiente comando para dar formato al nombre.

Copy to Clipboard

Utilice el siguiente comando para iniciar el clúster de Apache Hadoop.

Copy to Clipboard

Utilice el siguiente comando para iniciar el clúster de Apache Hadoop.

Copy to Clipboard

Abra un software de navegador, introduzca la dirección IP de su servidor Apache Hadoop más :9870

En nuestro ejemplo, se introdujo la siguiente URL en el navegador:

• http://192.168.15.10:9870

Se debe presentar la interfaz web de Apache Hadoop.

¡Felicitaciones! Ha terminado la instalación de Apache Hadoop en Ubuntu Linux.