¿Le gustaría aprender a hacer una instalación de Apache Hadoop en Ubuntu Linux? En este tutorial, vamos a mostrarle cómo descargar e instalar Apache Hadoop en un equipo que ejecuta Ubuntu Linux.
• Ubuntu 18.04
• Ubuntu 19.04
• Ubuntu 19.10
• Apache Hadoop 3.1.3
• Openjdk versión 11.0.4
Lista de hardware:
En la siguiente sección se presenta la lista de equipos utilizados para crear este tutorial de Apache Hadoop.
Cada pieza de hardware mencionada anteriormente se puede encontrar en el sitio web de Amazon.
Tutorial relacionado con Apache Hadoop:
En esta página, ofrecemos acceso rápido a una lista de tutoriales relacionados con Apache Hadoop.
Tutorial – Instalación de Apache Hadoop en Ubuntu Linux
Instale el paquete JDK de Java.
Utilice el siguiente mandato para buscar el directorio de instalación Java JDK.
Esta salida del comando debe mostrarle el directorio de instalación de Java.
En nuestro ejemplo, nuestro JDK Java se instala en la carpeta: /usr/lib/jvm/java-11-openjdk-amd64
Ahora, debe crear una variable de entorno denominada JAVA_HOME.
Vamos a crear un archivo para automatizar la configuración de variables de entorno necesarias
Aquí está el contenido del archivo java.sh.
Reinicie el equipo.
Utilice el siguiente comando para comprobar si se creó la variable JAVA_HOME.
Aquí está la salida del comando:
Utilice el siguiente mandato para probar la instalación de Java.
Aquí está la salida del comando:
Cree una cuenta de usuario local denominada hadoop.
Aquí está la salida del comando.
Tome nota de la contraseña de usuario de Hadoop.
Utilice el comand SU para convertirse en el usuario de Haddop.
Genere una clave SSH para la cuenta de usuario de Hadoop.
Aquí está la salida del comando.
Como usuario Haddop, agregue la clave de usuario de Hadoop a la lista de claves ssh autorizadas.
Deberá introducir la contraseña de usuario de Hadoop.
Aquí está la salida del comando.
Como la cuenta de usuario de Hadoop, intente iniciar sesión en el host local.
Cierre la sesión de la cuenta de usuario de Hadoop y vuelva a la cuenta raíz.
Descargue el paquete de Hadoop desde el sitio web oficial.
Instale el software Hadoop en su servidor Linux.
Ahora, debe crear las variables de entorno requeridas por Apache Haddop.
Vamos a crear un archivo para automatizar la configuración de variables de entorno necesarias.
Aquí está el hadoop.sh contenido del archivo.
Debe establecer la variable de entorno JAVA_HOME en el archivo hadoop.sh.
Edite el archivo hadoop-env.sh.
Agregue la siguiente línea al final de este archivo.
Reinicie el equipo.
Utilice el siguiente comando para comprobar si se crearon las variables de entorno de Apache Hadoop.
Aquí está la salida del comando:
Compruebe la versión de Apache Hadoop instalada.
Aquí está la salida del comando.
Se completó la instalación del software Apache Hadoop.
Tutorial – Ejemplo de configuración de Apache Hadoop
En nuestro ejemplo, vamos a configurar una configuración de clúster de nodo único de Apache Hadoop.
Edite el archivo core-site.xml.
Aquí está el archivo original, antes de nuestra configuración.
Aquí está el nuevo archivo con nuestra configuración.
Edite el archivo hdfs-site.xml.
Aquí está el archivo original, antes de nuestra configuración.
Aquí está el nuevo archivo con nuestra configuración.
Edite el archivo mapred-site.xml.
Aquí está el archivo original, antes de nuestra configuración.
Aquí está el nuevo archivo con nuestra configuración.
Edite el archivo yarn-site.xml.
Aquí está el archivo original, antes de nuestra configuración.
Aquí está el nuevo archivo con nuestra configuración.
Cree los directorios necesarios denominados namenode y datanode.
Utilice el siguiente comando para dar formato al nombre.
Utilice el siguiente comando para iniciar el clúster de Apache Hadoop.
Utilice el siguiente comando para iniciar el clúster de Apache Hadoop.
Abra un software de navegador, introduzca la dirección IP de su servidor Apache Hadoop más :9870
En nuestro ejemplo, se introdujo la siguiente URL en el navegador:
• http://192.168.15.10:9870
Se debe presentar la interfaz web de Apache Hadoop.
¡Felicitaciones! Ha terminado la instalación de Apache Hadoop en Ubuntu Linux.