Tutorial - Instalação Apache Hadoop no Ubuntu Linux [ Passo a Passo ]

Gostaria de aprender a fazer uma instalação apache Hadoop no Ubuntu Linux? Neste tutorial, vamos mostrar como baixar e instalar apache Hadoop em um computador executando o Ubuntu Linux.

• Ubuntu 18.04
• Ubuntu 19.04
• Ubuntu 19.10
• Apache Hadoop 3.1.3
• Versão Openjdk 11.0.4

Lista de hardware:

A seção a seguir apresenta a lista de equipamentos usados para criar este tutorial Apache Hadoop.

Cada pedaço de hardware listado acima pode ser encontrado no site da Amazon.

Tutorial relacionado apache Hadoop:

Nesta página, oferecemos acesso rápido a uma lista de tutoriais relacionados ao Apache Hadoop.

Lista de Tutoriais - Apache Hadoop

Tutorial - Instalação Apache Hadoop no Ubuntu Linux

Instale o pacote Java JDK.

Copy to Clipboard

Use o seguinte comando para encontrar o diretório de instalação Java JDK.

Copy to Clipboard

Esta saída de comando deve mostrar-lhe o diretório de instalação Java.

Copy to Clipboard

Em nosso exemplo, nosso Java JDK está instalado a pasta: /usr/lib/jvm/java-11-openjdk-amd64

Agora, você precisa criar uma variável ambiental chamada JAVA_HOME.

Vamos criar um arquivo para automatizar a configuração de variáveis de ambiente necessárias

Copy to Clipboard

Aqui está o java.sh conteúdo de arquivo.

Copy to Clipboard

Reinicie o computador.

Copy to Clipboard

Use o seguinte comando para verificar se a variável JAVA_HOME foi criada.

Copy to Clipboard

Aqui está a saída de comando:

Copy to Clipboard

Use o seguinte comando para testar a instalação java.

Copy to Clipboard

Aqui está a saída de comando:

Copy to Clipboard

Crie uma conta de usuário local chamada hadoop.

Copy to Clipboard

Aqui está a saída de comando.

Tome nota da senha do usuário Hadoop.

Copy to Clipboard

Use a comand su para se tornar o usuário Haddop.

Gere uma chave SSH para a conta de usuário Hadoop.

Copy to Clipboard

Aqui está a saída de comando.

Copy to Clipboard

Como usuário Haddop, adicione a chave do usuário Hadoop à lista de chaves ssh autorizadas.

Você precisará digitar a senha do usuário Hadoop.

Copy to Clipboard

Aqui está a saída de comando.

Copy to Clipboard

Como a conta de usuário Hadoop, tente fazer login no host local.

Copy to Clipboard

Logoff da conta de usuário Hadoop e voltar para a conta raiz.

Copy to Clipboard

Baixe o pacote Hadoop no site oficial.

Copy to Clipboard

Instale o software Hadoop no seu servidor Linux.

Copy to Clipboard

Agora, você precisa criar as variáveis ambientais exigidas apache Haddop.

Vamos criar um arquivo para automatizar a configuração de variáveis de ambiente necessárias.

Copy to Clipboard

Aqui está o hadoop.sh conteúdo de arquivo.

Copy to Clipboard

Você precisa definir a variável ambiente JAVA_HOME no arquivo hadoop.sh.

Edite o arquivo hadoop-env.sh.

Copy to Clipboard

Adicione a linha a seguir no final deste arquivo.

Copy to Clipboard

Reinicie o computador.

Copy to Clipboard

Use o seguinte comando para verificar se as variáveis ambientais Apache Hadoop foram criadas.

Copy to Clipboard

Aqui está a saída de comando:

Copy to Clipboard

Verifique a versão Apache Hadoop instalada.

Copy to Clipboard

Aqui está a saída de comando.

Copy to Clipboard

A instalação do software Apache Hadoop foi concluída.

Tutorial - Exemplo de configuração apache hadoop

Em nosso exemplo, vamos configurar uma configuração de cluster de nó único Apache Hadoop.

Edite o arquivo core-site.xml.

Copy to Clipboard

Aqui está o arquivo original, antes da nossa configuração.

Copy to Clipboard

Aqui está o novo arquivo com nossa configuração.

Copy to Clipboard

Edite o arquivo hdfs-site.xml.

Copy to Clipboard

Aqui está o arquivo original, antes da nossa configuração.

Copy to Clipboard

Aqui está o novo arquivo com nossa configuração.

Copy to Clipboard

Edite o arquivo mapred-site.xml.

Copy to Clipboard

Aqui está o arquivo original, antes da nossa configuração.

Copy to Clipboard

Aqui está o novo arquivo com nossa configuração.

Copy to Clipboard

Edite o arquivo fio-site.xml.

Copy to Clipboard

Aqui está o arquivo original, antes da nossa configuração.

Copy to Clipboard

Aqui está o novo arquivo com nossa configuração.

Copy to Clipboard

Crie os diretórios necessários chamado namenode e datanode.

Copy to Clipboard

Use o seguinte comando para formatar o nome.

Copy to Clipboard

Use o seguinte comando para iniciar seu aglomerado Apache Hadoop.

Copy to Clipboard

Use o seguinte comando para iniciar seu aglomerado Apache Hadoop.

Copy to Clipboard

Abra um software de navegador, digite o endereço IP do seu servidor Apache Hadoop mais :9870

Em nosso exemplo, a seguinte URL foi inserida no Navegador:

• http://192.168.15.10:9870

A interface web Apache Hadoop deve ser apresentada.

Parabéns! Você terminou a instalação Apache Hadoop no Ubuntu Linux.