Version 2021

A partir da Atualização 4 do MicroStrategy 2021, o Hadoop Gateway não é mais compatível.

Ativar Hadoop Gateway para dar suporte à alta disponibilidade de NameNode

O Hadoop Gateway aceita o Hadoop NameNode High Availability a partir do MicroStrategy 10.10. Já não é mais necessário procurar os arquivos com o Hadoop WebHDFS. As informações do catálogo de HDFS são recuperadas por meio do Hadoop Gateway em vez do WebHDFS.

Pesquisar HDFS por meio do Hadoop Gateway

Entre em contato com o administrador do Hadoop para obter o nameservice do Hadoop Namenode High Availability, o endereço IP do Hadoop Namenode e o número da porta HDFS antes de iniciar as etapas abaixo.

  1. Na caixa de diálogo Conectar-se ao Hadoop, clique em Alterar Conexão.

  2. Na caixa de diálogo Fonte de Dados, marque a caixa de seleção Editar sequência de conexão.

  3. Para um NameNode único:

    Certifique-se de que o IP/Host e a porta HDFS do Hadoop Namenode estejam configurados corretamente na sequência de conexão, conforme mostrado no exemplo acima.

    Para o Hadoop High Namenode High Availability:

    Adicionar o atributo hadoopNameService e nameservice ao final da cadeia de conexão.

    Por exemplo, se a tag de Alta Disponibilidade for nameservice1 a sequência de caracteres de conexão deve aparecer da seguinte maneira:

    hadoopName=10.242.109.2;hdfsPort=8020;

    BDEIP=10.242.109.10;BDEPORT=10109;hadoopNameService=nameservice1;

  4. Clique em OK.

Segurança

O Hadoop Gateway expõe a interface de protocolo HTTP para navegação HDFS a partir do MicroStrategy 2021 e HTTPS não é compatível.

Procurar HDFS via Hadoop Gateway pode dar suporte ao cluster autenticado por Kerberos. Um nome principal Kerberos separado para o Intelligence Server já não é mais necessário. Uma vez que o Hadoop Gateway é configurado em um cluster autenticado por Kerberos e iniciado com sucesso, o Intelligence Server consegue procurar HDFS via Hadoop Gateway automaticamente. Todo o controle de acesso será processado pelo Hadoop Gateway.

O Hadoop Gateway deve ser implementado em um nó de proxy em um cluster que usa autenticação por Kerberos. Um cluster seguro não pode ser procurado se o Hadoop Gateway for implementado fora do cluster.

Solução de problemas

  • A navegação HDFS é realizada pelo Hadoop Gateway em vez do Intelligence Server. Certifique-se de que o Hadoop Gateway seja iniciado antes de navegar.
  • O Hadoop Gateway expõe uma API RESTful HTTP em port 4020 para navegação HDFS, portanto a porta deve estar aberta na máquina que implanta o Gateway Hadoop.
  • Se ambos hadoopName e hadoopNameService são fornecidos na cadeia de conexão. O Hadoop Gateway usará hadoopNameService por padrão para acessar o cluster.
  • Todos os nomes e valores de atributo reconhecem maiúsculas e minúsculas na sequência de conexão.