Version 2021
A partir da Atualização 4 do MicroStrategy 2021, o Hadoop Gateway não é mais compatível.
Ativar Hadoop Gateway para dar suporte à alta disponibilidade de NameNode
O Hadoop Gateway aceita o Hadoop NameNode High Availability a partir do MicroStrategy 10.10. Já não é mais necessário procurar os arquivos com o Hadoop WebHDFS. As informações do catálogo de HDFS são recuperadas por meio do Hadoop Gateway em vez do WebHDFS.
Pesquisar HDFS por meio do Hadoop Gateway
Entre em contato com o administrador do Hadoop para obter o nameservice do Hadoop Namenode High Availability, o endereço IP do Hadoop Namenode e o número da porta HDFS antes de iniciar as etapas abaixo.
-
Na caixa de diálogo Conectar-se ao Hadoop, clique em Alterar Conexão.
-
Na caixa de diálogo Fonte de Dados, marque a caixa de seleção Editar sequência de conexão.
-
Para um NameNode único:
Certifique-se de que o IP/Host e a porta HDFS do Hadoop Namenode estejam configurados corretamente na sequência de conexão, conforme mostrado no exemplo acima.
Para o Hadoop High Namenode High Availability:
Adicionar o atributo
hadoopNameServicee nameservice ao final da cadeia de conexão.Por exemplo, se a tag de Alta Disponibilidade for
nameservice1a sequência de caracteres de conexão deve aparecer da seguinte maneira:hadoopName=10.242.109.2;hdfsPort=8020;BDEIP=10.242.109.10;BDEPORT=10109;hadoopNameService=nameservice1; - Clique em OK.
Segurança
O Hadoop Gateway expõe a interface de protocolo HTTP para navegação HDFS a partir do MicroStrategy 2021 e HTTPS não é compatível.
Procurar HDFS via Hadoop Gateway pode dar suporte ao cluster autenticado por Kerberos. Um nome principal Kerberos separado para o Intelligence Server já não é mais necessário. Uma vez que o Hadoop Gateway é configurado em um cluster autenticado por Kerberos e iniciado com sucesso, o Intelligence Server consegue procurar HDFS via Hadoop Gateway automaticamente. Todo o controle de acesso será processado pelo Hadoop Gateway.
O Hadoop Gateway deve ser implementado em um nó de proxy em um cluster que usa autenticação por Kerberos. Um cluster seguro não pode ser procurado se o Hadoop Gateway for implementado fora do cluster.
Solução de problemas
- A navegação HDFS é realizada pelo Hadoop Gateway em vez do Intelligence Server. Certifique-se de que o Hadoop Gateway seja iniciado antes de navegar.
- O Hadoop Gateway expõe uma API RESTful HTTP em
port 4020para navegação HDFS, portanto a porta deve estar aberta na máquina que implanta o Gateway Hadoop. - Se ambos
hadoopNameehadoopNameServicesão fornecidos na cadeia de conexão. O Hadoop Gateway usaráhadoopNameServicepor padrão para acessar o cluster. - Todos os nomes e valores de atributo reconhecem maiúsculas e minúsculas na sequência de conexão.
