Version 2021
A partir de la actualización 4 de MicroStrategy 2021, Hadoop Gateway ya no es compatible.
Habilitar Hadoop Gateway para admitir la alta disponibilidad de NameNode
A partir de MicroStrategy 10.10, Hadoop Gateway admite la alta disponibilidad de NameNode de Hadoop. Ya no es necesario explorar archivos con WebHDFS de Hadoop. La información del catálogo de HDFS se recupera a través de Hadoop Gateway en lugar de WebHDFS.
Explorar HDFS a través de Hadoop Gateway
Póngase en contacto con su administrador de Hadoop para obtener el servicio de nombres para la alta disponibilidad de Namenode de Hadoop, la dirección IP de Namenode de Hadoop y el número de puerto HDFS antes de iniciar los pasos a continuación.
-
En el cuadro de diálogo Conectar con Hadoop, haga clic en Cambiar conexión.
-
En el cuadro de diálogo Origen de datos, active la casilla de verificación Editar cadena de conexión.
-
Para un solo NameNode:
Asegúrese de que el host / IP del NameNode de Hadoop y el puerto HDFS estén configurados correctamente en la cadena de conexión, como se muestra en el ejemplo anterior.
Para la alta disponibilidad de NameNode de Hadoop:
Agregar el atributo
hadoopNameService
y la etiqueta nameservice al final de la cadena de conexión.Por ejemplo, si la etiqueta de alta disponibilidad es
nameservice1
la cadena de conexión debe aparecer de la siguiente manera:hadoopName=10.242.109.2;hdfsPort=8020;
BDEIP=10.242.109.10;BDEPORT=10109;
hadoopNameService=nameservice1;
- Haga clic en Aceptar.
Seguridad
A partir de MicroStrategy 2021, Hadoop Gateway permite el acceso a una interfaz de protocolo HTTP que permite explorar HDFS. HTTPS deja de ser compatible.
La exploración de HDFS a través de Hadoop Gateway admite clústeres verificados con Kerberos. Ya no se necesita un nombre principal Kerberos aparte para Intelligence Server. Una vez que Hadoop Gateway esté configurado en un clúster verificado con Kerberos y se haya iniciado correctamente, Intelligence Server podrá explorar HDFS a través de Hadoop Gateway automáticamente. Hadoop Gateway se encargará de todo el control de acceso.
Hadoop Gateway debe estar implementado en un nodo de proxy en un clúster que use verificación de identidad Kerberos. Un clúster protegido no se puede explorar si Hadoop Gateway está implementado fuera del clúster.
Solución de problemas
- Hadoop Gateway se encarga de la exploración de HDFS, y no Intelligence Server. Asegúrese de que Hadoop Gateway se ha iniciado antes de proceder a la exploración.
- Hadoop Gateway expone una API RESTful de HTTP en
port 4020
para la exploración de HDFS, por lo que el puerto debe estar abierto en el equipo que implementa Hadoop Gateway. - Si ambos
hadoopName
yhadoopNameService
se proporcionan en la cadena de conexión. Hadoop Gateway usaráhadoopNameService
valor por defecto para acceder al clúster. - En todos los valores y nombres de atributo de la cadena de conexión se distinguen mayúsculas de minúsculas.