Strategy ONE
A partir de MicroStrategy 2021 Actualización 4, Hadoop Gateway ya no es compatible.
Habilitar Hadoop Gateway para admitir la alta disponibilidad de Namenode
A partir de MicroStrategy 10.10, Hadoop Gateway admite la alta disponibilidad de NameNode de Hadoop. Ya no es necesario explorar archivos con WebHDFS de Hadoop. La información del catálogo de HDFS se recupera a través de Hadoop Gateway en lugar de WebHDFS.
Explorar HDFS a través de Hadoop Gateway
Póngase en contacto con el administrador de Hadoop para obtener el servicio de nombres para la alta disponibilidad de Namenode de Hadoop, la dirección IP de Namenode de Hadoop y el número de puerto de HDFS antes de comenzar con los pasos que se indican a continuación.
-
En el cuadro de diálogo Conectar con Hadoop, haga clic en Cambiar conexión.
-
En el cuadro de diálogo Origen de datos, active la casilla de verificación Editar cadena de conexión.
-
Para un solo NameNode:
Asegúrese de que la IP/host de Namenode de Hadoop y el puerto HDFS estén configurados correctamente en la cadena de conexión, como se muestra en el ejemplo anterior.
Para la alta disponibilidad de NameNode de Hadoop:
Añadir el atributo
hadoopNameServicey etiqueta de servicio de nombres al final de la cadena de conexión.Por ejemplo, si la etiqueta de alta disponibilidad está
nameservice1la cadena de conexión debe tener el siguiente aspecto:hadoopName=10.242.109.2;hdfsPort=8020;BDEIP=10.242.109.10;BDEPORT=10109;hadoopNameService=nameservice1; - Haga clic en Aceptar.
Seguridad
A partir de MicroStrategy ONE, Hadoop Gateway permite el acceso a una interfaz de protocolo HTTP que permite explorar HDFS. HTTPS deja de ser compatible.
La exploración de HDFS a través de Hadoop Gateway admite clústeres verificados con Kerberos. Ya no se necesita un nombre principal Kerberos aparte para Intelligence Server. Una vez que Hadoop Gateway esté configurado en un clúster verificado con Kerberos y se haya iniciado correctamente, Intelligence Server podrá explorar HDFS a través de Hadoop Gateway automáticamente. Hadoop Gateway se encargará de todo el control de acceso.
Hadoop Gateway debe estar implementado en un nodo de proxy en un clúster que use verificación de identidad Kerberos. Un clúster protegido no se puede explorar si Hadoop Gateway está implementado fuera del clúster.
Solución de problemas
- Hadoop Gateway se encarga de la exploración de HDFS, y no Intelligence Server. Asegúrese de que Hadoop Gateway se ha iniciado antes de proceder a la exploración.
- Hadoop Gateway expone una API de RESTful HTTP en
port 4020para la exploración de HDFS, por lo que el puerto debe estar libre en el equipo que implementa la puerta de enlace de Hadoop. - Si ambas
hadoopNameyhadoopNameServicese proporcionan en la cadena de conexión. Hadoop Gateway utilizaráhadoopNameServicepor defecto para acceder al clúster. - En todos los valores y nombres de atributo de la cadena de conexión se distinguen mayúsculas de minúsculas.
