Version 2021
Ab MicroStrategy 2021 Update 4 wird Hadoop Gateway nicht mehr unterstützt.
Hadoop Gateway für Namenode High Availability aktivieren
In MicroStrategy 10.10 und höher bietet Hadoop Gateway Unterstützung für Namenode High Availability. Es ist nicht mehr notwendig, Dateien mit Hadoop WebHDFS zu durchsuchen. Die HDFS-Kataloginformationen werden über Hadoop Gateway statt über WebHDFS abgerufen.
Durchsuchen von HDFS über Hadoop Gateway
Wenden Sie sich an Ihren Hadoop-Administrator, um den Nameservice für Hadoop Namenode High Availability, die Hadoop Namenode-IP-Adresse und die HDFS-Port-Nummer zu erhalten, bevor Sie die folgenden Schritte ausführen.
-
Klicken Sie im Dialogfeld Zu Hadoop verbinden auf Verbindung ändern.
-
Aktivieren Sie im Dialogfeld Datenquelle das Kontrollkästchen Verbindungszeichenkette bearbeiten.
-
Für einen einzelnen Namenode:
Stellen Sie sicher, dass Hadoop Namenode IP/Host und HDFS-Port in der Verbindungszeichenfolge korrekt konfiguriert sind, wie im obigen Beispiel gezeigt.
Für Hadoop High Namenode High Availability:
Attribut hinzufügen
hadoopNameServiceund den Tag nameservice ans Ende der Verbindungszeichenfolge.Wenn das Tag für hohe Verfügbarkeit beispielsweise
nameservice1die Verbindungszeichenfolge sollte wie folgt aussehen:hadoopName=10.242.109.2;hdfsPort=8020;BDEIP=10.242.109.10;BDEPORT=10109;hadoopNameService=nameservice1; - Klicken Sie auf OK.
Security
Hadoop Gateway stellt die HTTP-Protokollschnittstelle für HDFS-Suchvorgänge zur Verfügung (ab MicroStrategy 2021). HTTPS wird nicht unterstützt.
HDFS-Suchvorgänge über Hadoop Gateway unterstützen mit Kerberos authentifizierte Cluster. Ein separater Kerberos-Prinzipalname für Intelligence Server ist nicht mehr erforderlich. Nachdem Hadoop Gateway in einem mit Kerberos authentifizierten Cluster konfiguriert und erfolgreich gestartet wurde, ist Intelligence Server automatisch in der Lage, HDFS über Hadoop Gateway zu durchsuchen. Die gesamte Zugriffssteuerung erfolgt über Hadoop Gateway.
Hadoop Gateway muss in einem Proxyknoten in einem Cluster mit Kerberos-Authentifizierung bereitgestellt werden. Gesicherte Cluster können nicht durchsucht werden, Hadoop Gateway außerhalb des Clusters eingerichtet wurde.
Problembehebung
- HDFS-Suchvorgänge werden über Hadoop Gateway statt über Intelligence Server ausgeführt. Stellen Sie sicher, dass Hadoop Gateway vor dem Suchvorgang gestartet wird.
- Hadoop Gateway stellt eine HTTP RESTful API auf
port 4020für HDFS-Browsing, daher muss der Port auf dem Computer geöffnet sein, auf dem das Hadoop-Gateway bereitgestellt wird. - Wenn beide
hadoopNameundhadoopNameServicewerden in der Verbindungszeichenfolge bereitgestellt. Hadoop Gateway verwendethadoopNameServiceWert standardmäßig für den Zugriff auf das Cluster. - All Attributnamen and -werte in der Verbindungszeichenkette beachten die Groß-/Kleinschreibung.
