MicroStrategy ONE

A partire da MicroStrategy 2021 Update 4, Hadoop Gateway non è più supportato.

Abilita il gateway Hadoop a supportare la disponibilità elevata dei nodi

Hadoop Gateway può supportare Hadoop Namenode High Availability in MicroStrategy 10.10 e versioni successive. Non è più necessario sfogliare i file con Hadoop WebHDFS. Le informazioni del catalogo HDFS verranno recuperate tramite Hadoop Gateway anziché WebHDFS.

Sfogliare il catalogo HDFS tramite Hadoop Gateway

Contatta il tuo amministratore Hadoop per ottenere il servizio dei nomi per Hadoop Namenode High Availability, l'indirizzo IP Hadoop Namenode e il numero di porta HDFS prima di iniziare i passaggi seguenti.

  1. Dal Connetti a Hadoop finestra di dialogo, fare clic su Modifica connessione.

  2. Nel Origine dati finestra di dialogo, selezionare Modifica stringa di connessione casella di controllo.

  3. Per un singolo Namenode:

    Assicurarsi che l'IP/host del namenode Hadoop e la porta HDFS siano configurati correttamente nella stringa di connessione come mostrato nell'esempio precedente.

    Alta disponibilità per nodo dei nomi Hadoop:

    Aggiungere l'attributo hadoopNameService e il tag nameservice alla fine della stringa di connessione.

    Ad esempio, se il tag High Availability è nameservice1 la stringa di connessione dovrebbe apparire come segue:

    hadoopName=10.242.109.2;hdfsPort=8020;

    BDEIP=10.242.109.10;BDEPORT=10109;hadoopNameService=nameservice1;

  4. Fare clic su OK.

Sicurezza

Il gateway Hadoop espone l'interfaccia del protocollo HTTP per l'esplorazione HDFS a partire da MicroStrategy ONE e HTTPS non è supportato.

La navigazione di HDFS tramite Hadoop Gateway può supportare il cluster autenticato da Kerberos. Non è più necessario un nome per l'entità Kerberos separato per Intelligence Server. Una volta che Hadoop Gateway viene configurato in un cluster autenticato da Kerberos e avviato con successo, Intelligence Server sarà in grado di navigare in HDFS automaticamente tramite Hadoop Gateway. Tutti i controlli degli accessi verranno gestiti da Hadoop Gateway.

Hadoop Gateway deve essere distribuito in un nodo proxy in un cluster che utilizza l'autenticazione Kerberos. Non è possibile navigare in un cluster protetto se Hadoop Gateway viene distribuito all'esterno del cluster.

Risoluzione dei problemi

  • La navigazione di HDFS viene effettuata da Hadoop Gateway anziché da Intelligence Server. Assicurarsi prima che Hadoop Gateway venga avviato.
  • Il gateway Hadoop espone un'API RESTful HTTP su port 4020 per l'esplorazione HDFS, la porta deve essere aperta sul computer che distribuisce il gateway Hadoop.
  • Se entrambi hadoopName e hadoopNameService sono forniti nella stringa di connessione. Verrà utilizzato il gateway Hadoop hadoopNameService valore predefinito per accedere al cluster.
  • Per tutti i nomi e i valori di attributo viene fatta distinzione tra maiuscole e minuscole nella stringa di connessione.