MicroStrategy ONE

A partire da MicroStrategy 2021 Update 4, il gateway Hadoop non è più supportato.

Abilitare il gateway Hadoop a supportare l'alta disponibilità dei nomi

Hadoop Gateway può supportare Hadoop Namenode High Availability in MicroStrategy 10.10 e versioni successive. Non è più necessario sfogliare i file con Hadoop WebHDFS. Le informazioni del catalogo HDFS verranno recuperate tramite Hadoop Gateway anziché WebHDFS.

Sfogliare il catalogo HDFS tramite Hadoop Gateway

Contattare l'amministratore Hadoop per ottenere il servizio dei nomi per l'alta disponibilità Hadoop, l'indirizzo IP del nodo Hadoop e il numero della porta HDFS prima di procedere come indicato di seguito.

  1. Dalla finestra Connetti ad Hadoop, fare clic su Modifica connessione.

  2. Nella finestra di dialogo Origine dati, selezionare la casella di controllo Modifica stringa di connessione.

  3. Per un Namenode singolo:

    Assicurarsi che l'IP/l'host del nodo dei nomi Hadoop e la porta HDFS siano configurati correttamente nella stringa di connessione, come mostrato nell'esempio precedente.

    Per Hadoop Namenode High Availability:

    Aggiungere l'attributo hadoopNameService e il tag nameservice alla fine della stringa di connessione.

    Ad esempio, se il tag Alta disponibilità è nameservice1 la stringa di connessione dovrebbe apparire come segue:

    hadoopName=10.242.109.2;hdfsPort=8020;

    BDEIP=10.242.109.10;BDEPORT=10109;hadoopNameService=nameservice1;

  4. Fare clic su OK.

Sicurezza

Hadoop Gateway espone l'interfaccia del protocollo HTTP per la navigazione HDFS a partire da MicroStrategy ONE, mentre il protocollo HTTPS non è supportato.

La navigazione di HDFS tramite Hadoop Gateway può supportare il cluster autenticato da Kerberos. Non è più necessario un nome per l'entità Kerberos separato per Intelligence Server. Una volta che Hadoop Gateway viene configurato in un cluster autenticato da Kerberos e avviato con successo, Intelligence Server sarà in grado di navigare in HDFS automaticamente tramite Hadoop Gateway. Tutti i controlli degli accessi verranno gestiti da Hadoop Gateway.

Hadoop Gateway deve essere distribuito in un nodo proxy in un cluster che utilizza l'autenticazione Kerberos. Non è possibile navigare in un cluster protetto se Hadoop Gateway viene distribuito all'esterno del cluster.

Risoluzione dei problemi

  • La navigazione di HDFS viene effettuata da Hadoop Gateway anziché da Intelligence Server. Assicurarsi prima che Hadoop Gateway venga avviato.
  • Il gateway Hadoop espone un'API HTTP RESTful in port 4020 per la navigazione HDFS, quindi la porta deve essere aperta sul computer che distribuisce il gateway Hadoop.
  • Se entrambi hadoopName e hadoopNameService sono forniti nella stringa di connessione. Verrà utilizzato il gateway Hadoop hadoopNameService valore predefinito per accedere al cluster.
  • Per tutti i nomi e i valori di attributo viene fatta distinzione tra maiuscole e minuscole nella stringa di connessione.