MicroStrategy ONE

À partir de la MicroStrategy 2021 Update 4, la passerelle Hadoop n'est plus prise en charge.

Activer la passerelle Hadoop pour prendre en charge la haute disponibilité des nœuds nommés

Hadoop Gateway peut prendre en charge la haute disponibilité du nœud de nom de Hadoop à partir de MicroStrategy 10.10 et versions ultérieures. Il n’est plus nécessaire de rechercher des fichiers avec WebHDFS Hadoop. Les informations du catalogue HDFS sont extraites via Hadoop Gateway plutôt que WebHDFS.

Parcourir HDFS via Hadoop Gateway

Contactez votre administrateur Hadoop pour obtenir le service de noms pour Hadoop Namenode High Availability, l'adresse IP de Hadoop Namenode et le numéro de port HDFS avant de commencer les étapes ci-dessous.

  1. À partir de Se connecter à Hadoop de dialogue, cliquez sur Modifier la connexion.

  2. Dans la Source de données de dialogue, sélectionnez la Modifier la chaîne de connexion case à cocher.

  3. Pour un seul Namenode :

    Assurez-vous que l'adresse IP/l'hôte Hadoop Namenode et le port HDFS sont correctement configurés dans la chaîne de connexion, comme indiqué dans l'exemple ci-dessus.

    Pour la haute disponibilité du nœud de nom élevé de Hadoop

    Ajouter l'attribut hadoopNameService et la balise de service à la fin de la chaîne de connexion.

    Par exemple, si la balise Haute disponibilité est nameservice1 la chaîne de connexion doit apparaître comme suit :

    hadoopName=10.242.109.2;hdfsPort=8020;

    BDEIP=10.242.109.10;BDEPORT=10109;hadoopNameService=nameservice1;

  4. Cliquez sur OK.

Sécurité

La passerelle Hadoop expose l'interface de protocole HTTP pour la navigation HDFS à partir de MicroStrategy ONE et HTTPS n'est pas pris en charge.

Parcourir HDFS via Hadoop Gateway peut prendre en charge le cluster authentifié par Kerberos. Un nom principal Kerberos distinct pour Intelligence Server n’est plus requis. Une fois que Hadoop Gateway est configuré dans un cluster authentifié par Kerberos et lancé avec succès, Intelligence Server peut parcourir HDFS via Hadoop Gateway automatiquement. Tout le contrôle d’accès sera géré par Hadoop Gateway.

Hadoop Gateway doit être déployé sur un nœud proxy dans un cluster qui utilise l’authentification Kerberos. Un cluster sécurisé ne peut pas être exploré si Hadoop Gateway est déployé à l’extérieur du cluster.

Résolution des problèmes

  • L'exploration HDFS est effectuée par Hadoop Gateway plutôt que par Intelligence Server. Assurez-vous que Hadoop Gateway est lancé avant l'exploration.
  • La passerelle Hadoop expose une API HTTP RESTful sur port 4020 pour la navigation HDFS, le port doit donc être ouvert sur l'ordinateur qui déploie la passerelle Hadoop.
  • Si les deux hadoopName et hadoopNameService sont fournis dans la chaîne de connexion. La passerelle Hadoop utilisera hadoopNameService Valeur par défaut pour accéder au cluster.
  • Tous les noms d’attributs et toutes les valeurs d’attributs sont sensibles à la casse dans la chaîne de connexion.