Strategy ONE

Importer des données à partir d'une base de données, de Hadoop ou de Google BigQuery en créant une requête SQL

Si vous êtes arrivé ici depuis Workstation, consultez le Aide à la création de documents sur le poste de travail. -

Vous pouvez importer des données à partir d'une base de données, Hadoop, ou Google BigQuery en créant votre propre requête SQL, ou script, pour récupérer les données de la source. Une interface visuelle intuitive vous permet de facilement créer la requête SQL qui importe vos données en faisant glisser des tables, en sélectionnant des colonnes, en définissant des jointures et en spécifiant des conditions de filtre.

L'importation de données à partir d'une base de données nécessite une connexion à une source de données. Vous pouvez créer la connexion avant de commencer l'importation ou pendant l'importation.

Si vous effectuez une importation à partir de Google BigQuery :

  • Vous devez activer l'API Google BigQuery sur le compte Google du projet et activer la facturation pour le projet. Reportez-vous à la documentation de Google BigQuery pour plus d'informations.
  • Vous avez besoin de l'identifiant du client et de la clé secrète client fournis par Google BigQuery lorsque MicroStrategy Workstation est configuré en tant qu'application d'accès à distance.
  • Google BigQuery restreint la quantité de données que vous pouvez importer en une fois. Si votre projet contient une grande quantité de données, pensez à ajouter des filtres à votre requête pour n'extraire que les données dont vous avez besoin. Consultez Google BigQuery Quota Policy pour obtenir les dernières restrictions concernant les données.

Pour importer des données à partir d’une base de données en créant une requête SQL

À partir de la version 11.0 de MicroStrategy, les requêtes d'importation de données depuis Google BigQuery seront créées avec SQL standard.

  1. Créez un portfolio vide ou ouvrez un portfolio existant.
  2. Sélectionnez Ajouter des données > Nouvelles données pour importer des données dans un nouveau jeu de données.

    ou

    Dans le panneau Jeux de données, cliquer Plus près du nom du jeu de données et sélectionnez Modifier le jeu de données pour ajouter des données au jeu de données. La boîte de dialogue Aperçu s'ouvre. Cliquez sur Ajouter une nouvelle table.

    La boîte de dialogue Sources de données s’ouvre.

  1. Pour importer des données à partir d’une base de données spécifique dans Hadoop, sélectionnez le logo correspondant (Amazon Redshift, Apache Cassandra, Cloudera Hive, Google BigQuery, Hadoop, etc.). Si vous sélectionnez Pig ou Web Services, la boîte de dialogue Importer à partir des tables s’ouvre, en contournant la boîte de dialogue Sélectionner des options d’importation, ce qui vous permet de saisir une requête pour importer une table.

    ou

    Pour importer des données sans spécifier de type de base de données, cliquez sur Bases de données.

    La boîte de dialogue Sélectionner des options d’importation s’ouvre.

  1. Sélectionnez Créer une requête et cliquez sur Suivant. La boîte de dialogue Importer à partir des tables s’ouvre. Si vous avez sélectionné une base de données, seules les connexions de source de données correspondant à la base de données sélectionnée sont affichées. Si vous n’avez pas sélectionné de base de données, toutes les connexions de source de données disponibles sont affichées.
  2. Si nécessaire, vous pouvez créer une connexion à une source de données tout en important vos données.

    La terminologie de la boîte de dialogue Importer à partir des tables peut varier en fonction de la source des données.

  1. Dans le volet Sources de données/Projets, sélectionnez la source de données ou le projet qui contient les données à importer.
  2. Si votre source de données ou votre projet prend en charge plusieurs espaces de noms, sélectionnez un espace de noms dans la liste déroulante Espace de nom du volet Tables/Jeux de données disponibles pour afficher uniquement les tables et les jeux de données dans un espace de noms sélectionné. Pour rechercher un espace de nom, tapez son nom dans Espace de nom. Les choix de la liste déroulante sont filtrés pendant que vous tapez.
  3. Développez une table ou un jeu de données pour afficher les colonnes qui s'y trouvent. Chaque colonne s'affiche accompagnée du type de données correspondant entre parenthèses. Pour rechercher une table ou un jeu de données, tapez son nom dans Table. Les tables/jeux de données sont filtrés pendant votre saisie.
  4. MicroStrategy crée un cache des tables et des colonnes de base de données lorsqu'un(e) source/projet de données est utilisé(e) pour la première fois. Passez le curseur sur l'icône Informations en haut du volet Tables/Jeux de données disponibles pour afficher une info-bulle indiquant le nombre de tables et la dernière mise à jour du cache.
  5. Cliquez sur Mettre à jour les espaces de nom dans le volet Tables/Jeux de données disponibles pour actualiser les espaces de nom.
  6. Cliquez sur Mettre à jour dans le volet Tables/Jeux de données disponibles pour actualiser les tables et les jeux de données.
  7. Double-cliquez sur des tables ou des jeux de données dans le volet Tables/Jeux de données disponibles pour les ajouter à la liste des tables à importer. Les tables et les jeux de données s'affichent dans le volet Générateur de requêtes avec les colonnes correspondantes.
  1. Si vous sélectionnez plusieurs tables provenant de la même instance de base de données et que toutes les tables ont la même structure (c'est-à-dire, les mêmes colonnes et type de données), une boîte de dialogue s'ouvre. Choisissez si les tables sont traitées ou non comme une table partitionnée simple.

    Vous pouvez ajouter des tables à partir de plusieurs instances de base de données. Sélectionnez une connexion de source de données différente dans le volet Sources de données, puis ajoutez la table comme décrit ci-dessus.

  2. Pour inclure une colonne dans l’importation, double-cliquez sur celle-ci dans le volet Générateur de requêtes. Le nom de la colonne s’affiche en gras pour indiquer que celle-ci est incluse et il apparaît dans le volet Aperçu.
  3. Pour inclure toutes les colonnes d’une table ou d’un jeu de données dans l’importation, double-cliquez sur Ajouter toutes les colonnes dans la table ou le jeu de données correspondant depuis le volet Générateur de requêtes. Les noms de colonne s’affichent en gras pour indiquer que celles-ci sont incluses et ils apparaissent aussi dans le volet Aperçu.
  4. Pour exclure une colonne de l'importation, passez le curseur sur son nom dans le volet Aperçu, cliquez sur la flèche déroulante et choisissez Supprimer. Le nom de la colonne ne s’affiche plus en gras dans le volet Générateur de requêtes et il est supprimé du volet Aperçu.
  5. Pour supprimer une table et toutes ses colonnes de l’importation, cliquez sur Supprimer à droite du nom de la table dans le volet Générateur de requêtes. La table est supprimée du volet Générateur de requêtes et les colonnes correspondantes sont supprimées du volet Aperçu.
  6. Pour modifier votre requête, reportez-vous à Personnalisez votre requête lors de l'importation de données d'une base de données, de Hadoop ou de Google BigQuery.
  7. Pour plus d’informations sur la création de jointures entre plusieurs tables, reportez-vous à Définir des jointures entre les colonnes dans les tables de base de données.
  8. Pour exécuter des fonctions de base sur les données d'une colonne, cliquez avec le bouton droit sur la colonne dans le volet Générateur de requêtes. Choisissez Fonctions de base, puis la fonction (par exemple Somme, Moyenne, Minimum). La fonction s’affiche dans le volet Aperçu pour la colonne correspondante.
  9. Pour exécuter des fonctions plus avancées sur les données d’une colonne, cliquez avec le bouton droit sur la colonne dans le volet Générateur de requêtes. Choisissez Toutes les fonctions, le type de fonction et la fonction Complétez les champs des boîtes de dialogue Arguments de fonction et Expression.
  10. Pour créer un filtre simple qui détermine les données à importer, cliquez avec le bouton droit sur la colonne sur laquelle vous voulez baser le filtre. Choisissez Filtres de base, puis un filtre. Ensuite, saisissez la ou les valeurs avec lesquelles comparer les données et cliquez sur OK. Une icône de filtre s’affiche en regard de la colonne de données.
  11. Pour créer des filtres plus avancés qui reposent sur des expressions complexes, reportez-vous à Créer des filtres avancés pour l'importation de données d'une base de données.
  12. Lorsque vous êtes satisfait de vos sélections de données, cliquez sur Exécuter SQL . Un aperçu des données s’affiche dans le volet Aperçu. Si vous souhaitez modifier la requête SQL pour la sélection de données, reportez-vous à Importer des données à partir d'une base de données, de Hadoop ou de Google BigQuery en saisissant une requête.
  1. Cliquez Préparer les données si vous ajoutez un nouveau jeu de données et souhaitez prévisualiser, modifier et spécifier les options d'importation.

    ou

    Cliquez sur Ajouter si vous modifiez un jeu de données existant.

  2. Cliquez sur Terminer si vous ajoutez un nouveau jeu de données et Passez à l'étape suivante.

    ou

    Cliquez sur Mettre à jour le jeu de données si vous modifiez un jeu de données existant et ignorez l'étape suivante.

  3. La boîte de dialogue Mode d'accès aux données s'ouvre.

    Cliquez sur Connexion en direct pour vous connecter à une base de données en direct lors de la récupération de données. La connexion en direct est utile si vous utilisez une grande quantité de données et que l'importation dans le portfolio n'est pas réalisable. Passez à la dernière étape.

    ou

    Cliquez sur Importer en tant que jeu de données en mémoire pour importer directement les données dans votre portfolio. L'importation des données accélère l'interaction avec les données mais sollicite davantage de mémoire RAM. Passez à la dernière étape.

  4. La boîte de dialogue Publication d'état.

    Si vous modifiez la connexion en direct au jeu de données, le jeu de données est actualisé et mis à jour.

    ou

    Si vous modifiez un jeu de données en mémoire, vous êtes invité à actualiser le jeu de données en premier lieu.

  5. Affichez les jeux de données nouveaux ou mis à jour dans le panneau Jeux de données.

Rubriques connexes

Importer des données

Meilleures pratiques d'importation de données à partir d'un fichier

Se connecter à une source de données

Procédure de gestion de vos connexions de base de données

Créer des filtres avancés pour l'importation de données d'une base de données

Boîte de dialogue Expression

Boîte de dialogue Modifier les options du catalogue