MicroStrategy ONE

Affiner la qualité des données avant l'importation

Utilisez l’arrangement des données pour améliorer la qualité et l’utilisation de vos données avant de les importer. Vous pouvez supprimer les espaces vides, appliquer des filtres, supprimer des lignes ou des cellules en double, rechercher et remplacer des données, concaténer des colonnes, etc. Vous pouvez également utiliser l’arrangement des données comme un outil de découverte des données et vous en servir pour ignorer certaines méthodes d’extraction, de transformation et de chargement (ETL) classiques.

Le Boîte de dialogue Arrangement des données, vous travaillez avec des échantillons de données (c'est-à-dire un sous-ensemble de vos données réelles) pour créer un script des fonctions qui nettoient, transforment et préparent vos données.

Si vous republier ou actualiser vos données, les étapes de manipulation des données s'appliquent aux nouvelles données.

  1. Créez un portfolio vierge ou ouvrez un portfolio existant.
  2. Choisissez Ajouter des données > Nouvelles données pour importer des données dans un nouveau jeu de données.

    ou

    Dans le panneau Jeux de données, cliquez sur Plus à côté du nom du jeu de données et choisissez Modifier le jeu de données pour ajouter des données au jeu de données. La boîte de dialogue Aperçu s'ouvre. Cliquez sur Ajouter une nouvelle table.

    La boîte de dialogue Sources de données s’ouvre.

  1. Sélectionnez les données que vous souhaitez importer, en fonction de votre type de source de données.
  2. Une fois que vous avez sélectionné les données que vous souhaitez importer, cliquez sur Préparer les données pour ouvrir la boîte de dialogue Aperçu.
  1. Dans le volet supérieur, cliquez sur la flèche de déroulement pour la table que vous souhaitez modifier et choisissez Wrangle. La boîte de dialogue Arrangement des données qui s’ouvre affiche un exemple de votre jeu de données.
  2. Sélectionnez la colonne à modifier à partir de Sélectionner une colonne liste déroulante.

    ou

    Sélectionnez la colonne à modifier dans l’aperçu.

  3. Sélectionnez la fonction à appliquer à partir de la liste de suggestions ou du Sélectionner une fonction liste déroulante. Voir Fonctions d’arrangement des données pour plus d'informations.

    Si une fonction ne nécessite plus d’entrées utilisateur, elle est automatiquement appliquée à vos données.

    Si la fonction nécessite des paramètres, définissez-les et cliquez sur Appliquer.

    Vous pouvez modifier le type de données de la date pour une colonne. Dans la Sélectionner une colonne liste déroulante, choisissez la colonne que vous souhaitez modifier. Dans la Sélectionner une fonction liste déroulante, sous Transformer une cellule sélections, choisissez Modifier le type de données. Sélectionner Date dans la liste déroulante suivante, saisissez le format de date dans le champ suivant, puis cliquez sur Appliquer. Voir Procédure de définition de types de données de date et heure lors de l’arrangement des données pour plus d'informations.

  4. Vous pouvez filtrer les données de colonne en utilisant la Sélecteur options à partir de Sélectionner une fonction liste déroulante. Ces options affichent, en bas de l’écran, les filtres suivants. Vous pouvez les ajuster pour filtrer une colonne.

    Sélecteur de texte: Survolez le texte et sélectionnez si vous souhaitez Inclure ou en Exclure à partir de votre importation.

    Sélecteur numérique: affiche un graphique avec une plage de valeurs numériques. Déplacez les points de départ et d’arrivée de la plage pour filtrer les valeurs. De plus, utilisez les cases à cocher pour Numeric, Non numérique, Vierge, et Erreur pour filtrer davantage les valeurs numériques.

    Sélecteur de chronologie: affiche un graphique avec une plage de dates. Déplacez les points de départ et d’arrivée de la plage pour filtrer les dates. De plus, utilisez les cases à cocher pour Heure, Non horaire, Vierge, et Erreur pour filtrer davantage les dates.

    Recherche de texte: Saisissez le texte sur lequel vous souhaitez filtrer les données. Sélectionner Sensible à la casse pour rendre votre recherche sensible à la casse. Sélectionner Expression régulièrepour utiliser la langue d'expression régulière (Regex).

    L’utilisation des options Sélecteur ne supprime pas les données. Celles-ci sont simplement masquées.

  5. Vous pouvez appliquer des fonctions aux données filtrées en sélectionnant la flèche déroulante associée à chaque filtre.

    Réinitialiser: Annulez un filtre spécifique.

    Réinitialiser TOUT le sélecteur: Annulez tous les filtres.

    Supprimer: supprime un filtre spécifique

    Supprimer TOUT le sélecteur: Supprime tous les filtres.

  6. Pour regrouper des données de colonnes similaires en un cluster et remplacer les valeurs, sélectionnez la colonne que vous souhaitez modifier et choisissez Cluster et modification à partir de Autre section de la Sélectionner une fonction liste déroulante. La boîte de dialogue Mettre en cluster et modifier s’ouvre avec les données de colonne groupées en clusters de données associées. Voir Procédure de mise en cluster de données pour plus d'informations.
  7. Double-cliquez sur une cellule pour modifier les données directement dans la cellule.
  8. Entrez vos changements dans la boîte de dialogue contextuelle.
  9. Cliquez sur Appliquer pour apporter des modifications à la cellule sélectionnée.
  10. Cliquez sur Appliquer à tout pour apporter des modifications à toutes les cellules qui correspondent aux données de la cellule sélectionnée.
  11. Cliquez sur Annuler dans la zone de script historique pour annuler la fonction précédente.
  12. Cliquez sur Rétablir pour rétablir la fonction précédente.
  13. Pour annuler plusieurs fonctions, cliquez sur la fonction précédente que vous souhaitez conserver. Toutes les fonctions qui suivent la fonction sélectionnée sont annulées. Une fois la fonction annulée, elle est grisée.
  14. Pour rétablir plusieurs fonctions, cliquez sur la dernière fonction grisée que vous souhaitez rétablir. La fonction sélectionnée et celles qui la précèdent sont réappliquées.
  15. Pour annuler toutes les actions dans le script, cliquez sur Réinitialiser . Vos données retrouvent leur état initial. Le script d’historique n’est pas supprimé tant que vous n’avez pas sélectionné une autre fonction, ce qui démarre un nouveau script.
  16. Cliquez sur Enregistrer . La boîte de dialogue Extraire le script historique s'ouvre, affichant le script complet.
  17. Cliquez sur Enregistrer pour enregistrer le script et ses fonctions en vue de les réutiliser ultérieurement avec un autre jeu de données.
  18. Cliquez sur Fermer pour renvoyer la boîte de dialogue Data Wrangling sans enregistrer le script.
  19. Cliquez sur Importer . La boîte de dialogue Importer le script d’historique s’ouvre.
  20. Cliquez sur Parcourir pour importer un script enregistré.

    ou

    Collez un script dans la zone de texte.

  21. Cliquez sur Appliquer. Le script s’exécute sur votre échantillon de données et revient à la boîte de dialogue Aperçu.
  22. Cliquez sur Terminer pour importer vos données raffinées.

Rubriques connexes

Prévisualiser les données et indiquer les options d'importation

Importer des données