MicroStrategy ONE

Connetti ad Amazon S3

Amazon Simple Storage Service (Amazon S3) è un servizio di storage a oggetti che offre scalabilità, disponibilità dei dati, sicurezza e prestazioni leader del settore. MicroStrategy Cloud Object Connector consente di accedere a Amazon S3 per sfogliare rapidamente cartelle e file e importarli nei cubi MicroStrategy .

Questa pagina esplora i seguenti argomenti:

  1. Preparare parametri di connessione
  2. Creare un ruolo DB
  3. Importazione di dati
  4. Limitazioni

Preparare parametri di connessione

Affinché il connettore oggetti cloud possa esplorare il file system di Amazon S3, è necessario un account Amazon Web Service creato con le autorizzazioni adeguate. IAM Le entità, quali utenti, gruppi e ruoli, iniziano senza autorizzazioni e devono essere concesse. Per maggiori dettagli sulla concessione delle autorizzazioni alle entità IAM, fare riferimento a Gestisci autorizzazioni IAM.

MicroStrategy consiglia di creare un utente IAM per Cloud Object Connector. Affinché un utente IAM possa accedere a un bucket e agli oggetti al suo interno, l'autorizzazione Consenti effetti deve essere concessa almeno per le due azioni seguenti:

  • s3:GetObject
  • s3:ListBucket
  • s3:ListAllMyBuckets

Dopo IAM Creazione dell'utente completata, chiedere a un IAM amministratore per l'ID chiave di accesso e la chiave di accesso segreta.

Creare un ruolo DB

Accesso a Amazon S3 Cloud Object Connector su MicroStrategy Web o Workstation.

  1. Scegliere Aggiungi dati > Nuovi dati.
  2. Trovare e selezionare il Amazon S3 Connettore oggetto cloud dall'elenco di origini dati.

  3. Accanto a Origini dati, fare clic su Nuova origine dati per aggiungere una nuova connessione.

  4. Immettere le credenziali di connessione.

    • Nome connessione: Un nome per la nuova connessione.
    • AWS Regione: L'oggetto AWS esatto regione in cui si trova il bucket.
    • IAM AccessKey dell'utente: L'ID chiave di accesso.
    • IAM AccessSecret dell'utente: Chiave di accesso segreta.

  1. Nel riquadro di sinistra, accanto a Dataset, fare clic su Crea un nuovo dataset .

  2. Trovare e selezionare il Amazon S3 Connettore oggetto cloud dall'elenco di origini dati.

  3. Accanto a Origini dati, fare clic su Nuova origine dati per aggiungere una nuova connessione.

  4. Immettere le credenziali di connessione.

    • Nome connessione: Un nome per la nuova connessione
    • AWS Regione: L'oggetto AWS esatto regione in cui si trova il bucket
    • IAM AccessKey dell'utente: L'ID chiave di accesso
    • IAM AccessSecret dell'utente: Chiave di accesso segreta

Importazione di dati

Una volta creato il connettore, è possibile importare i dati in MicroStrategy.

  1. Selezionare la connessione appena creata.
  2. Nell'elenco a discesa, selezionare il bucket ed esplorare le cartelle o i file.
  3. Fare doppio clic sui file o trascinarli nel riquadro di destra.

    Nel riquadro Anteprima è possibile visualizzare i dati di esempio e regolare il tipo di colonna.

  4. Pubblicare il cubo in MicroStrategy con i dati selezionati.

Limitazioni

Tipi di file supportati

Sono supportati solo i seguenti tipi di file:

  • .json
  • .parquet
  • .avro
  • .orc
  • .csv
  • Formato delta

Selezionare Cartelle

Quando si seleziona l'intera cartella, la cartella deve soddisfare i seguenti requisiti:

  • Tutti i file della cartella devono essere dello stesso tipo. Verrà visualizzata una finestra di dialogo in cui viene chiesto di scegliere il tipo di file
  • Tutti i file condividono lo stesso schema
  • Se la cartella contiene sottocartelle, le sottocartelle dovrebbero essere in un formato partizionato valido. Quello che segue è un esempio di struttura di cartelle valida

Limiti Spark

  • È possibile leggere solo i file JSON con ogni nuova riga come JSON completo
  • Impossibile leggere i file parquet che contengono caratteri speciali (, ; { } \ = " .).
  • I file parquet con tipi di dati di colonna come INT32(UINT_8)/(UNIT_16)/(UNIT_32)/(TIME_MILLIS) non sono supportati
  • Impossibile pubblicare le colonne di tipo binario nel cubo
  • Impossibile importare i file ORC con nomi di campo preceduti da "_col" (ad es. _col0, _col1), in cui lo schema del file contiene almeno un campo struttura, matrice o mappa annidato

Funzioni

Le seguenti funzioni non sono supportate:

  • Caricamento dei file MicroStrategy per la connessione al Cloud Object Connector
  • Data wrangling in Data Import
  • Definizione dell'area geografica in Data Import
  • Pianificazione avanzata per la pubblicazione del cubo di pianificazione
  • Raggruppa le tabelle in Importazione dati