MicroStrategy ONE

Azure Data Lake Storage Gen2

Azure Data Lake Storage Gen2 (ADLS2) è una piattaforma data Lake completamente integrata con Archiviazione BLOB di Azure. MicroStrategy Cloud Object Connector consente l'accesso ad ADLS2 per esplorare rapidamente cartelle e file e importarli nei cubi MicroStrategy.

Esplora i seguenti argomenti in questa pagina:

  1. Preparare i parametri di connessione
  2. Crea un ruolo DB
  3. Importa dati
  4. Limitazioni

Preparare i parametri di connessione

Affinché Cloud Object Connector esplori correttamente il file system ADLS2, è necessario un account di archiviazione con uno spazio dei nomi gerarchico. Per maggiori dettagli sulla creazione di un account di storage, fare riferimento a Documentazione Microsoft.

Dopo la creazione dell'account di archiviazione, vengono concesse due chiavi di accesso. Entrambi possono essere utilizzati per creare una connessione.

Crea un ruolo DB

Accedere al connettore oggetti cloud Azure Data Lake Storage Gen2 in MicroStrategy Web o Workstation.

  1. Scegliere Aggiungi dati > Nuovi dati.
  2. Trova e seleziona Azure Data Lake Storage Gen2 Connettore oggetto cloud dall'elenco di origini dati.

  3. Accanto a Origini dati, fare clic su Nuova origine dati per aggiungere una nuova connessione.

  4. Inserisci le tue credenziali di connessione.

    • Nome connessione: un nome per la nuova connessione
    • Contenitore: il contenitore a cui si desidera accedere
    • Autenticazione: il metodo di autenticazione che si desidera utilizzare
    • ID directory (tenant).: l'ID associato a ogni sottoscrizione
    • Account Azure Storage: l'account di archiviazione contenente gli oggetti dati di Archiviazione di Azure
    • Segreto di Azure Storage: segreto associato ad Archiviazione di Azure
  1. Nel riquadro di sinistra, accanto a Dataset, fare clic su Crea un nuovo dataset .

  2. Trova e seleziona Azure Data Lake Storage Gen2 Connettore oggetto cloud dall'elenco di origini dati.

  3. Accanto a Origini dati, fare clic su Nuova origine dati per aggiungere una nuova connessione.

  4. Inserisci le tue credenziali di connessione.

    • Nome connessione: un nome per la nuova connessione
    • ID directory (tenant).: l'ID associato a ogni sottoscrizione
    • Account Azure Storage: l'account di archiviazione
    • Contenitore: il contenitore a cui si desidera accedere
    • Client ID: l'ID client utilizzato
    • Segreto client: il segreto client associato all'ID client

Importa dati

Una volta creato il connettore, è possibile importare i dati in MicroStrategy.

  1. Seleziona la connessione appena creata.
  2. Sfoglia le cartelle o i file nel contenitore specifico,
  3. Fare doppio clic sui file o trascinarli nel riquadro di destra.

    Nel riquadro Anteprima puoi visualizzare i dati di esempio e modificare il tipo di colonna.

  4. Pubblica il cubo in MicroStrategy con i dati selezionati.

Limitazioni

Tipi di file supportati

Sono supportati solo i seguenti tipi di file:

  • .json
  • .parquet
  • .Euro
  • .orco
  • .csv
  • Formato delta

Seleziona Cartelle

Quando si seleziona l'intera cartella, la cartella deve soddisfare i seguenti requisiti:

  • Tutti i file nella cartella devono avere gli stessi tipi di file. Una finestra di dialogo ti chiederà di scegliere il tipo di file
  • Tutti i file condividono lo stesso schema
  • Se la cartella dispone di sottocartelle, le sottocartelle devono essere in un formato partizionato valido. Di seguito è riportato un esempio di struttura di cartelle valida

Limitazioni della scintilla

  • È possibile leggere solo i file JSON con ogni nuova riga come JSON completo
  • I file parquet che contengono caratteri speciali (, ; { } \ = " .) non possono essere letti
  • I file parquet con tipi di dati di colonna come INT32(UINT_8)/(UNIT_16)/(UNIT_32)/(TIME_MILLIS) non sono supportati
  • Le colonne con tipo binario non possono essere pubblicate nel cubo
  • I file ORC con nomi di campo con prefisso "_col" (ad esempio, _col0, _col1), dove lo schema del file contiene almeno una struttura nidificata, un array o un campo mappa, non possono essere importati

Funzioni

Le seguenti funzionalità non sono supportate:

  • Caricamento di file MicroStrategy per la connessione a Cloud Object Connector
  • Wrangling dei dati nell'importazione dei dati
  • Definizione della geografia nell'importazione dei dati
  • Pianificazione avanzata per la pubblicazione di Schedule Cube
  • Raggruppare tabelle nell'importazione dati