MicroStrategy ONE

Azure Data Lake Storage Gen2

Azure Data Lake Storage Gen2 (ADLS2) ist eine Data Lake-Plattform, die vollständig in Azure Blob Storage integriert ist. MicroStrategy Cloud Object Connector bietet Zugriff auf ADLS2, um Ordner und Dateien schnell zu durchsuchen und in MicroStrategy-Cubes zu importieren.

Entdecken Sie die folgenden Themen auf dieser Seite:

  1. Verbindungsparameter vorbereiten
  2. Erstellen einer DBRole
  3. Datenimport
  4. Einschränkungen

Verbindungsparameter vorbereiten

Damit Cloud Object Connector das ADLS2-Dateisystem erfolgreich durchsuchen kann, benötigen Sie ein Speicherkonto mit einem hierarchischen Namespace. Weitere Informationen zum Erstellen eines Speicherkontos finden Sie im Microsoft-Dokumentation.

Nachdem das Speicherkonto erstellt wurde, werden zwei Zugriffsschlüssel gewährt. Mit beiden kann eine Verbindung hergestellt werden.

Erstellen einer DBRole

Greifen Sie auf den Azure Data Lake Storage Gen2 Cloud Object Connector in MicroStrategy Web oder Workstation zu.

  1. Wählen Sie aus Daten hinzufügen > Neue Daten.
  2. Suchen und auswählen Azure Data Lake Storage Gen2 Cloud-Objekt-Konnektor aus der Datenquellenliste.

  3. Klicken Sie neben Datenquellen auf Neue Datenquelle , um eine neue Verbindung hinzuzufügen.

  4. Geben Sie Ihre Verbindungsinformationen ein.

    • Verbindungsname: Ein Name für die neue Verbindung
    • Container: Der Container, auf den Sie zugreifen möchten
    • Authentifizierung: Die Authentifizierungsmethode, die Sie verwenden möchten
    • Verzeichnis-ID (Tenant).: Die mit jedem Abonnement verknüpfte ID
    • Azure Storage-Konto: Das Speicherkonto, das Ihre Azure Storage-Datenobjekte enthält
    • Geheimer Azure Storage-Schlüssel: Der mit Azure Storage verknüpfte geheime Schlüssel
  1. Klicken Sie im linken Abschnitt neben Datensätzen auf Erstellen Sie einen neuen Datensatz .

  2. Suchen und auswählen Azure Data Lake Storage Gen2 Cloud-Objekt-Konnektor aus der Datenquellenliste.

  3. Klicken Sie neben Datenquellen auf Neue Datenquelle , um eine neue Verbindung hinzuzufügen.

  4. Geben Sie Ihre Verbindungsinformationen ein.

    • Verbindungsname: Ein Name für die neue Verbindung
    • Verzeichnis-ID (Tenant).: Die mit jedem Abonnement verknüpfte ID
    • Azure Storage-Konto: Das Speicherkonto
    • Container: Der Container, auf den Sie zugreifen möchten
    • Client-ID: Die verwendete Client-ID
    • Geheimer Clientschlüssel: Der geheime Clientschlüssel, der mit der Client-ID verknüpft ist

Datenimport

Nachdem Sie den Konnektor erfolgreich erstellt haben, können Sie Daten in MicroStrategy importieren.

  1. Wählen Sie die neu erstellte Verbindung aus.
  2. Durchsuchen Sie die Ordner oder Dateien unter dem jeweiligen Container,
  3. Doppelklicken Sie auf Dateien oder ziehen Sie sie in den rechten Bereich.

    Im Vorschaubereich können Sie die Beispieldaten sehen und den Spaltentyp anpassen.

  4. Veröffentlichen Sie den Cube mit Ihren ausgewählten Daten in MicroStrategy.

Einschränkungen

Unterstützte Dateitypen

Es werden nur die folgenden Dateitypen unterstützt:

  • .json
  • .Parkett
  • .Euro
  • .orc
  • .csv
  • Delta-Format

Ordner auswählen

Wenn Sie den gesamten Ordner auswählen, muss der Ordner die folgenden Anforderungen erfüllen:

  • Alle Dateien im Ordner müssen den gleichen Dateityp haben. In einem Dialogfeld werden Sie aufgefordert, den Dateityp auszuwählen
  • Alle Dateien haben das gleiche Schema
  • Wenn der Ordner Unterordner hat, sollten die Unterordner in einem gültigen partitionierten Format vorliegen. Nachfolgend sehen Sie ein Beispiel für eine gültige Ordnerstruktur

Spark-Einschränkungen

  • Es können nur JSON-Dateien gelesen werden, bei denen jede neue Zeile ein vollständiges JSON ist
  • Parquet-Dateien, die Sonderzeichen (, ; { } \ = " .) enthalten, können nicht gelesen werden
  • Parquet-Dateien mit Spaltendatentypen wie INT32(UINT_8)/(UNIT_16)/(UNIT_32)/(TIME_MILLIS) werden nicht unterstützt.
  • Spalten mit dem binären Typ können nicht im Cube veröffentlicht werden
  • ORC-Dateien mit Feldnamen, die mit „_col“ beginnen (z. B. _col0, _col1), und deren Dateischema mindestens eine verschachtelte Struktur, ein Array oder ein Map-Feld enthält, können nicht importiert werden.

Funktionen

Die folgenden Funktionen werden nicht unterstützt:

  • Hochladen von MicroStrategy-Dateien, die eine Verbindung mit Cloud Object Connector herstellen
  • Datenbearbeitung beim Datenimport
  • Definieren der Geografie im Datenimport
  • Erweiterte Planung für Schedule Cube Publish
  • Gruppieren von Tabellen im Datenimport