MicroStrategy ONE

Mit Amazon S3 verbinden

Amazon Simple Storage Service (Amazon S3) ist ein Objektspeicherdienst, der branchenführende Skalierbarkeit, Datenverfügbarkeit, Sicherheit und Leistung bietet. MicroStrategy Cloud Object Connector bietet Zugriff auf Amazon S3, um Ordner und Dateien schnell zu durchsuchen und in MicroStrategy-Cubes zu importieren.

Entdecken Sie die folgenden Themen auf dieser Seite:

  1. Verbindungsparameter vorbereiten
  2. Erstellen einer DBRole
  3. Datenimport
  4. Einschränkungen

Verbindungsparameter vorbereiten

Damit Cloud Object Connector das Amazon S3-Dateisystem erfolgreich durchsuchen kann, benötigen Sie ein Amazon Web Service-Konto mit den entsprechenden Berechtigungen. IAM-Entitäten wie Benutzer, Gruppen und Rollen starten ohne Berechtigungen und müssen diese erhalten. Weitere Informationen zum Erteilen von Berechtigungen an IAM-Entitäten finden Sie unter IAM-Berechtigungen verwalten.

MicroStrategy empfiehlt, einen IAM-Benutzer für Cloud Object Connector zu erstellen. Damit ein IAM-Benutzer auf einen Bucket und die darin enthaltenen Objekte zugreifen kann, muss die Berechtigung „Auswirkung zulassen“ mindestens für die folgenden beiden Aktionen erteilt werden:

  • s3:Objekt abrufen
  • s3:ListBucket
  • s3:ListeAlleMeineBuckets

Nachdem der IAM-Benutzer erfolgreich erstellt wurde, fragen Sie einen IAM-Administrator nach der Zugriffsschlüssel-ID und dem geheimen Zugriffsschlüssel.

Erstellen einer DBRole

Greifen Sie auf Amazon S3 Cloud Object Connector in MicroStrategy Web oder Workstation zu.

  1. Wählen Sie aus Daten hinzufügen > Neue Daten.
  2. Suchen Sie nach und wählen Sie aus Amazon S3 Cloud-Objekt-Konnektor aus der Datenquellenliste.

  3. Klicken Sie neben Datenquellen auf Neue Datenquelle , um eine neue Verbindung hinzuzufügen.

  4. Geben Sie Ihre Verbindungsinformationen ein.

    • Verbindungsname: Ein Name für die neue Verbindung.
    • AWS-Region: Die genaue AWS-Region, in der sich Ihr Bucket befindet.
    • AccessKey des IAM-Benutzers: Die Zugriffsschlüssel-ID.
    • AccessSecret des IAM-Benutzers: Der geheime Zugriffsschlüssel.

  1. Klicken Sie im linken Abschnitt neben Datensätzen auf Erstellen Sie einen neuen Datensatz .

  2. Suchen Sie nach und wählen Sie aus Amazon S3 Cloud-Objekt-Konnektor aus der Datenquellenliste.

  3. Klicken Sie neben Datenquellen auf Neue Datenquelle , um eine neue Verbindung hinzuzufügen.

  4. Geben Sie Ihre Verbindungsinformationen ein.

    • Verbindungsname: Ein Name für die neue Verbindung
    • AWS-Region: Die genaue AWS-Region, in der sich Ihr Bucket befindet
    • AccessKey des IAM-Benutzers: Die Zugriffsschlüssel-ID
    • AccessSecret des IAM-Benutzers: Der geheime Zugriffsschlüssel

Datenimport

Nachdem Sie den Konnektor erfolgreich erstellt haben, können Sie Daten in MicroStrategy importieren.

  1. Wählen Sie die neu erstellte Verbindung aus.
  2. Wählen Sie in der Dropdown-Liste den Bucket aus und durchsuchen Sie die Ordner oder Dateien.
  3. Doppelklicken Sie auf Dateien oder ziehen Sie sie in den rechten Bereich.

    Im Vorschaubereich können Sie die Beispieldaten sehen und den Spaltentyp anpassen.

  4. Veröffentlichen Sie den Cube mit Ihren ausgewählten Daten in MicroStrategy.

Einschränkungen

Unterstützte Dateitypen

Es werden nur die folgenden Dateitypen unterstützt:

  • .json
  • .Parkett
  • .Euro
  • .orc
  • .csv
  • Delta-Format

Ordner auswählen

Wenn Sie den gesamten Ordner auswählen, muss der Ordner die folgenden Anforderungen erfüllen:

  • Alle Dateien im Ordner müssen den gleichen Dateityp haben. In einem Dialogfeld werden Sie aufgefordert, den Dateityp auszuwählen
  • Alle Dateien haben das gleiche Schema
  • Wenn der Ordner Unterordner hat, sollten die Unterordner in einem gültigen partitionierten Format vorliegen. Nachfolgend sehen Sie ein Beispiel für eine gültige Ordnerstruktur

Spark-Einschränkungen

  • Es können nur JSON-Dateien gelesen werden, bei denen jede neue Zeile ein vollständiges JSON ist
  • Parquet-Dateien, die Sonderzeichen (, ; { } \ = " .) enthalten, können nicht gelesen werden
  • Parquet-Dateien mit Spaltendatentypen wie INT32(UINT_8)/(UNIT_16)/(UNIT_32)/(TIME_MILLIS) werden nicht unterstützt.
  • Spalten mit dem binären Typ können nicht im Cube veröffentlicht werden
  • ORC-Dateien mit Feldnamen, die mit „_col“ beginnen (z. B. _col0, _col1), und deren Dateischema mindestens eine verschachtelte Struktur, ein Array oder ein Map-Feld enthält, können nicht importiert werden.

Funktionen

Die folgenden Funktionen werden nicht unterstützt:

  • Hochladen von MicroStrategy-Dateien, die eine Verbindung mit Cloud Object Connector herstellen
  • Datenbearbeitung beim Datenimport
  • Definieren der Geografie im Datenimport
  • Erweiterte Planung für Schedule Cube Publish
  • Gruppieren von Tabellen im Datenimport