MicroStrategy ONE

Azure Data Lake Storage Gen2

Azure Data Lake Storage Gen2 (ADLS2) は、Azure Blob Storage と完全に統合されたデータ レイク プラットフォームです。MicroStrategy Cloud Object コネクターは、ADLS2 にアクセスしてフォルダーとファイルを迅速にブラウズし、MicroStrategy キューブにインポートできます。

このページでは以下のトピックについて説明します。

  1. 接続パラメーターの準備
  2. DBRole の作成
  3. データのインポート
  4. 制限

接続パラメーターの準備

Cloud Object コネクターで ADLS2 ファイル システムを正常に参照するには、階層的な名前空間を持つストレージ アカウントが必要です。ストレージアカウントの作成の詳細については、 Microsoft ドキュメント

ストレージ アカウントが作成されたら、2 つのアクセス キーが付与されます。どちらか 1 つを接続の作成に使用できます。

DBRole の作成

Azure Data Lake Storage Gen2 Cloud Object コネクターには、MicroStrategy Web または Workstation でアクセスします。

  1. 選ぶデータを追加 > 新しいデータ
  2. 検索して選択Azure データ レイク ストレージ Gen2データ ソース リストからの Cloud Object コネクタ。

  3. データソースの横にある新しいデータソース新しい接続を追加します。

  4. 接続の資格情報を入力します。

    • 接続名 : 新しい接続の名前
    • 容器 : アクセスしたいコンテナ
    • 認証 : 使用する認証方法
    • ディレクトリ(テナント)ID : 各サブスクリプションに関連付けられたID
    • Azure ストレージ アカウント : Azure Storage データ オブジェクトを含むストレージ アカウント
    • Azure ストレージ シークレット : Azureストレージに関連付けられたシークレット
  1. 左側のパネルで、データセットの横にある新しいデータセットを作成する

  2. 検索して選択Azure データ レイク ストレージ Gen2データ ソース リストからの Cloud Object コネクタ。

  3. データソースの横にある新しいデータソース新しい接続を追加します。

  4. 接続の資格情報を入力します。

    • 接続名 : 新しい接続の名前
    • ディレクトリ(テナント)ID : 各サブスクリプションに関連付けられたID
    • Azure ストレージ アカウント : ストレージアカウント
    • 容器 : アクセスしたいコンテナ
    • クライアントID : 使用されたクライアントID
    • クライアントシークレット : クライアントIDに関連付けられたクライアントシークレット

データのインポート

コネクターの作成に成功したら、MicroStrategy にデータをインポートできます。

  1. 新たに作成した接続を選択します。
  2. 特定のコンテナーにあるフォルダーまたはファイルを参照します。
  3. ファイルをダブルクリックするか、右ペインにドラッグします。

    [プレビュー] ペインで、サンプル データを表示し、列タイプを調整できます。

  4. 選択したデータとともに MicroStrategy にキューブを公開します。

制限

サポートされるファイル タイプ

以下のファイル タイプのみがサポートされます。

  • .json
  • .parquet
  • .avro
  • .orc
  • .csv
  • デルタ形式

フォルダーの選択

フォルダー全体を選択する場合、以下の要件を満たす必要があります。

  • フォルダーの下にある全ファイルのファイル タイプが同じでなければなりません。ファイル タイプを選択するダイアログが表示されます。
  • 全ファイルが同じスキーマを共有する必要があります。
  • フォルダーにサブフォルダーがある場合、サブフォルダーは有効なパーティション形式である必要があります。有効なフォルダー構造の例を示します。

Spark の制限

  • 各改行が完全な JSON である JSON ファイルのみを読み込むことができます。
  • 特殊文字 (, ; { } \ = " .) を含む Parquet ファイルは読み込めません。
  • 列データ タイプが INT32(UINT_8)/(UNIT_16)/(UNIT_32)/(TIME_MILLIS) の Parquet ファイルはサポートされていません。
  • バイナリー タイプの列はキューブで公開できません。
  • フィールド名の先頭に「_col」を持つ ORC ファイル (例: _col0、_col1) で、ファイル スキーマに少なくとも 1 つの入れ子構造、配列、マップ フィールドが含まれる場合はインポートできません。

機能

次の機能はサポートされていません。

  • Cloud Object コネクターに接続する MicroStrategy ファイルのアップロード
  • データ インポートでのデータ ラングリング
  • データ インポートでの地理の定義
  • キューブ公開スケジュールの高度なスケジュール
  • データ インポートでのグループ テーブル