MicroStrategy ONE

Azure Data Lake Storage Gen2

Azure Data Lake Storage Gen2 (ADLS2) は、Azure Blobと完全に統合されているデータ レイク プラットフォームです ストレージ。MicroStrategy Cloud Object コネクタは、ADLS2 にアクセスし、フォルダーとファイルを素早く参照してインポートする機能を提供します。MicroStrategyキューブ。

このページでは以下のトピックについて説明します。

  1. 接続パラメーターを準備
  2. DBRoleを作成
  3. データのインポート
  4. 制限

接続パラメーターを準備

Cloud Object コネクターで ADLS2 ファイル システムを正常に参照するには、階層的な名前空間を持つストレージ アカウントが必要です。ストレージ アカウント作成の詳細は、Microsoft ドキュメントを参照してください。

ストレージ アカウントが作成されたら、2 つのアクセス キーが付与されます。どちらか 1 つを接続の作成に使用できます。

DBRoleを作成

Azure Data Lake Storage Gen2 Cloud Object コネクタにアクセスするにはMicroStrategy Web または Workstation。

  1. [データを追加] > [新規データ] を選択します。
  2. データ ソース リストから Azure Data Lake Storage Gen2 Cloud Object コネクターを検索して選択します。

  3. [データ ソース] の横にある をクリックします 新しいデータ ソース新しい接続を追加します

  4. 接続の資格情報を入力します。

    • [接続名]:新しい接続の名前
    • [コンテナー]:アクセスしたいコンテナー
    • [認証]:使用したい認証方法
    • [ディレクトリ (テナント) ID]:各購読に関連付けられた ID
    • [Azure ストレージ アカウント]:Azure ストレージ データ オブジェクトを含むストレージ アカウント
    • [Azure ストレージのシークレット]:Azure ストレージに関連付けられたシークレット
  1. 左パネルで、データセットの隣の [新規データセットの作成] をクリックします。

  2. データ ソース リストから Azure Data Lake Storage Gen2 Cloud Object コネクターを検索して選択します。

  3. [データ ソース] の横にある をクリックします 新しいデータ ソース新しい接続を追加します

  4. 接続の資格情報を入力します。

    • [接続名]:新しい接続の名前
    • [ディレクトリ (テナント) ID]:各購読に関連付けられた ID
    • [Azure ストレージ アカウント]:ストレージ アカウント
    • [コンテナー]:アクセスしたいコンテナー
    • [クライアント ID]:使用されているクライアント ID
    • [クライアント シークレット]:クライアント ID に関連付けられたクライアント シークレット

データのインポート

コネクターを作成すると、データをMicroStrategy

  1. 新たに作成した接続を選択します。
  2. 特定のコンテナーにあるフォルダーまたはファイルを参照します。
  3. ファイルをダブルクリックするか、右ペインにドラッグします。

    [プレビュー] ペインで、サンプル データを表示し、列タイプを調整できます。

  4. にキューブを公開MicroStrategy選択したデータが現れます

制限

サポートされるファイル タイプ

以下のファイル タイプのみがサポートされます。

  • .json
  • .parquet
  • .avro
  • .orc
  • .csv
  • デルタ形式

フォルダーの選択

フォルダー全体を選択する場合、以下の要件を満たす必要があります。

  • フォルダーの下にある全ファイルのファイル タイプが同じでなければなりません。ファイル タイプを選択するダイアログが表示されます。
  • 全ファイルが同じスキーマを共有する必要があります。
  • フォルダーにサブフォルダーがある場合、サブフォルダーは有効なパーティション形式である必要があります。有効なフォルダー構造の例を示します。

Spark の制限

  • 各改行が完全な JSON である JSON ファイルのみを読み込むことができます。
  • 特殊文字 (, ; { } \ = " .) を含む Parquet ファイルは読み込めません。
  • 列データ タイプが INT32(UINT_8)/(UNIT_16)/(UNIT_32)/(TIME_MILLIS) の Parquet ファイルはサポートされていません。
  • バイナリー タイプの列はキューブで公開できません。
  • フィールド名の先頭に「_col」を持つ ORC ファイル (例: _col0、_col1) で、ファイル スキーマに少なくとも 1 つの入れ子構造、配列、マップ フィールドが含まれる場合はインポートできません。

機能

次の機能はサポートされていません。

  • アップロード中MicroStrategyファイルを Cloud Object コネクタに接続
  • データ インポートでのデータ ラングリング
  • データ インポートでの地理の定義
  • キューブ公開スケジュールの高度なスケジュール
  • データ インポートでのグループ テーブル