MicroStrategy ONE
Azure Data Lake Storage Gen2
Azure Data Lake Storage Gen2 (ADLS2) は、Azure Blobと完全に統合されているデータ レイク プラットフォームです ストレージ。MicroStrategy Cloud Object コネクターは、ADLS2 にアクセスしてフォルダーとファイルを迅速にブラウズし、MicroStrategy キューブにインポートできます。
このページでは以下のトピックについて説明します。
接続パラメーターを準備
Cloud Object コネクターで ADLS2 ファイル システムを正常に参照するには、階層的な名前空間を持つストレージ アカウントが必要です。ストレージ アカウント作成の詳細は、Microsoft ドキュメントを参照してください。
ストレージ アカウントが作成されたら、2 つのアクセス キーが付与されます。どちらか 1 つを接続の作成に使用できます。
DBRoleを作成
Azure Data Lake Storage Gen2 Cloud Object コネクターには、MicroStrategy Web または Workstation でアクセスします。
- Web
- Workstation
- [データを追加] > [新規データ] を選択します。
-
データ ソース リストから Azure Data Lake Storage Gen2 Cloud Object コネクターを検索して選択します。
-
[データ ソース] の横にある をクリックします 新しいデータ ソース
新しい接続を追加します
-
接続の資格情報を入力します。
- [接続名]:新しい接続の名前
- [コンテナー]:アクセスしたいコンテナー
- [認証]:使用したい認証方法
- [ディレクトリ (テナント) ID]:各購読に関連付けられた ID
- [Azure ストレージ アカウント]:Azure ストレージ データ オブジェクトを含むストレージ アカウント
- [Azure ストレージのシークレット]:Azure ストレージに関連付けられたシークレット
-
左パネルで、データセットの隣の [新規データセットの作成]
をクリックします。
-
データ ソース リストから Azure Data Lake Storage Gen2 Cloud Object コネクターを検索して選択します。
-
[データ ソース] の横にある をクリックします 新しいデータ ソース
新しい接続を追加します
-
接続の資格情報を入力します。
- [接続名]:新しい接続の名前
- [ディレクトリ (テナント) ID]:各購読に関連付けられた ID
- [Azure ストレージ アカウント]:ストレージ アカウント
- [コンテナー]:アクセスしたいコンテナー
- [クライアント ID]:使用されているクライアント ID
- [クライアント シークレット]:クライアント ID に関連付けられたクライアント シークレット
データのインポート
コネクターの作成に成功したら、MicroStrategy にデータをインポートできます。
- 新たに作成した接続を選択します。
- 特定のコンテナーにあるフォルダーまたはファイルを参照します。
-
ファイルをダブルクリックするか、右ペインにドラッグします。
[プレビュー] ペインで、サンプル データを表示し、列タイプを調整できます。
- 選択したデータとともに MicroStrategy にキューブを公開します。
制限
サポートされるファイル タイプ
以下のファイル タイプのみがサポートされます。
- .json
- .parquet
- .avro
- .orc
- .csv
- デルタ形式
フォルダーの選択
フォルダー全体を選択する場合、以下の要件を満たす必要があります。
- フォルダーの下にある全ファイルのファイル タイプが同じでなければなりません。ファイル タイプを選択するダイアログが表示されます。
- 全ファイルが同じスキーマを共有する必要があります。
-
フォルダーにサブフォルダーがある場合、サブフォルダーは有効なパーティション形式である必要があります。有効なフォルダー構造の例を示します。
Spark の制限
- 各改行が完全な JSON である JSON ファイルのみを読み込むことができます。
- 特殊文字 (, ; { } \ = " .) を含む Parquet ファイルは読み込めません。
- 列データ タイプが INT32(UINT_8)/(UNIT_16)/(UNIT_32)/(TIME_MILLIS) の Parquet ファイルはサポートされていません。
- バイナリー タイプの列はキューブで公開できません。
- フィールド名の先頭に「_col」を持つ ORC ファイル (例: _col0、_col1) で、ファイル スキーマに少なくとも 1 つの入れ子構造、配列、マップ フィールドが含まれる場合はインポートできません。
機能
次の機能はサポートされていません。
- Cloud Object コネクターに接続する MicroStrategy ファイルのアップロード
- データ インポートでのデータ ラングリング
- データ インポートでの地理の定義
- キューブ公開スケジュールの高度なスケジュール
- データ インポートでのグループ テーブル