MicroStrategy ONE
Azure Data Lake Storage Gen2
Azure Data Lake Storage Gen2 (ADLS2) は、Azure Blobと完全に統合されているデータ レイク プラットフォームです ストレージ。MicroStrategy Cloud Object コネクタは、ADLS2 にアクセスし、フォルダーとファイルを素早く参照してインポートする機能を提供します。MicroStrategyキューブ。
このページでは以下のトピックについて説明します。
接続パラメーターを準備
Cloud Object コネクターで ADLS2 ファイル システムを正常に参照するには、階層的な名前空間を持つストレージ アカウントが必要です。ストレージ アカウント作成の詳細は、Microsoft ドキュメントを参照してください。
ストレージ アカウントが作成されたら、2 つのアクセス キーが付与されます。どちらか 1 つを接続の作成に使用できます。
DBRoleを作成
Azure Data Lake Storage Gen2 Cloud Object コネクタにアクセスするにはMicroStrategy Web または Workstation。
- Web
- Workstation
- [データを追加] > [新規データ] を選択します。
-
データ ソース リストから Azure Data Lake Storage Gen2 Cloud Object コネクターを検索して選択します。
-
[データ ソース] の横にある をクリックします 新しいデータ ソース
新しい接続を追加します
-
接続の資格情報を入力します。
- [接続名]:新しい接続の名前
- [コンテナー]:アクセスしたいコンテナー
- [認証]:使用したい認証方法
- [ディレクトリ (テナント) ID]:各購読に関連付けられた ID
- [Azure ストレージ アカウント]:Azure ストレージ データ オブジェクトを含むストレージ アカウント
- [Azure ストレージのシークレット]:Azure ストレージに関連付けられたシークレット
-
左パネルで、データセットの隣の [新規データセットの作成]
をクリックします。
-
データ ソース リストから Azure Data Lake Storage Gen2 Cloud Object コネクターを検索して選択します。
-
[データ ソース] の横にある をクリックします 新しいデータ ソース
新しい接続を追加します
-
接続の資格情報を入力します。
- [接続名]:新しい接続の名前
- [ディレクトリ (テナント) ID]:各購読に関連付けられた ID
- [Azure ストレージ アカウント]:ストレージ アカウント
- [コンテナー]:アクセスしたいコンテナー
- [クライアント ID]:使用されているクライアント ID
- [クライアント シークレット]:クライアント ID に関連付けられたクライアント シークレット
データのインポート
コネクターを作成すると、データをMicroStrategy。
- 新たに作成した接続を選択します。
- 特定のコンテナーにあるフォルダーまたはファイルを参照します。
-
ファイルをダブルクリックするか、右ペインにドラッグします。
[プレビュー] ペインで、サンプル データを表示し、列タイプを調整できます。
- にキューブを公開MicroStrategy選択したデータが現れます
制限
サポートされるファイル タイプ
以下のファイル タイプのみがサポートされます。
- .json
- .parquet
- .avro
- .orc
- .csv
- デルタ形式
フォルダーの選択
フォルダー全体を選択する場合、以下の要件を満たす必要があります。
- フォルダーの下にある全ファイルのファイル タイプが同じでなければなりません。ファイル タイプを選択するダイアログが表示されます。
- 全ファイルが同じスキーマを共有する必要があります。
-
フォルダーにサブフォルダーがある場合、サブフォルダーは有効なパーティション形式である必要があります。有効なフォルダー構造の例を示します。
Spark の制限
- 各改行が完全な JSON である JSON ファイルのみを読み込むことができます。
- 特殊文字 (, ; { } \ = " .) を含む Parquet ファイルは読み込めません。
- 列データ タイプが INT32(UINT_8)/(UNIT_16)/(UNIT_32)/(TIME_MILLIS) の Parquet ファイルはサポートされていません。
- バイナリー タイプの列はキューブで公開できません。
- フィールド名の先頭に「_col」を持つ ORC ファイル (例: _col0、_col1) で、ファイル スキーマに少なくとも 1 つの入れ子構造、配列、マップ フィールドが含まれる場合はインポートできません。
機能
次の機能はサポートされていません。
- アップロード中MicroStrategyファイルを Cloud Object コネクタに接続
- データ インポートでのデータ ラングリング
- データ インポートでの地理の定義
- キューブ公開スケジュールの高度なスケジュール
- データ インポートでのグループ テーブル