Azure Data Lake Storage Gen2

Azure Data Lake Storage Gen2 (ADLS2) は、Azure Blobと完全に統合されているデータレイクプラットフォームですストレージ。Strategy Cloud Object コネクタは、ADLS2 にアクセスし、フォルダーとファイルを素早く参照してインポートする機能を提供します。Strategyキューブ。

このページでは以下のトピックについて説明します。

接続パラメーターを準備
DBRoleを作成
データのインポート
制限

接続パラメーターを準備

Cloud Object コネクターで ADLS2 ファイルシステムを正常に参照するには、階層的な名前空間を持つストレージアカウントが必要です。ストレージアカウント作成の詳細は、Microsoft ドキュメントを参照してください。

ストレージアカウントが作成されたら、2 つのアクセスキーが付与されます。どちらか 1 つを接続の作成に使用できます。

DBRoleを作成

Azure Data Lake Storage Gen2 Cloud Object コネクタにアクセスするにはStrategy Web または Workstation。

Web
Workstation

[データを追加] > [新規データ] を選択します。
データソースリストから Azure Data Lake Storage Gen2 Cloud Object コネクターを検索して選択します。
[データソース] の横にあるをクリックします 新しいデータソース新しい接続を追加します
接続の資格情報を入力します。
- [接続名]:新しい接続の名前
- [コンテナー]:アクセスしたいコンテナー
- [認証]:使用したい認証方法
- [ディレクトリ (テナント) ID]:各購読に関連付けられた ID
- [Azure ストレージアカウント]:Azure ストレージデータオブジェクトを含むストレージアカウント
- [Azure ストレージのシークレット]:Azure ストレージに関連付けられたシークレット

左パネルで、データセットの隣の [新規データセットの作成] をクリックします。
データソースリストから Azure Data Lake Storage Gen2 Cloud Object コネクターを検索して選択します。
[データソース] の横にあるをクリックします 新しいデータソース新しい接続を追加します
接続の資格情報を入力します。
- [接続名]:新しい接続の名前
- [ディレクトリ (テナント) ID]:各購読に関連付けられた ID
- [Azure ストレージアカウント]:ストレージアカウント
- [コンテナー]:アクセスしたいコンテナー
- [クライアント ID]:使用されているクライアント ID
- [クライアントシークレット]:クライアント ID に関連付けられたクライアントシークレット

データのインポート

コネクターを作成すると、データをStrategy。

新たに作成した接続を選択します。
特定のコンテナーにあるフォルダーまたはファイルを参照します。
ファイルをダブルクリックするか、右ペインにドラッグします。

[プレビュー] ペインで、サンプルデータを表示し、列タイプを調整できます。
にキューブを公開Strategy選択したデータが現れます

制限

サポートされるファイルタイプ

以下のファイルタイプのみがサポートされます。

.json
.parquet
.avro
.orc
.csv
デルタ形式

フォルダーの選択

フォルダー全体を選択する場合、以下の要件を満たす必要があります。

フォルダーの下にある全ファイルのファイルタイプが同じでなければなりません。ファイルタイプを選択するダイアログが表示されます。
全ファイルが同じスキーマを共有する必要があります。
フォルダーにサブフォルダーがある場合、サブフォルダーは有効なパーティション形式である必要があります。有効なフォルダー構造の例を示します。

Spark の制限

各改行が完全な JSON である JSON ファイルのみを読み込むことができます。
特殊文字 (, ; { } \ = " .) を含む Parquet ファイルは読み込めません。
列データタイプが INT32(UINT_8)/(UNIT_16)/(UNIT_32)/(TIME_MILLIS) の Parquet ファイルはサポートされていません。
バイナリータイプの列はキューブで公開できません。
フィールド名の先頭に「_col」を持つ ORC ファイル (例: _col0、_col1) で、ファイルスキーマに少なくとも 1 つの入れ子構造、配列、マップフィールドが含まれる場合はインポートできません。

機能

次の機能はサポートされていません。

アップロード中Strategyファイルを Cloud Object コネクタに接続
データインポートでのデータラングリング
データインポートでの地理の定義
キューブ公開スケジュールの高度なスケジュール
データインポートでのグループテーブル