MicroStrategy ONE
Amazon S3 に接続
Amazon Simple Storage Service (Amazon S3) は、業界最高レベルの拡張性、データ可用性、セキュリティ、パフォーマンスを提供するオブジェクト ストレージ サービスです。MicroStrategy Cloud Object コネクターは、Amazon S3 にアクセスしてフォルダーとファイルを迅速にブラウズし、MicroStrategy キューブにインポートできます。
このページでは以下のトピックについて説明します。
接続パラメーターの準備
Cloud Object コネクターで Amazon S3 ファイル システムを正常に参照できるようにするには、適切な権限で作成された Amazon Web Service アカウントが必要です。ユーザー、グループ、ロールなどの IAM エンティティは、権限なしで開始されますが、権限を付与する必要があります。IAMエンティティへの権限付与の詳細については、以下を参照してください。 IAM権限を管理する。
MicroStrategy は、Cloud Object コネクター用の IAM ユーザーを作成することを推奨します。IAM ユーザーがバケットとその中のオブジェクトにアクセスするには、少なくとも以下の 2 つのアクションに [Allow Effect] 権限が付与されている必要があります。
- s3:GetObject
- s3:ListBucket
-
s3:ListAllMyBuckets
IAM ユーザーの作成に成功したら、IAM 管理者にアクセス キー ID、シークレット アクセス キーを問い合わせてください。
DBRole の作成
Amazon S3 Cloud Object コネクターには、MicroStrategy Web または Workstation でアクセスします。
- Web
- Workstation
- 選ぶデータを追加 > 新しいデータ。
-
見つけて選択アマゾンS3データ ソース リストからの Cloud Object コネクタ。
-
データソースの横にある新しいデータソース新しい接続を追加します。
-
接続の資格情報を入力します。
- 接続名 : 新しい接続の名前。
- AWS リージョン : バケットが配置されている正確な AWS リージョン。
- IAM ユーザーのアクセスキー : アクセスキーID。
- IAM ユーザーのアクセスシークレット : 秘密アクセスキー。
-
左側のパネルのデータセットの横にある新しいデータセットを作成する。
-
見つけて選択アマゾンS3データ ソース リストからの Cloud Object コネクタ。
-
データソースの横にある新しいデータソース新しい接続を追加します。
-
接続の資格情報を入力します。
- 接続名 : 新しい接続の名前
- AWS リージョン : バケットが配置されている正確な AWS リージョン
- IAM ユーザーのアクセスキー : アクセスキーID
- IAM ユーザーのアクセスシークレット : 秘密アクセスキー
データのインポート
コネクターの作成に成功したら、MicroStrategy にデータをインポートできます。
- 新たに作成した接続を選択します。
- ドロップダウンで、バケットを選択し、フォルダーまたはファイルを参照します。
-
ファイルをダブルクリックするか、右ペインにドラッグします。
[プレビュー] ペインで、サンプル データを表示し、列タイプを調整できます。
- 選択したデータとともに MicroStrategy にキューブを公開します。
制限
サポートされるファイル タイプ
以下のファイル タイプのみがサポートされます。
- .json
- .parquet
- .avro
- .orc
- .csv
- デルタ形式
フォルダーの選択
フォルダー全体を選択する場合、以下の要件を満たす必要があります。
- フォルダーの下にある全ファイルのファイル タイプが同じでなければなりません。ファイル タイプを選択するダイアログが表示されます。
- 全ファイルが同じスキーマを共有する必要があります。
-
フォルダーにサブフォルダーがある場合、サブフォルダーは有効なパーティション形式である必要があります。有効なフォルダー構造の例を示します。
Spark の制限
- 各改行が完全な JSON である JSON ファイルのみを読み込むことができます。
- 特殊文字 (, ; { } \ = " .) を含む Parquet ファイルは読み込めません。
- 列データ タイプが INT32(UINT_8)/(UNIT_16)/(UNIT_32)/(TIME_MILLIS) の Parquet ファイルはサポートされていません。
- バイナリー タイプの列はキューブで公開できません。
- フィールド名の先頭に「_col」を持つ ORC ファイル (例: _col0、_col1) で、ファイル スキーマに少なくとも 1 つの入れ子構造、配列、マップ フィールドが含まれる場合はインポートできません。
機能
次の機能はサポートされていません。
- Cloud Object コネクターに接続する MicroStrategy ファイルのアップロード
- データ インポートでのデータ ラングリング
- データ インポートでの地理の定義
- キューブ公開スケジュールの高度なスケジュール
- データ インポートでのグループ テーブル