Strategy ONE

データの解析

Mosaic Studioデータで利用可能な入力オプションの1つはファイルです。これらのファイルには、解析パラメータを調整するための特別なインターフェースが必要です。Mosaic Studioは主に推奨されるフィールド区切り文字を検出して適用しますが、調整が必要な場合に備えて、選択を手動でオーバーライドするオプションが必要です。

解析へのアクセス

  1. ディスクからのファイルを含む既存のMosaicモデルを作成または開きます。

  2. 左側のペインからテーブルを選択します。

  3. ソーステーブルビューで、テーブルの上部にある解析をクリックします。

解析オプション

  1. 解析をクリックすると、解析ペインに自動解析の提案が表示されます。これらのオプションを使用して、ファイルタイプに応じてデータを手動で調整できます。オプションには次のものがあります:

    • 新しい列ヘッダーを挿入: インポートファイルのデータに列ヘッダーがない場合、手動で追加できます。

    • 最初の行をスキップ: 最初の数行のデータが不要な場合、インポート時にスキップします。

    • エンコーディング: ファイルのエンコーディングを変更します。

    • ロケール: 数値と日時の解析に使用できます。

    • 区切り文字: カンマ、セミコロン、タブ、スペース、またはカスタムを使用して列を区切ります。

    • 引用符: 引用符内の区切り文字は区切り文字として扱われません。

  2. OKをクリックします。

サポートされているファイルタイプ

Mosaic Studioは、次のファイルタイプに対して解析機能を提供します:

  • csv (txt)

  • Excel

  • HTML

  • SAS

ファイルタイプごとに異なる解析オプションが提供されます。

  • csv (txt)ファイルには次の解析オプションを使用できます:

    • 新しい列ヘッダーを挿入

    • 最初の行をスキップ

    • エンコーディング

    • ロケール

    • 区切り文字

    • 引用符

  • Excel、HTML、SASファイルには次の解析オプションを使用できます:

    • 新しい列ヘッダーを挿入

    • 最初の行をスキップ

次のCloud Connectorsからインポートされたファイルの場合、最初の行をスキップオプションは使用できません:

  • S3

  • ADLS2

  • GCS