MicroStrategy ONE

连接到 Google Cloud Storage

Google Cloud Storage 是一种用于在 Google Cloud Platform 中存储和访问数据的在线服务。 MicroStrategy Cloud 对象连接器提供对 Google Cloud Storage 的访问,以便快速浏览文件夹和文件并将其导入 MicroStrategy 立方体。

探索此页面上的以下主题:

  1. 准备连接参数
  2. 创建 DBRole
  3. 导入数据
  4. 限制

准备连接参数

为了使 Cloud Object Connector 成功浏览 Google Cloud Storage 文件系统,您需要创建一个具有适当权限的服务帐号。Google Cloud 中的基本角色不提供权限组合。 MicroStrategy 建议为 Google Cloud 连接器创建自定义角色。

应向自定义角色添加以下权限:

  • 存储桶.获取
  • 存储桶列表
  • 存储.对象.获取
  • 存储.对象.列表

服务帐户成功创建后,请向您的管理员索取密钥。该密钥是 JSON 文件的形式,将来会用到。

创建 DBRole

访问 Google Cloud Storage Cloud Object Connector MicroStrategy Web 或工作站。

  1. 选择添加数据 > 新数据
  2. 查找并选择 Google 云端存储 来自数据源列表的云对象连接器。

  3. 在数据源旁边,点击 新数据源 添加新连接。

  4. 输入您的连接凭据。

    • 连接名称:新连接的名称。
    • 项目编号:从您的管理员处获取的服务帐号密钥 JSON 文件中的项目 ID。
    • 客户端 ID:从您的管理员处获取的服务帐户密钥 JSON 文件中的客户端 ID。
    • 客户电子邮件:从您的管理员处获取的服务帐户密钥 JSON 文件中的客户端电子邮件。
    • 私钥ID:从您的管理员处获取的服务帐号密钥 JSON 文件中的私钥 ID。
    • 私钥:从您的管理员处获取的服务帐号密钥 JSON 文件中的私钥。

      私钥必须放在双引号内(例如, 你的私钥)。

  1. 在左侧面板中的数据集旁边,单击 创建新数据集

  2. 查找并选择 Google 云端存储 来自数据源列表的云对象连接器。

  3. 在数据源旁边,点击 新数据源 添加新连接。

  4. 输入您的连接凭证。

    • 连接名称:新连接的名称
    • 计费项目:从管理员处获取的服务帐号密钥 JSON 文件中的项目 ID
    • 身份验证方法:您要使用的身份验证方法
    • 客户端 ID:从管理员处获取的服务帐号密钥 JSON 文件中的客户端 ID
    • 客户端机密 从管理员处获取的服务帐户密钥 JSON 文件中的客户端机密
    • 回调网址:用户登录后调用的 URL

导入数据

成功创建连接器后,您可以将数据导入 MicroStrategy。

  1. 选择新创建的连接。
  2. 在下拉菜单中,选择存储桶并浏览文件夹或文件。
  3. 双击文件或将其拖到右侧窗格中。

    在预览窗格中,您可以查看示例数据并调整列类型。

  4. 将立方体发布到 MicroStrategy 使用您选择的数据。

限制

支持的文件类型

仅支持以下文件类型:

  • .json
  • .镶木地板
  • 。欧元
  • .orc
  • .csv
  • 德尔塔格式

选择文件夹

选择整个文件夹时,文件夹必须满足以下要求:

  • 文件夹下的所有文件都需要具有相同的文件类型。对话框将提示您选择文件类型
  • 所有文件共享相同的架构
  • 如果该文件夹有子文件夹,则子文件夹应采用有效的分区格式。以下是有效文件夹结构的示例

Spark 限制

  • 只能读取每个换行符为完整 JSON 的 JSON 文件
  • 无法读取包含特殊字符 (, ; { } \ = " .) 的 Parquet 文件
  • 不支持列数据类型为 INT32(UINT_8)/(UNIT_16)/(UNIT_32)/(TIME_MILLIS) 的 Parquet 文件
  • 二进制类型的列无法在多维数据集中发布
  • 无法导入字段名称以“_col”为前缀的 ORC 文件(例如 _col0、_col1),且文件架构包含至少一个嵌套结构、数组或映射字段

功能

不支持以下功能:

  • 上传 MicroStrategy 连接到 Cloud Object Connector 的文件
  • 数据导入中的数据整理
  • 在数据导入中定义地理位置
  • Schedule Cube Publish 的高级调度
  • 在数据导入中对表进行分组