MicroStrategy ONE
连接到 Google Cloud Storage
Google Cloud Storage 是一种用于在 Google Cloud Platform 中存储和访问数据的在线服务。 MicroStrategy Cloud 对象连接器提供对 Google Cloud Storage 的访问,以便快速浏览文件夹和文件并将其导入 MicroStrategy 立方体。
探索此页面上的以下主题:
准备连接参数
为了使 Cloud Object Connector 成功浏览 Google Cloud Storage 文件系统,您需要创建一个具有适当权限的服务帐号。Google Cloud 中的基本角色不提供权限组合。 MicroStrategy 建议为 Google Cloud 连接器创建自定义角色。
应向自定义角色添加以下权限:
- 存储桶.获取
- 存储桶列表
- 存储.对象.获取
- 存储.对象.列表
服务帐户成功创建后,请向您的管理员索取密钥。该密钥是 JSON 文件的形式,将来会用到。
创建 DBRole
访问 Google Cloud Storage Cloud Object Connector MicroStrategy Web 或工作站。
- Web
- Workstation
- 选择添加数据 > 新数据。
-
查找并选择 Google 云端存储 来自数据源列表的云对象连接器。
-
在数据源旁边,点击 新数据源 添加新连接。
-
输入您的连接凭据。
- 连接名称:新连接的名称。
- 项目编号:从您的管理员处获取的服务帐号密钥 JSON 文件中的项目 ID。
- 客户端 ID:从您的管理员处获取的服务帐户密钥 JSON 文件中的客户端 ID。
- 客户电子邮件:从您的管理员处获取的服务帐户密钥 JSON 文件中的客户端电子邮件。
- 私钥ID:从您的管理员处获取的服务帐号密钥 JSON 文件中的私钥 ID。
-
私钥:从您的管理员处获取的服务帐号密钥 JSON 文件中的私钥。
私钥必须放在双引号内(例如, “你的私钥“)。
-
在左侧面板中的数据集旁边,单击 创建新数据集 。
-
查找并选择 Google 云端存储 来自数据源列表的云对象连接器。
-
在数据源旁边,点击 新数据源 添加新连接。
-
输入您的连接凭证。
- 连接名称:新连接的名称
- 计费项目:从管理员处获取的服务帐号密钥 JSON 文件中的项目 ID
- 身份验证方法:您要使用的身份验证方法
- 客户端 ID:从管理员处获取的服务帐号密钥 JSON 文件中的客户端 ID
- 客户端机密 从管理员处获取的服务帐户密钥 JSON 文件中的客户端机密
- 回调网址:用户登录后调用的 URL
导入数据
成功创建连接器后,您可以将数据导入 MicroStrategy。
- 选择新创建的连接。
- 在下拉菜单中,选择存储桶并浏览文件夹或文件。
-
双击文件或将其拖到右侧窗格中。
在预览窗格中,您可以查看示例数据并调整列类型。
- 将立方体发布到 MicroStrategy 使用您选择的数据。
限制
支持的文件类型
仅支持以下文件类型:
- .json
- .镶木地板
- 。欧元
- .orc
- .csv
- 德尔塔格式
选择文件夹
选择整个文件夹时,文件夹必须满足以下要求:
- 文件夹下的所有文件都需要具有相同的文件类型。对话框将提示您选择文件类型
- 所有文件共享相同的架构
-
如果该文件夹有子文件夹,则子文件夹应采用有效的分区格式。以下是有效文件夹结构的示例
Spark 限制
- 只能读取每个换行符为完整 JSON 的 JSON 文件
- 无法读取包含特殊字符 (, ; { } \ = " .) 的 Parquet 文件
- 不支持列数据类型为 INT32(UINT_8)/(UNIT_16)/(UNIT_32)/(TIME_MILLIS) 的 Parquet 文件
- 二进制类型的列无法在多维数据集中发布
- 无法导入字段名称以“_col”为前缀的 ORC 文件(例如 _col0、_col1),且文件架构包含至少一个嵌套结构、数组或映射字段
功能
不支持以下功能:
- 上传 MicroStrategy 连接到 Cloud Object Connector 的文件
- 数据导入中的数据整理
- 在数据导入中定义地理位置
- Schedule Cube Publish 的高级调度
- 在数据导入中对表进行分组