Version 2021
连接到 Amazon S3
Amazon Simple Storage Service (Amazon S3) 是一项对象存储服务,可提供业界领先的可扩展性、数据可用性、安全性和性能。MicroStrategy Cloud Object Connector 提供对 Amazon S3 的访问,以快速浏览文件夹和文件并将其导入 MicroStrategy 多维数据集。
在此页面上探索以下主题:
准备连接参数
要使 Cloud Object Connector 成功浏览 Amazon S3 文件系统,您需要创建一个具有适当权限的 Amazon Web Service 帐户。用户、组和角色等 IAM 实体在启动时没有权限,必须获得相应权限。有关向 IAM 实体授予权限的更多详细信息,请参阅 管理 IAM 权限。
MicroStrategy 建议您为 Cloud Object Connector 创建 IAM 用户。要让 IAM 用户访问存储桶及其中的对象,至少应向以下两项操作授予“允许效果”权限:
- s3:GetObject
- s3:ListBucket
-
s3:ListAllMyBuckets
成功创建 IAM 用户后,请向 IAM 管理员索要访问密钥 ID 和秘密访问密钥。
创建 DBRole
访问 MicroStrategy Web 或 Workstation 上的 Amazon S3 Cloud Object Connector。
- Web
- Workstation
- 选择添加数据 > 新数据。
-
查找并选择 Amazon S3 数据源列表中的云对象连接器。
-
在数据源旁边,单击新建数据源
添加新连接。
-
输入您的连接凭据。
- 连接名称:新连接的名称。
- AWS 区域:您的存储桶所在的确切 AWS 区域。
- IAM 用户的访问密钥:访问密钥 ID。
- IAM 用户的访问密钥:秘密访问密钥。
-
在左侧面板中,单击数据集旁边的 创建新数据集
。
-
查找并选择 Amazon S3 数据源列表中的云对象连接器。
-
在数据源旁边,单击新建数据源
添加新连接。
-
输入您的连接凭据。
- 连接名称:新连接的名称
- AWS 区域:您的存储桶所在的确切 AWS 区域
- IAM 用户的访问密钥:访问密钥 ID
- IAM 用户的访问密钥:秘密访问密钥
导入数据
成功创建连接器后,您可以将数据导入 MicroStrategy。
- 选择新创建的连接。
- 在下拉列表中,选择存储桶并浏览文件夹或文件。
-
双击文件或将其拖动到右侧窗格。
在“预览”窗格中,您可以查看示例数据并调整列类型。
- 将多维数据集与所选数据一起发布到 MicroStrategy。
限制
支持的文件类型
仅支持以下文件类型:
- .json
- .parquet
- .avro
- .orc
- .csv
- Delta 格式
选择文件夹
选择整个文件夹时,文件夹必须满足以下要求:
- 文件夹下的所有文件必须具有相同的文件类型。将出现一个对话框,提示您选择文件类型
- 所有文件共享同一个框架
-
如果文件夹包含子文件夹,则子文件夹必须采用有效的分区格式。以下是有效文件夹结构的示例
Spark 限制
- 只能读取每个换行符为完整 JSON 的 JSON 文件
- 无法读取包含特殊字符 (, ; { } \ = " .)的 Parquet 文件
- 不支持列数据类型为 INT32(UINT_8)/(UNIT_16)/(UNIT_32)/(TIME_MILLIS) 的 Parquet 文件
- 无法在多维数据集中发布二进制类型的列
- 无法导入字段名称以"_col"为前缀的 ORC 文件(例如 _col0、_col1),其中文件框架至少包含一个嵌套结构、数组或映射字段
功能
不支持以下功能:
- 正在上传连接到 Cloud Object Connector 的 MicroStrategy 文件
- 数据导入中的数据整理
- 在数据导入中定义地域
- 调度多维数据集发布的高级调度
- 在数据导入中对表进行分组