MicroStrategy ONE

Conectar a Amazon S3

Amazon Simple Storage Service (Amazon S3) es un servicio de almacenamiento de objetos que ofrece escalabilidad, disponibilidad de datos, seguridad y rendimiento líderes en la industria. MicroStrategy Cloud Object Connector proporciona acceso a Amazon S3 para explorar rápidamente carpetas y archivos e importarlos a los cubos de MicroStrategy.

Explore los siguientes temas en esta página:

  1. Preparar parámetros de conexión
  2. Crear un DBRole
  3. Importar datos
  4. Limitaciones

Preparar parámetros de conexión

Para que Cloud Object Connector explore correctamente el sistema de archivos de Amazon S3, necesita una cuenta de Amazon Web Service creada con los permisos adecuados. Las entidades de IAM, como usuarios, grupos y roles, comienzan sin permisos y se les deben conceder. Para obtener más información sobre cómo conceder permisos a entidades de IAM, consulte Administrar permisos de IAM.

MicroStrategy le recomienda crear un usuario de IAM para Cloud Object Connector. Para que un usuario de IAM acceda a un depósito y a los objetos que contiene, se debe otorgar el permiso Permitir efecto al menos a las dos acciones siguientes:

  • s3:ObtenerObjeto
  • s3:ListaBucket
  • s3:Listar todos mis cubos

Una vez que el usuario de IAM se haya creado correctamente, solicite a un administrador de IAM el ID de la clave de acceso y la clave de acceso secreta.

Crear un DBRole

Acceda a Amazon S3 Cloud Object Connector en MicroStrategy Web o Workstation.

  1. Seleccionar Añadir datos > Nuevos datos.
  2. Busque y seleccione el Amazon S3 conector de objetos en la nube de la lista de orígenes de datos.

  3. Junto a Orígenes de datos, haga clic en Nuevo origen de datos para añadir una nueva conexión.

  4. Ingrese sus credenciales de conexión.

    • Nombre de la conexión: nombre para la nueva conexión.
    • Región de AWS: la región de AWS exacta en la que se encuentra su bucket.
    • Clave de acceso de usuario de IAM: el ID de la clave de acceso.
    • Secreto de acceso de usuario de IAM: la clave de acceso secreta.

  1. En el panel izquierdo, junto a Conjuntos de datos, haga clic en Crear un conjunto de datos nuevo .

  2. Busque y seleccione el Amazon S3 conector de objetos en la nube de la lista de orígenes de datos.

  3. Junto a Orígenes de datos, haga clic en Nuevo origen de datos para añadir una nueva conexión.

  4. Ingrese sus credenciales de conexión.

    • Nombre de la conexión: nombre para la nueva conexión
    • Región de AWS: la región de AWS exacta en la que se encuentra su bucket
    • Clave de acceso de usuario de IAM: el ID de la clave de acceso
    • Secreto de acceso de usuario de IAM: la clave de acceso secreta

Importar datos

Una vez que haya creado correctamente el conector, podrá importar datos a MicroStrategy.

  1. Seleccione la conexión recién creada.
  2. En el menú desplegable, seleccione el depósito y explore las carpetas o archivos.
  3. Haga doble clic en los archivos o arrástrelos al panel derecho.

    En el panel Vista previa, puede ver los datos de muestra y ajustar el tipo de columna.

  4. Publique el cubo en MicroStrategy con los datos seleccionados.

Limitaciones

Tipos de archivos admitidos

Solo se admiten los siguientes tipos de archivos:

  • .json
  • .parquet
  • .euro
  • .orco
  • .csv
  • formato delta

Seleccionar carpetas

Al seleccionar la carpeta completa, la carpeta debe cumplir con los siguientes requisitos:

  • Todos los archivos de la carpeta deben tener los mismos tipos de archivos. Un cuadro de diálogo le pedirá que elija el tipo de archivo.
  • Todos los archivos comparten el mismo esquema.
  • Si la carpeta tiene subcarpetas, las subcarpetas deben tener un formato particionado válido. El siguiente es un ejemplo de una estructura de carpetas válida.

Limitaciones de chispa

  • Solo se pueden leer archivos JSON con cada nueva línea como un JSON completo
  • Los archivos Parquet que contienen caracteres especiales (, ; { } \ = " .) no se pueden leer
  • Los archivos Parquet con tipos de datos de columna como INT32(UINT_8)/(UNIT_16)/(UNIT_32)/(TIME_MILLIS) no son compatibles
  • Las columnas de tipo binario no se pueden publicar en el cubo
  • Los archivos ORC con nombres de campo con el prefijo "_col" (por ejemplo, _col0, _col1), donde el esquema de archivo contiene al menos una estructura anidada, una matriz o un campo de mapa, no se pueden importar

Funciones

Las siguientes funciones no son compatibles:

  • Cargando archivos de MicroStrategy que se conectan a Cloud Object Connector
  • Gestión de datos en importación de datos
  • Definición de geografía en importación de datos
  • Programación avanzada para Schedule Cube Publish
  • Tablas de grupo en importación de datos