MicroStrategy ONE

Azure Data Lake Storage Gen2

Azure Data Lake Storage Gen2 (ADLS2) es una plataforma de lago de datos que está totalmente integrada con Azure Blob Storage. MicroStrategy Cloud Object Connector proporciona acceso a ADLS2 para explorar rápidamente carpetas y archivos e importarlos a los cubos de MicroStrategy.

Explore los siguientes temas en esta página:

  1. Preparar parámetros de conexión
  2. Crear un DBRole
  3. Importar datos
  4. Limitaciones

Preparar parámetros de conexión

Para que Cloud Object Connector explore correctamente el sistema de archivos ADLS2, necesita una cuenta de almacenamiento con un espacio de nombres jerárquico. Para más detalles sobre cómo crear una cuenta de almacenamiento, consulte la Documentación de Microsoft.

Una vez creada la cuenta de almacenamiento, se otorgan dos claves de acceso. Cualquiera de los dos se puede utilizar para crear una conexión.

Crear un DBRole

Acceda al conector de objetos en la nube de Azure Data Lake Storage Gen2 en MicroStrategy Web o Workstation.

  1. Seleccionar Añadir datos > Nuevos datos.
  2. Buscar y seleccionar Azure Data Lake Storage Gen2 conector de objetos en la nube de la lista de orígenes de datos.

  3. Junto a Orígenes de datos, haga clic en Nuevo origen de datos para añadir una nueva conexión.

  4. Ingrese sus credenciales de conexión.

    • Nombre de la conexión: nombre para la nueva conexión
    • Contenedor: el contenedor al que desea acceder
    • Autenticación: el método de autenticación que desea usar
    • ID de directorio (inquilino): el ID asociado a cada suscripción
    • Cuenta de Azure Storage: la cuenta de almacenamiento que contiene sus objetos de datos de Azure Storage.
    • Secreto de Azure Storage: el secreto asociado con el Azure Storage
  1. En el panel izquierdo, junto a Conjuntos de datos, haga clic en Crear un conjunto de datos nuevo .

  2. Buscar y seleccionar Azure Data Lake Storage Gen2 conector de objetos en la nube de la lista de orígenes de datos.

  3. Junto a Orígenes de datos, haga clic en Nuevo origen de datos para añadir una nueva conexión.

  4. Ingrese sus credenciales de conexión.

    • Nombre de la conexión: nombre para la nueva conexión
    • ID de directorio (inquilino): el ID asociado a cada suscripción
    • Cuenta de Azure Storage: la cuenta de almacenamiento
    • Contenedor: el contenedor al que desea acceder
    • ID de cliente: el ID de cliente utilizado
    • Secreto de cliente: el secreto de cliente asociado al ID de cliente

Importar datos

Una vez que haya creado correctamente el conector, podrá importar datos a MicroStrategy.

  1. Seleccione la conexión recién creada.
  2. Explore las carpetas o archivos en el contenedor específico,
  3. Haga doble clic en los archivos o arrástrelos al panel derecho.

    En el panel Vista previa, puede ver los datos de muestra y ajustar el tipo de columna.

  4. Publique el cubo en MicroStrategy con los datos seleccionados.

Limitaciones

Tipos de archivos admitidos

Solo se admiten los siguientes tipos de archivos:

  • .json
  • .parquet
  • .euro
  • .orco
  • .csv
  • formato delta

Seleccionar carpetas

Al seleccionar la carpeta completa, la carpeta debe cumplir con los siguientes requisitos:

  • Todos los archivos de la carpeta deben tener los mismos tipos de archivos. Un cuadro de diálogo le pedirá que elija el tipo de archivo.
  • Todos los archivos comparten el mismo esquema.
  • Si la carpeta tiene subcarpetas, las subcarpetas deben tener un formato particionado válido. El siguiente es un ejemplo de una estructura de carpetas válida.

Limitaciones de chispa

  • Solo se pueden leer archivos JSON con cada nueva línea como un JSON completo
  • Los archivos Parquet que contienen caracteres especiales (, ; { } \ = " .) no se pueden leer
  • Los archivos Parquet con tipos de datos de columna como INT32(UINT_8)/(UNIT_16)/(UNIT_32)/(TIME_MILLIS) no son compatibles
  • Las columnas de tipo binario no se pueden publicar en el cubo
  • Los archivos ORC con nombres de campo con el prefijo "_col" (por ejemplo, _col0, _col1), donde el esquema de archivo contiene al menos una estructura anidada, una matriz o un campo de mapa, no se pueden importar

Funciones

Las siguientes funciones no son compatibles:

  • Cargando archivos de MicroStrategy que se conectan a Cloud Object Connector
  • Gestión de datos en importación de datos
  • Definición de geografía en importación de datos
  • Programación avanzada para Schedule Cube Publish
  • Tablas de grupo en importación de datos