MicroStrategy ONE

Armazenamento no Data Lake Azure de Gen2

O Azure Data Lake Storage Gen2 (ADLS2) é uma plataforma de data lake totalmente integrada ao Armazenamento de Blobs do Azure. MicroStrategy Cloud O Object Connector fornece acesso ao ADLS2 para navegar rapidamente em pastas e arquivos e importá-los para MicroStrategy cubos.

Explore os seguintes tópicos nesta página:

  1. Preparar parâmetros de conexão
  2. Crie um DBRole
  3. Importar Dados
  4. Limitações

Preparar parâmetros de conexão

Para que o Cloud Object Connector navegue com êxito no sistema de arquivos ADLS2, você precisa de uma conta de armazenamento com um namespace hierárquico. Para obter mais detalhes sobre a criação de uma conta de armazenamento, consulte o Documentação da Microsoft.

Após a criação da conta de armazenamento, são concedidas duas chaves de acesso. Qualquer um pode ser usado para criar uma conexão.

Crie um DBRole

Acesse o conector de objeto em nuvem do Azure Data Lake Storage Gen2 em MicroStrategy Web ou estação de trabalho.

  1. Selecione Adicionar Dados > Novos Dados.
  2. Encontre e selecione Armazenamento do Lago de Dados Azure Gen2 Conector Cloud Object da lista de fontes de dados.

  3. Ao lado de Fontes de dados, clique em Nova fonte de dados para adicionar uma nova conexão.

  4. Insira suas credenciais de conexão.

    • Nome da conexão: Um nome para a nova conexão
    • Recipiente: O contêiner que você deseja acessar
    • Autenticação: O método de autenticação que você deseja usar
    • ID do diretório (locatário): O ID associado a cada assinatura
    • Conta de Armazenamento do Azure: A conta de armazenamento que contém os objetos de dados do Armazenamento do Azure
    • Segredo de armazenamento do Azure: O segredo associado ao Armazenamento do Azure
  1. No painel esquerdo, ao lado de Conjuntos de dados, clique em Crie um novo conjunto de dados .

  2. Encontre e selecione Armazenamento do Lago de Dados Azure Gen2 Conector Cloud Object da lista de fontes de dados.

  3. Ao lado de Fontes de dados, clique em Nova fonte de dados para adicionar uma nova conexão.

  4. Insira suas credenciais de conexão.

    • Nome da conexão: Um nome para a nova conexão
    • ID do diretório (locatário): O ID associado a cada assinatura
    • Conta de Armazenamento do Azure: A conta de armazenamento
    • Recipiente: O contêiner que você deseja acessar
    • ID do Cliente: O ID do cliente usado
    • Segredo do cliente: O segredo do cliente associado ao ID do cliente

Importar Dados

Depois de criar o conector com êxito, você poderá importar dados para MicroStrategy.

  1. Selecione a conexão recém-criada.
  2. Navegue pelas pastas ou arquivos no contêiner específico,
  3. Clique duas vezes nos arquivos ou arraste-os para o painel direito.

    No painel Visualização, você pode ver os dados de amostra e ajustar o tipo de coluna.

  4. Publique o cubo em MicroStrategy com os dados selecionados.

Limitações

Tipos de arquivos suportados

Somente os seguintes tipos de arquivo são suportados:

  • .json
  • .parque
  • .euro
  • .orc
  • .csv
  • Formato delta

Selecione pastas

Ao selecionar a pasta inteira, a pasta deve atender aos seguintes requisitos:

  • Todos os arquivos da pasta precisam ter os mesmos tipos de arquivo. Uma caixa de diálogo solicitará que você escolha o tipo de arquivo
  • Todos os arquivos compartilham o mesmo esquema
  • Se a pasta tiver subpastas, elas deverão estar em um formato particionado válido. A seguir está um exemplo de uma estrutura de pastas válida

Limitações do Spark

  • Somente arquivos JSON com cada nova linha como um JSON completo podem ser lidos
  • Arquivos Parquet que contêm caracteres especiais (, ; { } \ = " .) não podem ser lidos
  • Arquivos Parquet com tipos de dados de coluna como INT32(UINT_8)/(UNIT_16)/(UNIT_32)/(TIME_MILLIS) não são suportados
  • Colunas com o tipo binário não podem ser publicadas em cubo
  • Arquivos ORC com nomes de campo prefixados com "_col" (por exemplo, _col0, _col1), onde o esquema do arquivo contém pelo menos uma estrutura aninhada, matriz ou campo de mapa, não podem ser importados

Recursos

Os seguintes recursos não são suportados:

  • Enviando MicroStrategy arquivos conectando-se ao Cloud Object Connector
  • Organização de dados na importação de dados
  • Definindo geografia na importação de dados
  • Agendamento avançado para Agendar Publicação do Cubo
  • Agrupar tabelas na importação de dados