Version 2021

Conectar ao Amazon S3

O Amazon Simple Storage Service (Amazon S3) é um serviço de armazenamento de objetos que oferece escalabilidade, disponibilidade de dados, segurança e desempenho líderes do setor. O MicroStrategy Cloud Object Connector fornece acesso ao Amazon S3 para navegar rapidamente por pastas e arquivos e importá-los para cubos MicroStrategy.

Explore os seguintes tópicos nesta página:

  1. Preparar Parâmetros de Conexão
  2. Criar uma Função de Banco de Dados
  3. Importar Dados
  4. Limitações

Preparar Parâmetros de Conexão

Para que o Cloud Object Connector navegue com êxito no sistema de arquivos do Amazon S3, você precisa de uma conta do Amazon Web Service criada com as permissões adequadas. As entidades do IAM, como usuários, grupos e funções, iniciam sem permissões e devem ser concedidas a elas. Para obter mais detalhes sobre como conceder permissões a entidades do IAM, consulte Gerenciar permissões do IAM.

A MicroStrategy recomenda que você crie um usuário do IAM para o Cloud Object Connector. Para que um usuário do IAM acesse um bucket e os objetos dentro dele, a permissão Permitir efeito deve ser concedida pelo menos às duas ações a seguir:

  • s3:GetObject
  • s3:ListBucket
  • s3:ListAllMyBuckets

Depois que o usuário do IAM for criado com êxito, peça a um administrador do IAM o ID da chave de acesso e a chave de acesso secreta.

Criar uma Função de Banco de Dados

Acesse o Amazon S3 Cloud Object Connector no MicroStrategy Web ou Workstation.

  1. Selecione Adicionar Dados > Novos Dados.
  2. Localize e selecione o Amazon S3 Cloud Object Connector da lista de fontes de dados.

  3. Ao lado de Fontes de Dados, clique emNova fonte de dados para adicionar uma nova conexão.

  4. Insira suas credenciais de conexão.

    • Nome da Conexão: Um nome para a nova conexão.
    • Região da AWS: A região exata da AWS em que seu bucket está localizado.
    • Chave de acesso do usuário do IAM: O ID da chave de acesso.
    • Segredo de acesso do usuário do IAM: A chave de acesso secreta.

  1. No painel esquerdo, ao lado de Conjuntos de Dados, clique em Criar um novo conjunto de dados .

  2. Localize e selecione o Amazon S3 Cloud Object Connector da lista de fontes de dados.

  3. Ao lado de Fontes de Dados, clique emNova fonte de dados para adicionar uma nova conexão.

  4. Insira suas credenciais de conexão.

    • Nome da Conexão: Um nome para a nova conexão
    • Região da AWS: A região exata da AWS em que seu bucket está localizado
    • Chave de acesso do usuário do IAM: O ID da chave de acesso
    • Segredo de acesso do usuário do IAM: A chave de acesso secreta

Importar Dados

Depois de criar o conector com êxito, você pode importar dados para o MicroStrategy.

  1. Selecione a conexão recém-criada.
  2. Na lista suspensa, selecione o bucket e navegue pelas pastas ou arquivos.
  3. Clique duas vezes nos arquivos ou arraste-os para o painel direito.

    No painel Visualização, você pode ver os dados de amostra e ajustar o tipo de coluna.

  4. Publique o cubo no MicroStrategy com os dados selecionados.

Limitações

Tipos de arquivo com suporte

Somente os seguintes tipos de arquivo são suportados:

  • .json
  • .parquet
  • .avro
  • .orc
  • .csv
  • Formato delta

Selecionar pastas

Ao selecionar a pasta inteira, ela deve atender aos seguintes requisitos:

  • Todos os arquivos na pasta precisam ter os mesmos tipos de arquivo. Uma caixa de diálogo solicitará que você escolha o tipo de arquivo
  • Todos os arquivos compartilham o mesmo esquema
  • Se a pasta tiver subpastas, elas devem estar em um formato particionado válido. Veja a seguir um exemplo de uma estrutura de pastas válida

Limitações do Spark

  • Somente arquivos JSON com cada nova linha como um JSON completo podem ser lidos
  • Os arquivos Parquet que contêm caracteres especiais (, ; { } \ = " .) não podem ser lidos
  • Não há suporte para arquivos Parquet com tipos de dados de coluna como INT32(UINT_8)/(UNIT_16)/(UNIT_32)/(TIME_MILLIS)
  • Colunas com o tipo binário não podem ser publicadas no cubo
  • Não é possível importar arquivos ORC com nomes de campo prefixados com "_col" (por exemplo, _col0, _col1), em que o esquema de arquivo contém pelo menos uma estrutura aninhada, uma matriz ou um campo de mapa

Recursos

Os seguintes recursos não são suportados:

  • Carregando arquivos do MicroStrategy conectando-se ao Cloud Object Connector
  • Transformação de dados na importação de dados
  • Definindo geografia na importação de dados
  • Programação avançada para Programar publicação de cubo
  • Tabelas de grupo na Importação de Dados