MicroStrategy ONE
Armazenamento no Data Lake Azure de Gen2
O Azure Data Lake Storage Gen2 (ADLS2) é uma plataforma de data lake totalmente integrada ao Armazenamento de Blobs do Azure. MicroStrategy Cloud O Object Connector fornece acesso ao ADLS2 para navegar rapidamente em pastas e arquivos e importá-los para MicroStrategy cubos.
Explore os seguintes tópicos nesta página:
Preparar parâmetros de conexão
Para que o Cloud Object Connector navegue com êxito no sistema de arquivos ADLS2, você precisa de uma conta de armazenamento com um namespace hierárquico. Para obter mais detalhes sobre a criação de uma conta de armazenamento, consulte o Documentação da Microsoft.
Após a criação da conta de armazenamento, são concedidas duas chaves de acesso. Qualquer um pode ser usado para criar uma conexão.
Crie um DBRole
Acesse o conector de objeto em nuvem do Azure Data Lake Storage Gen2 em MicroStrategy Web ou estação de trabalho.
- Web
- Workstation
- Selecione Adicionar Dados > Novos Dados.
-
Encontre e selecione Armazenamento do Lago de Dados Azure Gen2 Conector Cloud Object da lista de fontes de dados.
-
Ao lado de Fontes de dados, clique em Nova fonte de dados para adicionar uma nova conexão.
-
Insira suas credenciais de conexão.
- Nome da conexão: Um nome para a nova conexão
- Recipiente: O contêiner que você deseja acessar
- Autenticação: O método de autenticação que você deseja usar
- ID do diretório (locatário): O ID associado a cada assinatura
- Conta de Armazenamento do Azure: A conta de armazenamento que contém os objetos de dados do Armazenamento do Azure
- Segredo de armazenamento do Azure: O segredo associado ao Armazenamento do Azure
-
No painel esquerdo, ao lado de Conjuntos de dados, clique em Crie um novo conjunto de dados .
-
Encontre e selecione Armazenamento do Lago de Dados Azure Gen2 Conector Cloud Object da lista de fontes de dados.
-
Ao lado de Fontes de dados, clique em Nova fonte de dados para adicionar uma nova conexão.
-
Insira suas credenciais de conexão.
- Nome da conexão: Um nome para a nova conexão
- ID do diretório (locatário): O ID associado a cada assinatura
- Conta de Armazenamento do Azure: A conta de armazenamento
- Recipiente: O contêiner que você deseja acessar
- ID do Cliente: O ID do cliente usado
- Segredo do cliente: O segredo do cliente associado ao ID do cliente
Importar Dados
Depois de criar o conector com êxito, você poderá importar dados para MicroStrategy.
- Selecione a conexão recém-criada.
- Navegue pelas pastas ou arquivos no contêiner específico,
-
Clique duas vezes nos arquivos ou arraste-os para o painel direito.
No painel Visualização, você pode ver os dados de amostra e ajustar o tipo de coluna.
- Publique o cubo em MicroStrategy com os dados selecionados.
Limitações
Tipos de arquivos suportados
Somente os seguintes tipos de arquivo são suportados:
- .json
- .parque
- .euro
- .orc
- .csv
- Formato delta
Selecione pastas
Ao selecionar a pasta inteira, a pasta deve atender aos seguintes requisitos:
- Todos os arquivos da pasta precisam ter os mesmos tipos de arquivo. Uma caixa de diálogo solicitará que você escolha o tipo de arquivo
- Todos os arquivos compartilham o mesmo esquema
-
Se a pasta tiver subpastas, elas deverão estar em um formato particionado válido. A seguir está um exemplo de uma estrutura de pastas válida
Limitações do Spark
- Somente arquivos JSON com cada nova linha como um JSON completo podem ser lidos
- Arquivos Parquet que contêm caracteres especiais (, ; { } \ = " .) não podem ser lidos
- Arquivos Parquet com tipos de dados de coluna como INT32(UINT_8)/(UNIT_16)/(UNIT_32)/(TIME_MILLIS) não são suportados
- Colunas com o tipo binário não podem ser publicadas em cubo
- Arquivos ORC com nomes de campo prefixados com "_col" (por exemplo, _col0, _col1), onde o esquema do arquivo contém pelo menos uma estrutura aninhada, matriz ou campo de mapa, não podem ser importados
Recursos
Os seguintes recursos não são suportados:
- Enviando MicroStrategy arquivos conectando-se ao Cloud Object Connector
- Organização de dados na importação de dados
- Definindo geografia na importação de dados
- Agendamento avançado para Agendar Publicação do Cubo
- Agrupar tabelas na importação de dados