Version 2021
Como refinar a qualidade dos dados antes de importar
Use a transformação de dados para melhorar a qualidade e a usabilidade dos seus dados antes de importá-los. Você pode remover espaços em branco, filtrar, excluir linhas ou células duplicadas, encontrar e substituir dados, concatenar colunas, etc. Além disso, pode usar a transformação de dados como uma ferramenta de descoberta de dados e ignorar alguns métodos tradicionais de extração, transformação e carregamento (ETL).
Na Caixa de diálogo Transformação de dados:, você trabalha com dados de amostra (ou seja, um subconjunto dos seus dados reais) para criar um script de funções que limpará, transformará e preparará seus dados.
Se você republicar ou atualizar seus dados, as etapas de transformação de dados serão aplicadas aos novos dados.
- Crie um dossiê em branco ou abra um existente.
-
Escolha Add Data (Adicionar Dados)
> Novos Dados (New Data) para importar dados para um novo conjunto de dados.ou
No painel Conjuntos de Dados, clique em clique Mais
ao lado do nome do conjunto de dados e escolha Edit Dataset (Editar Conjunto de Dados) para adicionar dados ao conjunto de dados. A caixa de diálogo Visualização é aberta. Clique em Add a new table (Adicionar uma nova tabela).A caixa de diálogo Fontes de Dados é aberta.
- Selecione os dados que deseja importar, de acordo com o seu tipo de fonte de dados.
- Depois de selecionar os dados que você deseja importar, clique em Preparar Dados para abrir a caixa de diálogo Visualização.
- No painel superior, clique na seta suspensa da tabela que deseja modificar e escolha Transformar. A caixa de diálogo Transformação de Dados é aberta, mostrando uma amostra do seu conjunto de dados.
Selecione a coluna a modificar na lista suspensa Selecionar Coluna.
ou
Selecione a coluna a modificar na visualização.
Selecione a função a aplicar da lista de sugestões ou da lista suspensa Selecionar Função. Consulte Funções para Transformar Dados para obter mais informações.
Se a função não exigir entradas adicionais, ela será automaticamente aplicada aos seus dados.
Se a função exigir parâmetros, defina os parâmetros e clique em Aplicar.
Você pode alterar o tipo de dado data para uma coluna. Na lista suspensa Selecionar Coluna, escolha a coluna que deseja alterar. Na lista suspensa Selecionar Função nas seleções Transformar Célula, escolha Alterar Tipo de Dados. Selecione Data da próxima lista suspensa, insira um formato de data no seguinte campo e clique em Aplicar. Consulte Como definir tipos de dados de data e hora ao transformar dados para obter mais informações.
Você pode filtrar os dados da coluna usando as opções de Seletor da lista suspensa: Selecionar Funções. Essas opções exibem, na parte inferior da tela, os seguintes filtros que você pode ajustar para filtrar a coluna.
Seletor de Texto: Passe o cursor sobre o texto e selecione se Incluir ou Excluir da sua importação.
Seletor Numérico: Exibe um gráfico com um intervalo de valores numéricos. Mova os pontos inicial e final do intervalo para filtrar os valores. Além disso, use as caixas de seleção de Numérico, Não Numérico, Em Branco e Erro para filtrar ainda mais os valores numéricos.
Seletor de Linha do Tempo: Exibe um gráfico com um intervalo de datas. Mova os pontos inicial e final do intervalo para filtrar as datas. Além disso, use as caixas de seleção de Com Hora, Sem Hora, Em Branco e Erro para filtrar ainda mais as datas.
Pesquisa de Texto: Digite o texto para o qual você deseja filtrar os dados. Selecione Diferenciação de maiúsculas e minúsculas para que sua pesquisa diferencie maiúsculas e minúsculas. Selecione Expressão Regular para usar a linguagem Expressão Regular (Regex).
Usar as opções Seletor não exclui os dados. Em vez disso, os dados são ocultos da visualização.
Você pode aplicar funções aos dados filtrados selecionando a seta suspensa associada com cada filtro.
Redefinir: Desfaça um filtro específico.
Redefinir TODOS os seletores: Desfaça todos os filtros.
Excluir: Exclui um filtro específico
Excluir TODOS os seletores: Excluir todos os filtros.
- Para agrupar dados de coluna similares em um cluster e substituir os valores, selecione a coluna que deseja modificar e escolha Agrupar e Editar da seção Outros da lista suspensa Selecionar Função. A caixa de diálogo Agrupar e Editar é aberta com os dados da coluna agrupados em clusters de dados relacionados. Consulte Como Agrupar Dados para obter mais informações.
- Clique duas vezes em uma célula individual para editar os dados diretamente na célula.
- Insira suas alterações na caixa de diálogo pop-up.
- Clique em Aplicar
para fazer alterações na célula selecionada. - Clique em Aplicar a Todos
para fazer alterações em todas as células que correspondam aos dados da célula selecionada. - Clique em Desfazer
na área de Script de Histórico para desfazer a função anterior. - Clique em Refazer
para refazer a função anterior. - Para desfazer várias funções, clique na função precedente que deseja manter. Todas as funções aplicadas após a função selecionada são desfeitas. Depois que uma função é desfeita, ela fica acinzentada.
- Para refazer várias funções, clique na última função acinzentada que deseja refazer. A função selecionada e as que a precedem serão reaplicadas.
- Para desfazer todas as ações do script, clique em Redefinir
. Seus dados retornam ao estado original. O script de histórico não será excluído até que você selecione outra função, o que resulta no início de um novo script. - Clique em Save (Salvar)
. A caixa de diálogo Extrair Script de Histórico é aberta, exibindo o script completo. - Clique em Salvar para salvar o script e suas funções para voltar a usar mais tarde com um conjunto e dados diferente.
- Cliquem em Fechar para voltar à caixa de Diálogo Transformação de Dados sem salvar o script.
- Clique em Importar
. A caixa de diálogo Importar Script de Histórico é aberta. Clique em Procurar para importar um script salvo.
ou
Cole um script na caixa de texto.
- Clique em Apply (Aplicar). O script é executado com base em sua amostra de dados e volta à caixa de diálogo Visualização.
- Clique em Concluir para importar seus dados refinados.
