Skip to main content

Basic Data Profile Tool Icon Ferramenta Perfil de Dados Básico

Fluxo de trabalho de exemplo

A ferramenta Perfil de Dados Básico tem um fluxo de trabalho de exemplo. Visite Exemplos de fluxos de trabalho para saber como acessar esse e muitos outros exemplos diretamente do Alteryx Designer.

Use a ferramenta Perfil de Dados Básico para ter uma visão geral, ou perfil, dos dados e gerar as informações para análise posterior. A ferramenta Perfil de Dados Básico analisa dados e fornece metadados para cada coluna (campo) de dados. Para ver uma representação visual do perfil de dados, além dos metadados, use uma ferramenta Navegar.

Configurar a ferramenta

Complete qualquer uma das opções de configuração opcionais:

  • Limite para contagem de exclusivos: o limite padrão é recomendado para obter o melhor desempenho. Aumente o limite para ver informações de perfil para obter mais dados. Digite o texto ou use os botões para cima/para baixo para selecionar o número máximo de valores exclusivos que você deseja que o Alteryx identifique nos dados.

  • Limite de tamanho para retornar todos os valores exclusivos (caracteres): o limite padrão é recomendado para obter o melhor desempenho. Aumente o limite para ver informações de perfil para obter mais dados. Digite o texto ou use os botões para cima/para baixo para selecionar o número máximo de caracteres que você deseja que o Alteryx verifique em um valor para determinar se o valor é exclusivo.

  • Usar unidades métricas: selecione para usar unidades métricas de medida. Essa opção se aplica somente a dados espaciais.

Visualizar a saída

Dependendo do tipo de dados da ferramenta conectada, as informações do perfil de dados na janela de resultados variam. Vá para Tipos de dados para obter uma lista de tipos de dados.

Os resultados são listados verticalmente. Role para ver os metadados de cada coluna nos dados.

Dados de cadeia de caracteres

Se uma coluna contiver valores de cadeia de caracteres (string), estes metadados serão fornecidos:

  • Nome: o nome da coluna.

  • Tipo de dados: o tipo de dados da coluna selecionada.

  • Tamanho: a quantidade de memória reservada para cada registro nessa coluna.

  • Fonte: a origem da coluna. Esse pode ser o nome da fonte de dados ou o caminho para o local onde os dados estão salvos.

  • Descrição: a descrição da coluna, se disponível. Se nenhuma descrição estiver disponível, será [Null].

  • OKs: o número de valores na coluna sem problemas de qualidade identificados, por exemplo, espaços em branco à esquerda ou à direita.

  • Nulos: o número de valores na coluna que são nulos, excluindo valores vazios.

  • Não nulas: o número de entradas não nulas na coluna, incluindo valores vazios.

  • Espaços em branco: o número de valores vazios.

  • Valores com espaço em branco antes: o número de valores de cadeia de caracteres com espaço em branco antes do valor. Use a ferramenta Limpeza de Dados ou a função "Trim" da ferramenta Fórmula para resolver o problema. Vá para Ferramenta Limpeza de Dados e Ferramenta Fórmula para obter mais informações.

  • Valores com espaço em branco após: o número de valores de cadeia de caracteres com espaço em branco após o valor.

  • Valores com espaço em branco em ambos os lados: o número de valores de cadeia de caracteres com espaço em branco antes e/ou depois do valor.

  • Comprimento médio: o comprimento médio dos valores da coluna.

  • Comprimento mais longo: o número de caracteres no valor mais longo da coluna.

  • Valor mais longo: o valor mais longo da coluna.

  • Comprimento mais curto (não em branco): o número de caracteres no valor mais curto na coluna.

  • Valor mais curto: o valor mais curto na coluna.

  • Mínimo: a primeira entrada de cadeia de caracteres quando a coluna é classificada alfabeticamente.

  • Máximo: a última entrada de cadeia de caracteres quando a coluna é classificada alfabeticamente.

  • Únicos
: o número de valores exclusivos no campo. Use a ferramenta Exclusivo para ver uma contagem completa das entradas exclusivas e duplicadas. Acesse Ferramenta Exclusivo para obter mais informações.

  • Valores exclusivos: todos os valores exclusivos na coluna.

Dados numéricos

Se uma coluna contiver valores numéricos, estes metadados serão fornecidos:

  • Nome: o nome da coluna.

  • Tipo de dados: o tipo de dados da coluna selecionada.

  • Tamanho: a quantidade de memória reservada para cada registro nessa coluna.

  • Fonte: a origem da coluna. Esse pode ser o nome da fonte de dados ou o caminho para o local onde os dados estão salvos.

  • Descrição: a descrição da coluna, se disponível. Se nenhuma descrição estiver disponível, será [Null].

  • OKs: o número de valores na coluna sem problemas de qualidade identificados, por exemplo, espaços em branco à esquerda ou à direita.

  • Nulos: o número de valores na coluna que são nulos, excluindo valores vazios.

  • Não nulas: o número de entradas não nulas na coluna, incluindo valores vazios.

  • Mínimo: o menor valor na coluna.

  • Máximo: o maior valor na coluna.

  • Média: o valor médio dos valores na coluna.

  • Soma: a soma dos valores na coluna.

  • Desvio padrão: a medida de dispersão dos valores no gráfico.

  • Variância: a medida de quão longe um conjunto de números aleatórios está em relação à média.

  • Únicos
: o número de valores exclusivos no campo. Use a ferramenta Exclusivo para ver uma contagem completa das entradas exclusivas e duplicadas. Consulte Ferramenta Exclusivo para obter mais informações.

  • Valores exclusivos: todos os valores exclusivos na coluna.

  • 25º percentil: o valor mediano nos dados inferiores ou primeiros ou metade dos dados.

  • 50º percentil: o valor mediano dos dados.

  • 75º percentil: o valor mediano nos dados superiores,segundo ou metade dos dados.

  • Histograma: a contagem de valores na coluna que se enquadram em dados agrupados uniformemente. Cada grupo é indicado por um valor inicial e uma contagem de valores no grupo, separados por dois-pontos. Um grupo contém valores até (mas não incluindo) o valor inicial do próximo grupo. 1:23, 2:15,3:0 indica três grupos começando em 1, 2 e 3. Cada grupo tem 23, 15 e 0 itens, respectivamente.

  • Margem de erro: o intervalo possível de valores abaixo e acima do valor calculado.

Dados de data/hora (Date-Time)

Se uma coluna contiver dados de data/hora, estes metadados serão fornecidos:

  • Nome: o nome da coluna.

  • Tipo de dados: o tipo de dados da coluna selecionada.

  • Tamanho: a quantidade de memória reservada para cada registro nessa coluna.

  • Fonte: a origem da coluna. Esse pode ser o nome da fonte de dados ou o caminho para o local onde os dados estão salvos.

  • Descrição: a descrição da coluna, se disponível. Se nenhuma descrição estiver disponível, será [Null].

  • OKs: o número de valores na coluna sem problemas de qualidade identificados, por exemplo, espaços em branco à esquerda ou à direita.

  • Nulos: o número de valores na coluna que são nulos, excluindo valores vazios.

  • Não nulas: o número de entradas não nulas na coluna, incluindo valores vazios.

  • Histograma de data: (somente para dados de data) a contagem de valores na coluna que se enquadram em dados agrupados uniformemente. Cada grupo é indicado por um valor inicial e uma contagem de valores no grupo, separados por dois-pontos. Um grupo contém valores até (mas não incluindo) o valor inicial do próximo grupo. 1:23, 2:15,3:0 indica três grupos começando em 1, 2 e 3. Cada grupo tem 23, 15 e 0 itens, respectivamente.

  • Mínimo: o menor valor na coluna.

  • Máximo: o maior valor na coluna.

  • Únicos
: o número de valores exclusivos no campo. Use a ferramenta Exclusivo para ver uma contagem completa das entradas exclusivas e duplicadas. Acesse Ferramenta Exclusivo para obter mais informações.

  • Valores exclusivos: todos os valores exclusivos na coluna.

Dados de objetos geográficos

Se uma coluna contiver objetos geográficos, estes metadados serão fornecidos:

  • Nome: o nome da coluna.

  • Tipo de dados: o tipo de dados da coluna selecionada.

  • Tamanho: a quantidade de memória reservada para cada registro nessa coluna.

  • Fonte: a origem da coluna. Esse pode ser o nome da fonte de dados ou o caminho para o local onde os dados estão salvos.

  • Descrição: a descrição da coluna, se disponível. Se nenhuma descrição estiver disponível, será [Null].

  • OKs: o número de valores na coluna sem problemas de qualidade identificados.

  • Nulos: o número de valores na coluna que são nulos, excluindo valores vazios.

  • Não nulas: o número de entradas não nulas na coluna, incluindo valores vazios.

  • Tamanho médio (bytes): o tamanho médio na memória que este objeto ocupa.

  • Maior tamanho (bytes): o tamanho na memória do maior objeto da coluna.

  • Contagem de pontos: o número de objetos geográficos na coluna que são pontos.

  • Contagem de linhas: o número de objetos geográficos na coluna que são linhas.

  • Contagem de PolyPolyline: o número de objetos geográficos na coluna que são polilinhas.

  • Contagem de retângulos: o número de objetos geográficos na coluna que são retângulos.

  • Contagem de polígonos: o número de objetos geográficos na coluna que são polígonos.

  • Contagem de multipontos: o número de objetos geográficos na coluna que são multipontos.

  • Número médio de partes: o número médio de partes nos objetos geográficos dentro da coluna.

  • Maior número de partes: o maior número de partes nos objetos geográficos dentro da coluna.

  • Número médio de pontos: o número médio de pontos nos objetos geográficos dentro da coluna.

  • Maior número de pontos: o maior número de pontos nos objetos geográficos dentro da coluna.

  • Comprimento mais longo: o comprimento mais longo dos objetos geográficos dentro da coluna.

  • Maior área: a maior área em milhas quadradas ou quilômetros quadrados.