Skip to main content

Python tool Ferramenta Python

Fluxo de trabalho de exemplo

A ferramenta Python tem um fluxo de trabalho de exemplo. Visite Exemplos de fluxos de trabalho para saber como acessar esse e muitos outros exemplos diretamente do Alteryx Designer.

A ferramenta Python é um editor de código para usuários do Python. Recomenda-se ter proficiência em Python para utilizar essa ferramenta.

Depois de importar o pacote Alteryx Python, execute Alteryx.help para obter informações sobre funções úteis:

  • from ayx import Alteryx

  • Alteryx.help()

Importante

O Designer aceita um código Python de cliente (customer Python code), mas o Alteryx não é compatível com esse código .

Começar

A janela de configuração da ferramenta Python se parece com o Jupyter Notebook. Se você não estiver familiarizado com o Jupyter Notebook, vá para Ajuda > Tour pela interface do usuário ou Ajuda > Ajuda do Notebook. Para obter assistência com código, consulte referências adicionais em Ajuda.

Nota

Embora a ferramenta imite a interface do Jupyter Notebook, algumas opções podem se comportar de maneira diferente do esperado.

Instalar os pacotes de data science de que você precisa

A ferramenta Python inclui estes pacotes de ciência de dados:

  • ayx: API do Alteryx

  • jupyter: metapacote do Jupyter

  • matplotlib: pacote de plotagem do Python

  • numpy: numpy, processamento de matriz para números, cadeias de caracteres (strings), registros e objetos.

  • pandas: poderosas estruturas de dados para análise de dados, séries temporais e estatísticas.

  • requests: Python HTTP para humanos

  • scikit-learn: um conjunto de módulos do Python para aprendizado de máquina (machine learning) e mineração de dados.

  • scipy: SciPy, biblioteca científica para Python

  • six: utilitários compatíveis com Python 2 e 3.

  • SQLAlchemy: biblioteca de abstração de banco de dados

  • statsmodels: computações e modelos estatísticos para Python.

Instalação de pacotes adicionais

Dependendo de qual versão do Designer você usa, é possível instalar pacotes adicionais utilizando a função Alteryx.installPackages. Por exemplo, instale o keras:

   from ayx import Package

Package.installPackages("keras")

Você só pode instalar pacotes adicionais do Python se executar o Designer como administrador. Usuários não administradores não podem instalar pacotes adicionais do Python.

Conectar entradas

A ferramenta Python aceita múltiplas entradas. Depois de conectar entradas, é necessário executar o fluxo de trabalho para armazenar em cache os fluxos de dados de entrada. Siga estas etapas para acessar uma conexão de dados de entrada:

1. Importe a biblioteca do Alteryx:

   from ayx import Alteryx

2. Acesse a conexão e forneça uma variável para usar como uma referência de dados:

   # Use the method this method to read data from the reference. Replace "CONNECTION_NAME" with the name of your connection.

data1 = Alteryx.read("CONNECTION_NAME")

# Read in all connections and reference the returned zero-index array. Replace "INDEX_NUMBER" with the appropriate index number from the array.

Alteryx.read(Alteryx.getIncomingConnectionNames()[INDEX_NUMBER])

3. Execute o fluxo de trabalho antes de começar a trabalhar com a ferramenta Python. Isso armazena seus dados em cache e os torna acessíveis à ferramenta.

Nota

A ferramenta Python trata seus dados como um quadro de dados do pandas. Para obter mais informações, visite pandas.pydata.org.

Configurar a ferramenta

Definir o modo de execução do fluxo de trabalho

Você pode usar dois modos para trabalhar com a ferramenta Python:

  • Use o modo Interativo para iniciar o desenvolvimento.

  • Utilize o modo de Produção para melhorar a velocidade quando tiver concluído o desenvolvimento e quiser executar seu código por meio de um interpretador padrão de Python.

Modo Interativo

Clique no botão Interativo. Use esse modo para o desenvolvimento. Esse modo permite que você interaja com os dados de entrada por meio do Jupyter Notebook sem a necessidade de executar novamente o fluxo de trabalho para ver os resultados do código.

Quando você executa o fluxo de trabalho, o Designer executa estas tarefas:

  • O Designer armazena uma cópia dos dados de entrada em cache e os torna disponíveis para a ferramenta Python.

  • O shell Jupyter executa o código no Notebook.

  • Se seu código chamar o método Alteryx.write(), o shell Jupyter enviará os resultados por meio das âncoras de saída.

  • O Jupyter Notebook exibe quaisquer erros, avisos e comandos de impressão, assim como quando você seleciona Executar tudo.

Modo de Produção

Clique no botão Produção. Use esse modo para modelos em produção. Nesse modo, o Designer consolida todas as células Python do Jupyter Notebook em um único script somente leitura. O Designer passa esse script para o interpretador de Python.

Quando você executa o fluxo de trabalho, o Designer executa estas tarefas:

  • Ignora o shell do Jupyter e executa o script somente leitura por meio de um interpretador padrão de Python.

  • Não exibe nenhum erro, aviso ou comando de impressão.

Para editar o script do modo "Produção", clique em modo Interativo e edite as células no Jupyter Notebook. Depois de concluir as edições, clique em modo Produção.

Definir o formato de armazenamento dos dados

A ferramenta Python tem duas opções de formato: SQLite e YXDB.

SQLite
  1. Clique no menu Alteryx na janela de configuração da ferramenta Python.

  2. Selecione Substituir Sqlite.

Thumbnail
YXDB

Siga estas etapas para usar o formato de armazenamento de dados YXDB.

  1. Clique no menu Alteryx na janela de configuração da ferramenta Python.

  2. Clique em Substituir Sqlite para remover a marca de seleção.

SQLite

YXDB

Blob

Sem suporte

Suporte

Objetos geográficos

Sem suporte

Passe objetos geográficos entre a ferramenta Python e outras ferramentas. Use marcações de metadados ao criar saídas de objetos geográficos na ferramenta Python.

Limitação de coluna

O limite é 2000

Sem limite

Observação de valores nulos

Sem suporte

O Designer converte colunas numéricas ou de byte para dados do tipo float64 (ou seja, float de precisão dupla).

Se você não alterar a organização das linhas ou se usar o Python geoespacial, a Alteryx recomenda que você corte os dados geoespaciais do conjunto e os adicione novamente depois da ferramenta Python. A razão para isso é que a conversão do Alteryx entre texto binário e texto geoespacial é lenta.

Importar um arquivo ou diretório

Você pode importar um arquivo ou diretório de duas maneiras:

  • Use a função de importação no menu Alteryx para importar blocos de anotações do Jupyter ou scripts Python individuais.

  • Use o comando import para importar um diretório.

Siga estas etapas para importar um script Python ou um Jupyter Notebook com a função de importação:

  1. Clique no menu Alteryx.

  2. Selecione Importar script.

  3. Selecione Escolher arquivo.

  4. Navegue até um arquivo .py ou .ipynb e selecione Importar.

Utilizar o menu Kernel

Emita qualquer um destes comandos do menu Kernel:

  • Para interromper o processamento, selecione Interromper.

  • Para reiniciar o processamento, selecione Reiniciar.

  • Para limpar a pasta de trabalho de resultados imediatos, selecione Reconectar.

  • Alterar kernel não fornece funcionalidade.

  • A Alteryx recomenda que você não selecione Desligar.

Siga as práticas recomendadas

Estas práticas o ajudam a usar a ferramenta Python com sucesso:

Use o método Alteryx.getWorkflowConstant ao se referir a uma constante de fluxo de trabalho, tal como Engine.WorkflowDirectory. Caso contrário, o resultado ou a saída do comando substitui permanentemente o comando no Jupyter Notebook quando você executa o código.

Atenção

Evite utilizar wrappers % em constantes de fluxo de trabalho. Em vez disso, por exemplo, use isto para chamar Engine.WorkflowDirectory:

from ayx import Alteryx

Alteryx.getWorkflowConstant("Engine.WorkflowDirectory")

Dados de saída da ferramenta

Use o método Alteryx.write para gerar a saída de dados da ferramenta.

Para enviar dados para outras ferramentas na tela, use o método como:

   # Replace "PANDAS_DF" with your data, in DataFrame form.
# Replace "OUTPUT_ANCHOR_NUM" with the number of your output anchor.

Alteryx.write(PANDAS_DATAFRAME, OUTPUT_ANCHOR_NUM)

O método Alteryx.write só aceita quadros de dados do pandas. Se seus dados estiverem em outro formato, utilize a biblioteca do pandas para convertê-los em um quadro de dados. A biblioteca do pandas vem pré-instalada com o Designer. Acesse-a no Jupyter Notebook usando import pandas.

É possível enviar até cinco quadros de dados às âncoras de saída.