Outil Comparaison ST
Exemple d'outil unique
Il existe un exemple d'outil unique pour l'outil Comparaison ST. Accédez à la page Exemples de workflows pour savoir comment accéder à cet exemple et à de nombreux autres exemples directement dans Alteryx Designer.
L'outil Comparaison ST compare un ou plusieurs modèles de séries temporelles créés avec l'outil ARIMA ou ETS, y compris les modèles ARIMA qui utilisent des covariables.
Cet outil fournit un certain nombre de mesures couramment utilisées pour évaluer la précision des modèles afin de comparer les prévisions de points de chaque modèle avec les valeurs réelles du champ en prévision pour un jeu de données retenu. De plus, un diagramme et une table des valeurs réelles et prévues sont fournis. Les entrées vers la macro sont un ou plusieurs modèles de séries temporelles (qui ont fait l'objet d'une union) qui sont basés sur le même champ et sur le même jeu de données d'estimation, et sur un flux de données Alteryx qui contient les valeurs réelles pour la période retenue, ainsi que les valeurs des covariables qui ont pu être utilisées lors de la création du modèle. Les valeurs réelles doivent correspondre aux périodes de temps qui suivent immédiatement les périodes de temps utilisées pour créer les modèles.
Le chapitre 2, section 5 de l'ouvrage en ligne de Hyndman et Athanasopoulos Forecasting : Principals and Practice présente une analyse intéressante des mesures utilisées pour évaluer l'exactitude des modèles de prévision.
Note
Cet outil utilise l'outil R. Accédez à Options > Télécharger les outils prédictifs et connectez-vous au portail de licences et de téléchargements Alteryx pour installer R et les packages utilisés par l'outil R. Consultez la page Télécharger et utiliser les outils prédictifs.
Connexion des entrées
L'outil Comparaison ST nécessite l'un des flux de données Designer suivants…
Un ensemble de modèles de séries temporelles qui prédisent le même champ, idéalement estimant les mêmes périodes de temps, qui ont fait l'objet d'une union.
Un flux de données Alteryx qui contient le même champ que celui prévu par les outils de séries temporelles ARIMA ou ETS, mais pour des périodes de temps qui suivent immédiatement les périodes de temps utilisées pour estimer les modèles. Si un des modèles à comparer est un modèle ARIMA avec des covariables, alors tout champ de covariable utilisé doit être inclus dans le flux de données. La taille du jeu retenu doit être au moins aussi longue que le nombre de périodes dans le futur où le modèle sera utilisé pour prédire en production. Si l'échantillon total disponible est grand, la taille du jeu retenu est souvent plus grande que le nombre de périodes à prévoir, et représente souvent entre 10 et 20 % des données disponibles.
Configuration de l'outil
Dans l'onglet Options des graphiques, définissez les contrôles de sortie.
Taille du tracé : sélectionnez « pouces » ou « centimètres » pour indiquer la taille du graphique.
Résolution du graphique : sélectionnez la résolution du graphique en points par pouce : 1x (96 dpi) ; 2x (192 dpi) ; ou 3x (288 dpi).
Une résolution basse produit un fichier de plus petite taille et facilite la visualisation sur un moniteur.
Une résolution élevée produit un fichier de plus grande taille avec une qualité d'impression supérieure.
Taille de la police de base (points) : sélectionnez la taille de la police dans le graphique.
Visualisation de la sortie
Connectez un outil Explorateur à chaque ancrage de sortie pour afficher les résultats.
Ancrage O : contient un flux de données des noms de chaque modèle examiné et ses statistiques de précision. Les statistiques de précision sont l’erreur de précision moyenne (ME), les erreurs quadratiques moyennes de prévision (RMSE), les valeurs absolues moyennes des erreurs de prévision (MAE), le pourcentage d’erreur moyen de la prévision (MPE), le pourcentage d’erreur absolue moyenne de la prévision (MAPE) et l’erreur d’échelle absolue moyenne (MASE). La mesure sur laquelle on se concentre le plus couramment est la mesure MAPE, cependant la mesure MASE répond à quelques défaillances de la MAPE. Pour toutes les mesures, les modèles avec des valeurs plus petites de ces mesures sont préférés à ceux qui ont des valeurs plus grandes.
Ancrage R : se compose de snippets de rapports d'une table avec les valeurs réelles et de prévision, d'une table des statistiques de précision pour chaque modèle et d'un diagramme qui montre toutes les valeurs des séries temporelles et les valeurs de prévision pour tous les modèles en comparaison.
Ancrage I : tableau de bord HTML interactif comprenant des diagrammes et des métriques. Sélectionnez les différents éléments graphiques pour interagir avec les visualisations afin d'afficher plus d'informations, de valeurs, de métriques et d'analyses.
*Hyndman, R.J. and Athanasopoulos, G. (2012) Forecasting: Principles and Practice.