予測分析
Designerには、統計分析と予測分析に使用されるオープンソースのコードベースであるRを使用する一連の予測ツールが含まれています。
このツールは、データ探索、予測分析のためのデータ準備の専門的要素、予測モデル、さまざまなモデルの有効性を比較し評価するツール、計画的な方法でレコードとフィールドをグループ化するツール、予測分析ソリューションの展開を支援するツールなどから成っています。
予測ツールはRプログラミング言語を使用します。 オプション > 予測ツールをダウンロード の順に進み、 Alteryx Downloads and Licenses ポータルにサインインして、R と R ツール で使用されるパッケージをインストールします。
インデータベースサポート
インデータベースでサポートされる6つの予測ツールがあります。
インデータベースでサポートされる予測ツールが別のIn-DBツールを使用してキャンバスに配置されると、予測ツールはIn-DBバージョンに自動的に変更されます。ツールのバージョンを変更するには、ツールを右クリックし、[ツールバージョンの選択] をポイントして、別のバージョンのツールを選択します。インデータベースのサポートとツールの詳細については、 インデータベースの概要 を参照してください。
Microsoft SQL Server 2016 | Oracle | Teradata | |
---|---|---|---|
はい | |||
はい | |||
はい | |||
はい | はい | はい | |
はい | はい | はい | |
はい | はい | はい |
予測分析ツール
このツールカテゴリには、予測分析プロジェクトで使用されるデータをよりよく理解するためのツールと、予測分析のための特殊なデータサンプリングタスクを実行するためのツールが含まれています。予測分析プロジェクトで使用されているデータをよりよく理解するためのツールには、可視化ツールと説明統計のテーブルを提供するツールがあります。
視覚メソッドを使用して分析するデータをユーザーが深く理解するのに役立つツールは次のとおりです。






ユーザーが分析されるデータをよりよく理解するのに役立つ要約統計情報を提供するツールは、次のとおりです。








このカテゴリには、分類(カテゴリターゲットフィールド)と回帰(ニューメリックターゲットフィールド)モデルの両方に向けた一般的な予測モデリングのツール、モデル比較用ツール、予測モデリングに関連する仮説テスト用ツールが含まれます。一般的な予測モデリングのための一連のツールは、従来の統計モデル、より現代的な統計学習方法にさらに分類することができます。単一の[スコアリング]ツールは、両方のタイプの一般的な予測モデリングツールからモデル予測を取得するためのメカニズムを提供します。
伝統的な統計モデルとより現代的な統計的学習方法との間の重要な差異は、モデリングプロセスにおける直接のユーザー介入のレベルです。伝統的な統計モデルは、適切なレベルの予測効力を持つモデルを開発するために、はるかに高いレベルのユーザー介入と専門知識を必要とします。具体的には、ユーザーは重要な予測フィールドを事前に選択しなければならず、ターゲットフィールドと連続予測の間の非線形効果を捕捉するために、数値フィールドに適切な変換を適用する必要が高くなります。重要な予測(非線形関係に起因する可能性のある問題を無視する)の選択は、従来のモデルに対してステップワイズ回帰の使用を通して割り当てることができます。対照的に、現代の統計学的学習方法は、ターゲット予測と数値予測間の予測選択と可能な非線形関係の両方に内部的に取り組むアルゴリズムを利用します。
伝統的な統計モデルは、予測されているターゲットフィールドの性質に基づいて互いに異なります。それらのすべては、(一般化された)線形モデルの推定に基づいています。すべての統計学習アルゴリズムは、予測選択と非線形効果を内部的に扱うのと同じ性質を持っていますが、それらのアプローチは異なります。その結果、ユーザーが遭遇しそうな一連の問題にわたって、他のすべてをしのぐ唯一のメソッドはありません。
伝統的な統計モデル用のツール








現代の統計学習メソッドのためのツール




予測モデル比較と仮説検定のためのツール







すべての一般的な予測モデリングツールの値を予測するツール

相互作用的なネットワーク視覚化と主要な要約統計情報を作成するツール

生存モデルを生成し、相対リスクおよび制限された平均生存時間を推定するためのツール


ABテストツールは、販売に関する新しいマーケティングコミュニケーションキャンペーンの効果や店舗スタッフのレベルの変更の影響を調べるなど、A / Bテスト(テストと学習としても知られています)を実行する際に役立ちます。このツールは、テスト(通常、マスメディア広告を含むテストで、そのエリアに住むすべての人が広告にさらされる可能性があります)のマーケットエリアを決定すること、1つ以上のコントロールユニットを各治療ユニットに一致すること、治療へのコントロールユニットのマッチングがそれにしばしば基づく傾向と季節性の測定を開発すること、実験結果の実際の解析を実行することに役立ちます。このサブカテゴリに関連するツールは次のとおりです。




このカテゴリには、定期的な(毎月のなど、データの時間間隔)、単変量時系列のプロットおよび予測ツールの数が含まれます。カテゴリに含まれるこれらの中心は、ARIMAを作成するためのツール、および週に一度の販売予測モデルなどのアイテムを作成するために使用できる拡張指数関数的スムージング予測モデルです。これらの方法はどちらも、ターゲット変数の値の体系的な時間関連要素に基づいて予測を作成します。具体的には、傾向の要素(長期的に、ターゲット変数におけるかなりの一貫した上向きまたは下向きの動き)と季節性(時間の経過と共に繰り返す周期的なパターン)を取り上げます。
これらの要素の具体例を示すために、タブレットコンピュータ販売の時系列モデルは、クリスマスの近くで、そして学年の開始前に、より高い売上の強い季節パターンと一緒に、売上にプラスの傾向を示す可能性が高くなっています。傾向も季節性もターゲット変数に存在しない場合、ターゲット変数の予測値は、ターゲットの最新の値に対するターゲットの加重平均値に基づいて直線に向かう可能性があります。これはユーザにとっては不満足な発見となる可能性が高いですが、時間関連要素(傾向および季節性)に関してのみデータには実際の構造が存在しないことを示しています。このような場合、より一般的な予測モデリングメソッドの方が、時系列ツールよりも予測を開発する上でずっと役に立ちます。
予測を作成するためのツールに加えて、ユーザーが異なる時系列予測モデルの相対的効力を比較するのに役立つツールもあります。時系列ツールの完全なセットは次のとおりです。









このカテゴリには、レコードまたはフィールドを少数のグループにグループに分けるためのツールが含まれています。レコードをまとめてグループに分ける一般的なアプリケーションは、購買パターンに基づいてまたはストアグループのセットに基づいて顧客セグメントを作成することです。この2つの分野でグループに分ける究極の目的は、ビジネスの観点から実現可能な方法でプログラムや活動のカスタマイズを可能にする少数のグループを作成することです。
たとえば、ネットワークに500の直販店がある小売業者は、500店舗ごとに特化したマーチャンダイジングおよび価格設定プログラムを開発することに他を圧倒している可能性があります。しかし、直販店が販売パターンに関して直販店の類似性に基づいて店舗グループの小さなセットたとえば10)に配置されている場合、小売店が首尾よく実行できることは、10種類の異なるマーチャンダイジングと価格設定プログラムを作成すること(です。同様に、多くの組織では、分析したいデータベーステーブルが非常に幅広く、多くのフィールドが互いに高度に相関しています。このような場合、相関性の高い多数の測定値を扱うことは、これらのデータを用いて行われた分析を非常に複雑にします。その結果、元のフィールドセットを、より容易に分析に役立たせるより小さな複合フィールドセットに縮小することが理にかなっているかもしれません。これらの両方の場合において、データの次元性を低減してそれを実行可能にする必要があります。
レコードをグループ化するために使用される最も一般的なメソッドは、クラスター解析です。実際にはさまざまな種類のクラスター解析がありますが、ビジネスアプリケーションで最も一般的に使用されるクラスタリングメソッドは、Kセントロイドアルゴリズムに基づいています。Alteryxは、形成すべき適切な数のクラスター(グループ)を決定し、最終的なクラスターセットを作成し、特定のレコードが属するクラスターを付加するためのツールを(レコードがクラスターセットの決定に使用されたかどうかに関わらず)データに提供します。関連するツール(最近傍探索)は、ユーザが1つ以上の特定レコードの周りに所定サイズのアドホックグループを形成することを可能にします。たとえば、ツールは、過去の購入行動に基づいて顧客「X」に最も似ている5人の顧客を見つける能力をユーザーに提供します。フィールドのグループに分けるために使用できるメソッドは、主成分分析です。
マーケットバスケット解析ツール類は、どの品目がPOSデータに含まれているかを判断するのに役立ちます。また、問題の結合は欠陥レポーティングおよび作業指示システムで同時に発生する傾向があります。カテゴリ内のツールは、データ内の「ルール」のセットを決定し(たとえば、「製品欠陥BおよびCも観察された場合、製品欠陥Aが存在する可能性が高い」など)、フィルタリングツールを提供して、それを実質的により重要なものにしそうなルールに関連する一連の基準に基づいて、可能なルールのリストを絞り込むのに役立たせます。
このカテゴリのツールは次のとおりです。









このカテゴリには、特定の状況または一連のシナリオに対する最善のアクションや成果を判断するのに役立つツールが含まれます。最適なアクションを指定することによって、予測モデルの出力を増やすのに役立ちます。



