多次元スケーリングツール
多次元尺度構成法(MDS)は、分散に基づいて単変量データを分離する手法です。概念的には、MDSは、データに記述されている項目間の相違点または距離を取得し、項目間にマップを生成します。このマップのディメンション数は、アナリストが生成する前に提供されることがよくあります。通常、最も高い分散のディメンションは、データに記述されている最大距離に対応します。マップソリューションは単変量データに依存しているため、マップディメンションの回転と方向は重要ではありません。MDSは、主成分分析と同様のディメンション分析を使用します。詳細については、https://en.wikipedia.org/wiki/Multidimensional_scalingを参照してください。
このツールには、クラシックMDSとアイソメトリックMDSの2種類のMDSが実装されています。クラシックMDSは、シンプルで高速なアプローチです。クラシックMDSは、アイテム間の距離とマップ上のアイテム間のデカルト距離との誤差を減らしてマップを生成することによって機能します。アイソメトリックMDSはやや複雑です。クラシックMDSの結果のマップを取得してから、アイテムペア間のマップ距離が元のデータと同じ最大値から最小値の順になるように調整すると、それがアイソメトリックMDSです。このアイソメトリックMDSは、正確な距離単位が、アイテムペアが最も離れているかまたは最も近いアイテムのランクより重要でない場合に便利です。
クラシックMDSの使用例の1つは、米国の都市間の直線距離で米国のマップを作成することです。アイソメトリックMDSの使用例の1つは、距離のランク付けが特定の単位座標より重要である食品間の栄養価がどれほど似ているか、または異なるかに基づいて多次元の食物図を作成することです。これらの方法は、異なるアイテム間の類似性を判断するために顧客が使用する知覚的次元の数および性質を得るためにマーケティングリサーチの文脈でしばしば使用されます。
ギャラリーツール
このツールは、Alteryx Designer または R ツールでは自動的にインストールされません。このツールを使用するには、Alteryx Analytics Gallery からダウンロードしてください。
入力を接続
データストリームは以下の2つの方法のいずれかで設定されます。
各エントリがアイテムのペア名とその非類似性を表す3列のストリーム。
各列がアイテムを表し、各行がアイテムを表し、各交差が相違値を表すMxM行列。詳細については、https://en.wikipedia.org/wiki/Distance_matrixを参照してください。
ツールの設定
[モデルオプション]タブ
[モデルオプション]タブを使用してモデルを設定します。
入力タイプを選択: 相違情報の入力に、3列ペアワイズアプローチと距離行列アプローチのどちらを使用するかを選択します。どちらの場合も、すべてのペアの距離を定義する必要があります。指定しないと、エラーがスローされます。
Number of Dimensions to Output: マップとデータがデータとプロットの出力に含まれる次元の数を選択します。分散のレベルを考慮するには、レポートの固有値プロットを使用して最適な次元数を選択する必要があります。
多次元スケーリングメソッドを選択する: クラシックMDSアルゴリズムとアイソメトリックMDSアルゴリズムのどちらを使用するかを選択します。
[プロットオプション]タブ
[プロットオプション]タブを使用して、出力プロットのコントロールを設定します。
コンマで区切ってフリップする次元のリスト: このリストの数字は、アイテム座標に-1を掛けた次元になります。MDSアルゴリズムでは次元の極性が任意に選択され、ユーザーの入力が役立つ場合があります。たとえば、都市間の距離に基づいて米国のマップを作成する場合、その方向は既知のものとは逆になる可能性があります。
固有値の棒グラフ: このチェックマークでは、固有値と説明をレポート出力に含めるかどうかを決めることができます。これは、データのマップに保持する次元の数を選択するのに役立ちます。主に、棒グラフは、追加の次元がノイズまたは擬似データのみをマップに組み込む点を知るのに役立ちます。
可視性のためにアイテム名をグラフの数字に取り替えますか?: マップにアイテムが多すぎるために、名前間の識別が難しい場合があります。このチェックマークで、すべてのアイテム名を番号のIDに変換するかどうかを決めることができます(例: 「jack」、「jill」、「banana」に、x1、x2、x3、...x987、x988など)。
[グラフィックオプション] タブ
[グラフィックオプション]タブを使用して、グラフィック出力のコントロールを設定します。
プロットサイズ: グラフのサイズをインチとセンチメートルのどちらにするかを選択します。
グラフの解像度: グラフの解像度を1インチあたりのドット数で選択します: 1x (96 dpi)、2x (192 dpi)、3x (288 dpi)
解像度を低くするとファイルサイズが小さくなり、モニターでの表示に最適です。
解像度を高くするとファイルサイズが大きくなり、印刷品質が向上します。
ベースフォントサイズ (ポイント): グラフ内のフォントのサイズを選択します。
出力の表示
各出力アンカーに閲覧ツールを接続して、結果を表示します。
Dアンカー: (データ)各アイテムと各次元の座標値のエントリが含まれます。
Pアンカー: (プロット)ツール設定で表示されたグラフィック設定のレポート出力が含まれます(オプション)。固有値がどのようなものかの説明と、各次元の分散を示すテーブルとグラフ。各次元ペアのプロット(例: {1,2};{1,3};{1,4};{2,3};{2,4};{3,4})。各アイテムは名前または数値識別子(オプション)で表されます。