MB 亲子关系工具
MB 亲子关系工具采用“事务”数据并构造一个矩阵,其中每一行都是一个事务,列是可以出现在事务中的“项目”集。如果某个项目存在于事务中,则其在矩阵中的值为1,否则为0。矩阵随后用于根据各项目存在于同一事务中的可能性来构建其相关性矩阵。因此,如果存在 500 个项目,产生的矩阵具有 500 行和 500 列。
此工具会根据事务记录的数量进行扩展,但受限于它可以处理的唯一项目数。使用常见的笔记本电脑和台式机配置时,限制可能为 3,000 到 5,000 个唯一项目之间。
此工具使用 R 工具。转至选项 > 下载预测工具,并登录到 Alteryx 下载和许可门户以安装 R 和 R 工具使用的包。请参考下载和使用预测工具。
配置工具
选择事务关键字段:所选字段必须为数字,并应包含事务 ID。
选择包含项目标识符的字段:所选字段应包含(要比较的)项目的名称或 ID。
亲和度测量:
余弦距离:测量 2 个项目之间的距离(即差异)。该值介于 0(最相似)到 1(最不相似)之间。
余弦相似度:衡量两个项目之间的相似度。该值介于 0(最不相似)到 1(最相似)之间。
共生:同时出现两个项目的事务数计数
各数据区块的记录数:要同时处理的最大记录数。