准备

基于列中数据将字段类型设置为尽可能小的大小。

将输入记录拆分为两个或三个随机样本。

修复常见的如 null 值和不需要字符等数据质量问题。修改大小写。

使用筛选工具,根据条件选择数据。符合条件的数据行会输出至 True 锚点。

公式工具使用表达式创建和更新列。

生成行工具会在记录级别创建新的数据行。

数值替换工具让用户能够替换数字型数据字段中的值。

此工具允许用户对多个字段进行分块或装箱。

多字段公式工具使用一个表达式创建或更新多个字段。

此工具使用表达式来创建和更新列,在创建公式时使用行数据。

此工具允许对具有较高的否定响应的数据进行标准化。

返回传入数据流的随机抽样。
![]() |
对数据进行排列,以便进一步处理或输出。

使用“记录 ID”在数据中创建新的列,并为数据中的每一行分配按顺序递增的唯一标识符。

此工具将数据流限制为指定的数量、百分比或随机行数。

此工具返回指定的记录和记录范围,

选择工具对流过工作流的数据列进行选择、排除和重新排序。

使用排序工具可以根据指定数据列的值,按字母数字顺序对表中的行进行排列。

此工具使用用户指定的方法根据数据中的范围分配一个值(分块)。

此工具根据指定的字段区分一个数据记录是唯一的还是重复的。