数据抽取组件概览

输入节点

输入节点是数据抽取的入口,用来选择要处理的数据源。在选择数据源时,可以自由勾选所需的字段。

输出节点

输出节点是整个数据抽取的出口,将数据抽取过程中一系列的处理操作组合在一起并输出供其他业务使用。

连接节点

连接节点就是将两张数据集合中的数据左右合并为一张表,连接节点目前主要支持左连接、右连接、内连接和全连接4种连接方式:

分组汇总

分组汇总就是将所有数据先按照组来进行分类,然后对组内的数据进行汇总计算。

数据筛选

数据筛选用于数据过滤,通过指定筛选条件可以将数据集合中不需要处理的数据过滤掉,只保留需要处理的数据。

计算字段

计算字段设置,即在数据抽取当中,对输入进来字段进行添加新的计算字段等操作。

插入更新

插入更新,就是将抽取结果按照一定的插入更新规则同步到目标数据里面