数据挖掘和etl处理(数据抽取清洗转换加载工具ETL)

应用场景

当你想通过工具,从一个数据库将数据进行清洗后搬迁到另一个数据库,那么就可以通过ETL的数据抽取清洗转换加载工具来操作。

操作步骤

1. 工具下载

kettle文件下载,解压即可用:

下载地址

2. 配置

首先我们了解下Epoint-DI能做什么?

一般我在项目中数据抽取一般都是自己写定时任务,通过quartz或者其他任务调度框架来定时从数据源中抽取数据,所有有关数据的抽取、校验、转换等过程都是在代码中手工编写,针对不同的数据源都是需要手动来编写代码,然后重新发布数据抽取程序。但是通过DI就可以实现配置的方式来创建定任务调度,数据的抽取、校验、转换等过程。并且支持多种数据的输入、输出方式,有完善的过滤组件,数据处理组件等。


简单的数据推送

创建一个输入组件、一个输出组件即可。负责抽取和插入数据。

数据挖掘和etl处理(数据抽取清洗转换加载工具ETL)(1)

表输入:

数据挖掘和etl处理(数据抽取清洗转换加载工具ETL)(2)

表输出:

数据挖掘和etl处理(数据抽取清洗转换加载工具ETL)(3)

,

免责声明:本文仅代表文章作者的个人观点,与本站无关。其原创性、真实性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容文字的真实性、完整性和原创性本站不作任何保证或承诺,请读者仅作参考,并自行核实相关内容。文章投诉邮箱:anhduc.ph@yahoo.com

    分享
    投诉
    首页