概述
Kettle是一个开源的ETL工具
,全称为KDE Extraction, Transportation, Transformation and Loading Environment。
Kettle是企业级数据集成及商业智能套件Pentaho的主要组成部分,Kettle亦重命名为Pentaho Data Integration
Pentaho Data Integration以Java开发,支持跨平台运行
特性
支持100%无编码、拖拽方式开发ETL数据管道;
可对接包括传统数据库、文件、大数据平台、接口、流数据等数据源;
支持ETL数据管道加入机器学习算法。
区分
Pentaho Data Integration分为商业版与开源版;在中国,仍习惯把Pentaho Data Integration的开源版称为Kettle
作用
抽取、转换、装入和加载数据;开发者希望把各种数据放到一个壶里然后以一种指定的格式流出
Spoon
Spoon 是一个图形用户界面,它允许你运行转换或者任务,其中转换是用 Pan 工具来运行,任务是用 Kitchen 来运行。Pan 是一个数据转换引擎,它可以执行很多功能,例如:从不同的数据源读取、操作和写入数据
。Kitchen 是一个可以运行利用 XML 或数据资源库描述的任务。通常任务是在规定的时间间隔内用批处理的模式自动运行。