Matt Casters的博客:http://www.ibridge.be/
、 www.kettle.be
書籍:
《Pentaho Kettle解決方案:使用PDI構建開源ETL解決方案》 鏈接:https://pan.baidu.com/s/15iUOWOCb8g_YLo5WN9fh0A 提取碼:5upf
kettle起源
Kettle一詞起源于“KDE ETTL Environment”,因為最開始的計劃是在K Desktop Environment(http://www.kde.org)上開發這個軟件。在這個計劃被取消后,才把它重命名為“Kettle ETTL Environment”.
kettle的設計
- 開放,可讀的元數據格式(xml)
- 開放,可讀的關系型資源庫格式
- 開放的api
- 容易安裝(少于2分鐘)
- 對各類數據庫開放
- 容易使用的圖形用戶界面
- 容易傳送數據
- 容易把數據轉換成各種格式 kettle的性能瓶頸應該主要在于數據的編碼和解碼。所以kettle的一個設計原則就是盡量不做數據的轉換
插曲
2001年Matt就有了開發一個自己的ETL工具的想法
Matt:"我想寫一個ETL軟件。但這回占用我晚上和周末的時間"
Kathleen(Matt的夫人):“oh,太好了!要用多長時間?”
Matt:“如果一切順利,第一個能運行的版本應該用三年時間,第一個完整的版本要用5年。”