摘要:相比其他開源的工具和其他商業的工具,對比下來還是比較強大和好用。
1.為什么要使用數據抽取
(1)為了不妨礙業務數據的讀取和寫入,需要進行數據的抽取,抽取到另外數據庫表進行讀取
(2)對某些總計數據可以進行預先計算, 抽取到另外數據庫表
(3)隨訪業務數據庫為mongodb , 統計程序編程效率低,需要轉成sql 類數據庫提高效率
使用 kettle 開源etl工具
網址:http://community.pentaho.com/projects/data-integration/
總體來講,就是這么個步驟:
選擇數據輸入——中間數據處理——最后數據輸出
比如從mongodb 同步到 sqlserver過程如下:
(1)選擇核心對象中的bigdata MongoDB Input (數據輸入) (2)進行數據處理 (這里篩選了需要抽取的字段) (3)選擇插入更新輸出 4.總結數據輸入的形式很多,各種形式的數據都可以做為一手數據源, kettle 數據轉換的功能也很強大, 還可以進行 java ,javascript 等腳本的編寫來進行高級的數據處理, 最后得到需要的數據。
相比其他開源的etl工具和其他商業的etl工具,對比下來 kettle還是比較強大和好用。
文章版權歸作者所有,未經允許請勿轉載,若此文章存在違規行為,您可以聯系管理員刪除。
轉載請注明本文地址:http://m.specialneedsforspecialkids.com/yun/18847.html
摘要:是一款國外開源的工具,純編寫,可以在上運行,數據抽取高效穩定。 Kettle是一款國外開源的ETL工具,純java編寫,可以在Window、Linux、Unix上運行,數據抽取高效穩定。作為一個數據抽取工具,在建立數據倉庫的過程中,免不了需要從不同的數據源中抽取到集中的數據倉庫中,下面就拿mongodb抽取到mysql為例,簡述抽取數據的步驟: 新建轉換:test 在test中新建M...
摘要:是一款國外開源的工具,純編寫,可以在上運行,數據抽取高效穩定。 Kettle是一款國外開源的ETL工具,純java編寫,可以在Window、Linux、Unix上運行,數據抽取高效穩定。作為一個數據抽取工具,在建立數據倉庫的過程中,免不了需要從不同的數據源中抽取到集中的數據倉庫中,下面就拿mongodb抽取到mysql為例,簡述抽取數據的步驟: 新建轉換:test 在test中新建M...
閱讀 3572·2023-04-26 00:05
閱讀 958·2021-11-11 16:55
閱讀 3534·2021-09-26 09:46
閱讀 3524·2019-08-30 15:56
閱讀 917·2019-08-30 15:55
閱讀 2940·2019-08-30 15:53
閱讀 1952·2019-08-29 17:11
閱讀 820·2019-08-29 16:52