這些年,幾乎都與ETL打交道,接觸過多種ETL工具。現將這些工具做個整理,與大家分享。我們公司用過(SSIS,datastage)在選擇的時候,多聽專業人士意見,如果不懂,那就去 51job 上面看,人家招聘 那個崗位需求多,要求怎麼樣。
資料庫也可以做數據倉庫,不過就是 專業的工具 寫起來效率更高,現成的工具直接調用。還有就是如果你是數據產品經理,開發人員 開發東西時間成本是很大的,不要覺得今天 提需求,2天就弄出來。站在外行的角度,想當然的覺得很簡單。你一個小的思維變動,人家可能改幾天。提出的需求要思考清楚,不要經常變動。提出需求以後,後面不要加需求。開發人員最討厭,因為你的思考不全面,謹慎導致重新開發,返工。
一 ETL工具
【國外】
1. datastage
點評:最專業的ETL工具,價格不菲,使用難度一般
2. informatica
點評:專業程度如Datastage旗鼓相當,價格似乎比Datastage便宜。
Informatica PowerCenter 8.6.1 for Win 32Bit
3. kettle
點評:業界最有名的開源ETL工具。開源當然就免費,免費的有些東西使用就不是很方便。
4. ODI
點評:oracle資料庫廠商提供的工具,有局限性,與oracle資料庫耦合太深。
5.Cognos
Cognos BI Cognos是在BI核心平臺之上,以服務為導向進行架構的一種數據模型,是唯一可以通過單一產品和在單一可靠架構上提供完整業務智能功能的解決方案。它可以提供無縫密合的報表、分析、記分卡、儀錶盤等解決方案,通過提供所有的系統和資料資源,以簡化公司各員工處理資訊的方法。作為一個全面、靈活的產品,Cognos業務智能解決方案可以容易地整合到現有的多系統和數據源架構中。
6.SSIS
SSIS是Microsoft SQL Server Integration Services的簡稱,是生成高性能數據集成解決方案(包括數據倉庫的提取、轉換和加載 (ETL) 包)的平臺。構成Integration Services 包括用於生成和調試包的圖形工具和嚮導;用於執行工作流函數(如 FTP 操作)、執行 SQL 語句或發送電子郵件的任務;
------------------------------------------
【國內】
6. beeload
點評: 最好的國產ETL工具,但產品化程度還有一定距離。國內的工具基本不怎麼用,用的人少,大家需要謹慎選擇。
---------------------------
二 專業調度工具
有人說: ETL是BI的基礎,而調度是ETL的靈魂,可見調度的重要性!
調度原本是ETL技術的一個分支,但這些年, 調度越來似乎有走獨立工具的趨勢。雖然在ETL工具有調度功能,但與獨立調度工具相比,ETL工具的調度就顯得很弱了。
【國外】
1. Control-M
點評:你當了大哥太多年,確實有點寂寞。不論是你的規模、價格、使用難度,都很偉大,但我一界平民,你對我只是傳說。
【國內】
2. taskctl
點評:調度新秀。專業,而且設計獨特、體驗友好。易安裝、易使用,看好其前景。
3. ETS
點評:專業化有待提升
4. Moia
點評:產品與項目是有區別的,不要總是在產品化與客戶化之間徘徊。
5. ETL-Plus
點評:功能全,遺憾的是東南倒塌。