400-688-0112
本課程專為具有Hadoop開發(fā)經(jīng)驗的技術(shù)人員設(shè)計,重點培養(yǎng)以下核心能力:
| 模塊編號 | 教學(xué)內(nèi)容 | 課時安排 |
|---|---|---|
| 模塊1-4 | 數(shù)據(jù)科學(xué)基礎(chǔ)與項目周期管理 | 16課時 |
| 模塊5-8 | 數(shù)據(jù)轉(zhuǎn)換與統(tǒng)計分析實戰(zhàn) | 24課時 |
| 模塊9-12 | Spark MLlib應(yīng)用開發(fā) | 32課時 |
掌握Hadoop Streaming數(shù)據(jù)處理技術(shù),熟練運用Python進(jìn)行ETL流程開發(fā),實現(xiàn)TB級數(shù)據(jù)的高效處理。
通過電商推薦系統(tǒng)真實案例,學(xué)習(xí)協(xié)同過濾算法在Spark環(huán)境下的工程化實現(xiàn)。
模擬企業(yè)生產(chǎn)環(huán)境,進(jìn)行集群資源優(yōu)化配置,解決實際部署中的性能瓶頸問題。