400-688-0112
本課程專為具有Hadoop開發(fā)經(jīng)驗(yàn)的技術(shù)人員設(shè)計(jì),重點(diǎn)培養(yǎng)以下核心能力:
模塊編號(hào) | 教學(xué)內(nèi)容 | 課時(shí)安排 |
---|---|---|
模塊1-4 | 數(shù)據(jù)科學(xué)基礎(chǔ)與項(xiàng)目周期管理 | 16課時(shí) |
模塊5-8 | 數(shù)據(jù)轉(zhuǎn)換與統(tǒng)計(jì)分析實(shí)戰(zhàn) | 24課時(shí) |
模塊9-12 | Spark MLlib應(yīng)用開發(fā) | 32課時(shí) |
掌握Hadoop Streaming數(shù)據(jù)處理技術(shù),熟練運(yùn)用Python進(jìn)行ETL流程開發(fā),實(shí)現(xiàn)TB級(jí)數(shù)據(jù)的高效處理。
通過電商推薦系統(tǒng)真實(shí)案例,學(xué)習(xí)協(xié)同過濾算法在Spark環(huán)境下的工程化實(shí)現(xiàn)。
模擬企業(yè)生產(chǎn)環(huán)境,進(jìn)行集群資源優(yōu)化配置,解決實(shí)際部署中的性能瓶頸問題。