400-688-0112
面向具備編程實戰(zhàn)經(jīng)驗的開發(fā)者,本實訓(xùn)項目深度解析Hadoop分布式框架與Spark計算引擎的整合應(yīng)用。通過真實企業(yè)級案例實操,學(xué)員將掌握從數(shù)據(jù)采集到流式處理的完整開發(fā)流程,培訓(xùn)周期包含Cloudera官方認(rèn)證考試專項輔導(dǎo)。
模塊 | 核心技術(shù)點 | 實訓(xùn)目標(biāo) |
---|---|---|
分布式存儲 | HDFS架構(gòu)原理、Sqoop數(shù)據(jù)遷移 | 掌握PB級數(shù)據(jù)存儲方案設(shè)計 |
批處理計算 | MapReduce優(yōu)化、Spark RDD | 實現(xiàn)復(fù)雜ETL流程開發(fā) |
實時計算 | Spark Streaming、Kafka集成 | 構(gòu)建毫秒級響應(yīng)流處理系統(tǒng) |
參訓(xùn)學(xué)員需滿足以下技術(shù)基礎(chǔ):