許昌大數據培訓開課了!
來源:
奇酷教育 發(fā)表于:
許昌大數據培訓開課了!課程重點培養(yǎng)學員基于Hadoop架構的大數據分析實操能力,從零開始學習Scala編程,掌握Spark,手把手帶練,3個月
許昌大數據培訓開課了!課程重點培養(yǎng)學員基于Hadoop架構的
大數據分析實操能力,從零開始學習Scala編程,掌握Spark,手把手帶練,3個月成為行業(yè)急需的大數據開發(fā)人才。講解案例包括但不限于金融
大數據分析、氣象大數據分析、Web海量日志大數據分析、智慧高速
大數據分析等。
01章:
大數據前沿應用與Hadoop環(huán)境搭建
01、大數據行業(yè)前沿應用與知識介紹;02、
大數據分析師課程安排;03、Linux入門基礎;04、Hadoop入門介紹;
05、Hadoop單機環(huán)境搭建;06、Hadoop偽分布式集群搭建;07、Hadoop完全分布式集群搭建
02章:Hadoop核心組建使用方法
01、分布式文件系統(tǒng)HDFS架構原理及常用指令;02、HDFS編程入門;03、Hbase編程入門;04、分布式數據倉庫Hive架構原理及HQL語法介紹;
05、分布式計算引擎MapReduce架構原理及基本使用方法;06、資源調度器YARN基本原理;07、ETL工具Sqoop使用方法
03章:分布式計算引擎Spark入門
01、Scala語法知識介紹 ;02、Spark架構特點及基本原理;03、Spark入門及安裝部署方法;04、Spark Core介紹;
05、Spark SQL介紹與數據讀取、保存方法;06、Spark GraphX入門及基本使用方法 ;07、Spark GraphX圖計算算法案例。
04章:Spark核心組件的使用方法
01、日志采集系統(tǒng)Flume和分布式消息隊列Kafka入門;02、流式計算框架Spark Streaming基本原理及使用方法;03、流式計算框架Structured Streaming基本原理及使用方法;
04、分布式算法庫Spark MlLib入門介紹;05、Spark ML與Spark MLLib;06、機器學習工作流。
05章:Pyspark基礎知識
01、Spark數據結構及編程語言接口;02、PySpark開發(fā)環(huán)境搭建;03、PySpark編程入門:Spark基本數據結構;
04、PySpark編程入門:PySpark常用語句;05、Spark與分布式數據庫和分布式數據倉庫的集成方法;06、采用PySpark讀取分布式數據庫中數據;07、 PySpark數據清洗案例。
以上就是
奇酷老師為大家分享的“許昌大數據培訓開課了!”謝謝大家觀看,如果對大數據感興趣的話,想學
大數據培訓的,也可以在線咨詢,我們將竭誠為你解答。