论坛元老 
   
- 威望
 - 72 
 
- 贡献
 - 97 
 
- 热心值
 - 0 
 
- 金币
 - 14755 
 
- 注册时间
 - 2020-8-31
 
 
 
 
 | 
 
 
课程介绍: 
 
Spark 概述& Spark DataFrame 大数据处理框架介绍 
本课程主要对Apache Spark和Spark DataFrame 大数据处理框架进行详细介绍并用案例方式进行讲解。 
 
课程背景:  
 
2015年10月24日-25日,全球最大的开源软件基金会 Apache Software Foundation(目前有超过200个以上的项目,从20年前起步的 Apache Web Server,到目前最火爆的云计算(Mesos,CloudStack..),数据库(Cassandra,HBase, ClouchDB..),大数据(Hadoop,Spark,Storm..),开发语言/框架等等),与开源社携手举办线下+线上的 Apapche Roadshow 2015 - China,本课程为其会议内容的一部分——大数据金牌训练营的课程内容。  
 
核心内容:  
 
1.Apache Spark 介绍 
2.Spark 产生背景 
3.Spark 生态系统介绍 
4.Spark 对于 Hadoop 
5.RDD 及常用操作 
6.案例:日志挖掘 
7.Spark分布式任务执行 
8.容错机制 
9.案例:wordcount & PageRank 
10.DataFrame 介绍 
11.MLlib 介绍 
12.GrapxX 介绍  
 
软件环境:无  
 
是否提供资料:否  
 
课程等级:初级  
 
适合人群:  
 
数据工程师,数据分析师 
 
课程目录: 
 
1 Spark 概述& Spark DataFrame 大数据处理框架介绍 59:06 
本课程主要对Apache Spark和Spark DataFrame 大数据处理框架进行详细介绍并用案例方式进行讲解。 
 
 
 
 |   
 
 
 
 |