论坛元老 
   
- 威望
 - 72 
 
- 贡献
 - 97 
 
- 热心值
 - 0 
 
- 金币
 - 14755 
 
- 注册时间
 - 2020-8-31
 
 
 
 
 | 
 
 
课程介绍: 
 
Mahout是Hadoop家族中与众不同的一个成员,是基于一个Hadoop的机器学习和数据挖掘的分布式计算框架。Mahout是一个跨学科产品,同时也是我认为Hadoop家族中,最有竞争力,最难掌握,最值得学习的一个项目之一。 
 
Mahout为数据分析人员,解决了大数据的门槛;为算法工程师,提供基础的算法库;为Hadoop开发人员,提供了数据建模的标准;为运维人员,打通了和Hadoop连接。 
 
Mahout就是训象人,在Hadoop上创造新的智慧! 
 
Mahout 是基于Hadoop的机器学习和数据挖掘的一个分布式框架。Mahout用MapReduce实现了部分数据挖掘算法,解决了并行挖掘的问题。 
 
根据”Mahout In Action”书中的介绍,Mahout实现3大类算法, 推荐(Recommendation),聚类(Clustering),分类(Classification)。 
 
课程目录: 
 
01、机器学习、Mahout与Hadoop的过去,现在与未来 
02、推荐系统算法与架构剖析 
03、推荐系统应用案例 
04、购物篮分析:频繁模式与频繁子项挖掘 
05、聚类算法模型 
06、企业大数据环境实现聚类的案例 
07、常用分类器及应用场景:贝叶斯,随机森林,SGD,SVM 
 
 
 
 |   
 
 
 
 |