大数据机器学习课程

讲师介绍

孟硕,恩墨学院大数据产品总监,金牌讲师

曾任职于 Oracle 甲骨文软件研究开发中心,负责 Oracle RAC 与操作系统优化,擅长利用MDB DTrace 剖析系统原理,解决系统适配的诸多问题。同时在 Oracle 解决方案中心担任 Oracle Big Data Appliance 咨询工作。取得国际商业大数据领导公司 Cloudera ACTP 认证讲师资质。加入 Oracle 之前,曾任职于中科红旗(RedFlag-Linux)操作系统服务器组,负责安全,虚拟化产品自动化 QE。在此之前供职于 国软检测中心的开源软件实验室,自此开始基础软件的研究。

授课特点:能够结合十余年的丰富操作系统、数据库以及大数据的经验,从原理层展示大数据的运用之妙。作为资深键盘侠、手敲党,能结合自身庞大的知识储备,将课程中的诸多难点消化于指尖之上,绝对让学员收获于课程之外。

获得认证:Oracle OCM

          Cloudera Certified Administrator for Apache Hadoop (CCAH)

      Cloudera ACTP 认证讲师。

 

大数据数据科学家大纲

数据科学概述

    什么是数据科学

    数据科学的日益增长的需求

    数据科学应用的案例

实践:数据科学案例讲解

数据科学数学基础进阶

    数据的获取与评估:数据的格式,数量级以及质量

    数据的传输:数据的格式转化,数据集合并及匿名化

    数据分析以及统计方法:概率与统计的关系

    描述统计学

    推论统计学

    向量与矩阵

实战:数据科学的数学基础

机器学习的理论基础

    机器学习的发展历程

    机器学习里的 3C

    数据和算法的重要性

实践:朴素贝叶斯分类

机器学习进阶:推荐系统与决策系统概述

    什么是推荐系统

    协同过滤的分类

    推荐系统的局限性

实践:推荐系统实例分析

    什么是决策系统

    协同过滤的类型

    推荐系统的局限

实践:推荐系统实例分析

利用 Spark MLlib 基础

    回顾 Spark 组件

    Spark 最新版本 Spark 2.0 的数据引擎变化

    Spark 机器学习库 MLlib

实践:Pagerank 算法实现

利用 Spark MLlib 进阶

    推荐方法的潜在因子算法:ALS 方法概述

    ALS 方法的 Hyperparameters

实践:利用 Spark MLlib 构建一个推荐器

利用 Spark MLlib 实战

    构建有效的实验模型

    推荐器的用户接口

    大规模机器学习部署的知识要点

实践:利用 Spark MLlib 推荐器相关库介绍

恩墨学院大数据机器学习课程

联系我们

  • 全国统一咨询热线:400-660-8755
  • QQ咨询:点击这里给我发消息 点击这里给我发消息 点击这里给我发消息
  • QQ群咨询:279589917
  • 邮箱:training@enmotech.com
  • 联系人:黄老师