综合教程技术培训课程简介

《数据挖掘思维与实战》发掘数据隐藏价值,构建高薪知识架构

本套课程从构建数据挖掘思维的角度出发,为你详解数据挖掘,具体分为三大部分:

第一部分:

基础知识准备。 你建立对数据挖掘的全局认知,学习课程中可能会涉及的一些基础知识(包括必备的 Python 语言知识,以及如何搭建 Python 环境),夯实基础知识,帮你快速进入状态。

第二部分:

数据挖掘过程。 授人以鱼不如授人以渔,这个部分的重点是让你能够在思想和行为上都做足准备,全面细致地了解数挖掘方法的实施过程。从理论到实战搞懂“数据挖掘”这个词是如何一步步变具体的。

第三部分:

算法详解。 涉及数据挖掘的分类、聚类、回归、关联分析这四大问题,以及自然语言处理的部分知识。着重介绍核心算法的理念、优缺点、应用场景,让你能够快速上手应用。每个模块的最后一个课时,都会通过实践案例,让你掌握实战处理技巧。

彩蛋: 专栏的最后会提供数据挖掘的开源工具和学习资源: 如果你不会写代码,也可以先使用这些工具来进行数据挖掘;如果你希望在数据挖掘方面有更加深入的学习和理解,那么这些资源也会帮到你。

课程内容目录:

开篇词 掌握数据挖掘,搭上划时代的数字化列车

模块一:数据挖掘基础知识

01 数据挖掘,到底在解决什么问题?

02 Python的数据结构和基本语法

03 工欲善其事必先利其器,扩展包与Python环境

模块二:数据挖掘工作流程

04 理解业务和数据:我们需要做好什么计划?

05 准备数据:如何处理出完整、干净的数据?

06 数据建模:该如何选择一个适合我需求的算法?

07 模型评估:如何确认我们的模型已经达标?

08 模型应用:我们的模型是否可以解决业务需求?

模块三:分类问题

09 KNN算法:近朱者赤,近墨者黑

10 决策树:女神使用的约会决策

11 朴素贝叶斯:算一算你是否要买延误险

12 支持向量机(SVM):用一条线分开红豆与绿豆

13 人工神经网络:当前最火热的深度学习基础

14 实践1:使用XGB实现酒店信息消歧

模块四:聚类问题

15 k-means聚类:擒贼先擒王,找到中心点,它附近的都是一类

16 DBScan聚类:打破形状的限制,使用密度聚类

17 实践2:如何使用word2vec和k-means聚类寻找相似的城市

模块五:回归问题

18 线性回归与逻辑回归:找到一个函数去拟合数据

19 实践3:使用线性回归预测房价

模块六:关联分析

20 Apriori与FP-Growth:不得不再说一遍啤酒与尿布的故事

21 实践4:用关联分析找到景点与玩法的关系

模块七:自然语言处理

22 TF-IDF:一种简单、古老,但有用的关键词提取技术

23 word2vec:让文字可以进行逻辑运算,女人+王冠=女王

24 实践5:使用fastText进行新闻文本分类

彩蛋 数据挖掘工程师如何进阶

结语 培养数据挖掘思维,终身学习

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。