Python机器学习系列1预处理

Python机器学习系列1预处理

乐学偶得 乐学偶得致力于前沿Fintech(金融科技),Data Science(数据科学),IT(信息科技),企业高级管理必备CFA,FRM,CIA等高端企业管理商务知识,多语种文化艺术信息的分享及咨询。
  • 课程目录
  • 课程介绍
  • 课时1:数据科学介绍

  • 课时2:课程方向介绍

  • 课时3:Kaggle介绍与数据来源

  • 课时4:【若登陆不了Kaggle可电脑登陆课程左下角附件可下载课程中数据】

  • 课时5:从零编写读取数据函数

  • 课时6:调用自己的函数读取数据

  • 课时7:数据缺失先判断再放入

  • 课时8:数据类型强调与转换

  • 课时9:正式介绍特征缩放

  • 课时10:自己写函数找到最大值最小值

  • 课时11:离差标准化代码实现

  • 课时12:标准化的运用介绍

  • 课时13:标准化的定义介绍

  • 课时14:数据平均数函数代码实现

  • 课时15:占位小技巧精简代码

  • 课时16:方差定义介绍与数据处理思路

  • 课时17:方差与标准差的代码实现

  • 课时18:未知变已知剩下的就好办了

  • 课时19:标准化我们的数据

  • 课时20:特征缩放小结

  • 课时21:特征缩放用于Kaggle真实数据

  • 课时22:其他的数据变形方法拓展

  • 课时23:重抽样方法介绍

  • 课时24:train_test_split原理介绍

  • 课时25:自己写一个训练测试函数

  • 课时26:补充生成伪随机数函数

  • 课时27:完成训练测试切分

  • 课时28:通过seed控制伪随机数

  • 课时29:思考我们的方法的问题

  • 课时30:k_fold交叉验证

  • 课时31:另外一个角度思考介绍

  • 课时32:两种split方法优缺点对比

  • 课时33:有偏的模型VS不幸的选取

  • 课时34:偏差vs方差的权衡

  • 课时35:k_fold里面的k取值探讨

  • 课时36:代码解决k_fold问题的思路

  • 课时37:k_fold切分代码实现

  • 课时38:小篮子装满装进大篮子

  • 课时39:重抽样方法思路整理与总结

  • 课时40:准确度和精密度辨析1

  • 课时41:射击比赛的例子

  • 课时42:学习方法:内涵和外延

  • 课时43:准确度计算代码实现

  • 课时44:分类项目测试准确度

  • 课时45:分类问题混淆矩阵介绍

  • 课时46:混淆矩阵特性介绍

  • 课时47:识别统计学家玩的鬼把戏

  • 课时48:混淆矩阵中的细节介绍

  • 课时49:一类错误和二类错误

  • 课时50:大量比率拓展调和平均F1值等

  • 课时51:写代码前分析规律和对策

  • 课时52:用我们学过的的技巧解决

  • 课时53:占位+列表解决第一个特性

  • 课时54:示范如何不要迷失在细节

  • 课时55:字典储存与index

  • 课时56:查字典的方法填充矩阵

  • 课时57:对矩阵结果的解读

  • 课时58:生成可自动调整的混淆矩阵

  • 课时59:反思可能的Bug情况

  • 课时60:思路整理与小结

  • 课时61:平均绝对误差概念介绍

  • 课时62:平均绝对误差公式详解

  • 课时63:平均绝对误差代码实现

  • 课时64:平均绝对误差数据检测

  • 课时65:MAE法的缺陷与改进

  • 课时66:均方根误差公式简介

  • 课时67:RMSE方法代码实现

  • 课时68:RMSE方法数据检测

  • 课时69:比较基准模型介绍

  • 课时70:随机预测算法建立基准模型

  • 课时71:ZeroR方法原理介绍

  • 课时72:ZeroR解决分类问题的基准模型

  • 课时73:回归问题的基准模型思路

  • 课时74:ZeroR解决回归问题代码

课程概述

人工智能浪潮袭来,我们非常容易在强大【别人封装好】的机器学习相关库和分析工具的掩盖下,陷入【只花几小时速成AI工程师】,【只需几天摇身一变数据科学家】的幻觉

我们深知:【忽悠式速成】走的【捷径】,最终,会在生命中的某一个时刻【反噬】过来,可能是【35岁】的一次【裁员潮】,可能是一次重要的项目因为【基础问题】而犯下大错,可能是与一次升职的机会【失之交臂】

“拿数据,跑数据,调调参”,“炼丹”看结果
你能做,别人,也能做

归根到底,一个人的核心竞争力还是在于对【原理】与【业务】的【深刻理解】

本课程为《Python入门数据科学机器学习算法》系列课程的第一部分:预处理
包括:
1.数据来源
2.数据预处理
3.特征缩放与标准化
4.训练集与测试集区分与选取
5.k-fold交叉验证
6.一类与二类错误
7.混淆矩阵
8.MAE法,RMSE法与ZeroR

共计74节课已经更新完毕,欢迎加入~

2000+节《从Python零基础到6大方向进阶应用》系列课程限时优惠中,欢迎点击下方继续系统化学习~

随机推荐

马骑顿儿童套装使用怎么样?用户使用感受分享?

可心柔婴童乳霜纸使用舒适度如何?内幕评测透露。

小东北星厨水饺-馄饨好不好,推荐购入吗?买前必知!

小东北星厨水饺-馄饨购买前需要注意什么?亲测解析实际情况?

法丽兹饼干-膨化实用性高,购买推荐吗?不容错过的测评分享!

法丽兹饼干-膨化好用吗?达人专业评测分享?