Python机器学习系列1预处理

Python机器学习系列1预处理

乐学偶得

乐学偶得致力于前沿Fintech(金融科技),Data Science(数据科学),IT(信息科技),企业高级管理必备CFA,FRM,CIA等高端企业管理商务知识,多语种文化艺术信息的分享及咨询。

  • 课程目录
  • 课程介绍
  • 课时1:数据科学介绍

  • 课时2:课程方向介绍

  • 课时3:Kaggle介绍与数据来源

  • 课时4:【若登陆不了Kaggle可电脑登陆课程左下角附件可下载课程中数据】

  • 课时5:从零编写读取数据函数

  • 课时6:调用自己的函数读取数据

  • 课时7:数据缺失先判断再放入

  • 课时8:数据类型强调与转换

  • 课时9:正式介绍特征缩放

  • 课时10:自己写函数找到最大值最小值

  • 课时11:离差标准化代码实现

  • 课时12:标准化的运用介绍

  • 课时13:标准化的定义介绍

  • 课时14:数据平均数函数代码实现

  • 课时15:占位小技巧精简代码

  • 课时16:方差定义介绍与数据处理思路

  • 课时17:方差与标准差的代码实现

  • 课时18:未知变已知剩下的就好办了

  • 课时19:标准化我们的数据

  • 课时20:特征缩放小结

  • 课时21:特征缩放用于Kaggle真实数据

  • 课时22:其他的数据变形方法拓展

  • 课时23:重抽样方法介绍

  • 课时24:train_test_split原理介绍

  • 课时25:自己写一个训练测试函数

  • 课时26:补充生成伪随机数函数

  • 课时27:完成训练测试切分

  • 课时28:通过seed控制伪随机数

  • 课时29:思考我们的方法的问题

  • 课时30:k_fold交叉验证

  • 课时31:另外一个角度思考介绍

  • 课时32:两种split方法优缺点对比

  • 课时33:有偏的模型VS不幸的选取

  • 课时34:偏差vs方差的权衡

  • 课时35:k_fold里面的k取值探讨

  • 课时36:代码解决k_fold问题的思路

  • 课时37:k_fold切分代码实现

  • 课时38:小篮子装满装进大篮子

  • 课时39:重抽样方法思路整理与总结

  • 课时40:准确度和精密度辨析1

  • 课时41:射击比赛的例子

  • 课时42:学习方法:内涵和外延

  • 课时43:准确度计算代码实现

  • 课时44:分类项目测试准确度

  • 课时45:分类问题混淆矩阵介绍

  • 课时46:混淆矩阵特性介绍

  • 课时47:识别统计学家玩的鬼把戏

  • 课时48:混淆矩阵中的细节介绍

  • 课时49:一类错误和二类错误

  • 课时50:大量比率拓展调和平均F1值等

  • 课时51:写代码前分析规律和对策

  • 课时52:用我们学过的的技巧解决

  • 课时53:占位+列表解决第一个特性

  • 课时54:示范如何不要迷失在细节

  • 课时55:字典储存与index

  • 课时56:查字典的方法填充矩阵

  • 课时57:对矩阵结果的解读

  • 课时58:生成可自动调整的混淆矩阵

  • 课时59:反思可能的Bug情况

  • 课时60:思路整理与小结

  • 课时61:平均绝对误差概念介绍

  • 课时62:平均绝对误差公式详解

  • 课时63:平均绝对误差代码实现

  • 课时64:平均绝对误差数据检测

  • 课时65:MAE法的缺陷与改进

  • 课时66:均方根误差公式简介

  • 课时67:RMSE方法代码实现

  • 课时68:RMSE方法数据检测

  • 课时69:比较基准模型介绍

  • 课时70:随机预测算法建立基准模型

  • 课时71:ZeroR方法原理介绍

  • 课时72:ZeroR解决分类问题的基准模型

  • 课时73:回归问题的基准模型思路

  • 课时74:ZeroR解决回归问题代码

课程概述

人工智能浪潮袭来,我们非常容易在强大【别人封装好】的机器学习相关库和分析工具的掩盖下,陷入【只花几小时速成AI工程师】,【只需几天摇身一变数据科学家】的幻觉我们深知:【忽悠式速成】走的【捷径】,最终,会在生命中的某一个时刻【反噬】过来,可能是【35岁】的一次【裁员潮】,可能是一次重要的项目因为【基础问题】而犯下大错,可能是与一次升职的机会【失之交臂】“拿数据,跑数据,调调参”,“炼丹”看结果你能做,别人,也能做归根到底,一个人的核心竞争力还是在于对【原理】与【业务】的【深刻理解】本课程为《Python入门数据科学机器学习算法》系列课程的第一部分:预处理包括:1.数据来源2.数据预处理3.特征缩放与标准化4.训练集与测试集区分与选取5.k-fold交叉验证6.一类与二类错误7.混淆矩阵8.MAE法,RMSE法与ZeroR共计74节课已经更新完毕,欢迎加入~2000+节《从Python零基础到6大方向进阶应用》系列课程限时优惠中,欢迎点击下方继续系统化学习~

相关教程

Learnfk - JavaScript教程

Learnfk - Sed教程

Learnfk - Python数据科学教程

Learnfk - Golang教程

Learnfk - VI/VIM教程

Learnfk - WordPress教程

随机推荐

长城电风扇好不好,要注意哪些质量细节!

先行者国际象棋磁性B-9特大号最新款,评测下来告诉你坑不坑

Yottamaster磁盘阵列柜2.5冰箱评测质量怎么样!优缺点质量分析参...

索厉Suoli热熔胶枪真实测评质量优劣!功能评测结果

OIVO任天堂Switch手柄评测比较哪款好,评测哪一款功能更强大

海尔恒温水壶调奶器多功能婴儿冲泡奶粉热水壶为什么买家这样评价...