机器学习40讲 / 帮你打通机器学习的任督二脉
王天一
工学博士,副教授
 
  • 课程目录
  • 课程介绍
  • 开篇词 | 打通修炼机器学习的任督二脉

    新一季的专栏主题是机器学习,我会帮助你把握不同模型之间的内在关联,让你形成观察机器学习的宏观视角,找准进一步理解与创新的方向。

  • 01 | 频率视角下的机器学习

    频率主义解决统计问题的基本思路如下:参数是确定的,数据是随机的,利用随机的数据推断确定的参数,得到的结果也是随机的。

  • 02 | 贝叶斯视角下的机器学习

    今天我们就转换视角,来看一看贝叶斯学派在解决概率、统计和机器学习这些问题上有哪些思路。

  • 03 | 学什么与怎么学

    什么样的问题才能通过机器学习来解决呢?机器学习的任务又是什么呢?

  • 04 | 计算学习理论

    机器学习中,对一个给定的问题到底能够学到什么程度,还需要专门的计算学习理论来解释。

  • 05 | 模型的分类方式

    机器学习模型都有哪些分类呢?

  • 06 | 模型的设计准则

    机器学习的模型设计颇有门道,我们从“无免费午餐定理”和“奥卡姆剃刀原则”这两个基本的规律讲起。

  • 07 | 模型的验证方法

    今天我来和你分享模型验证的实现思路和具体方法。

  • 08 | 模型的评估指标

    如何对机器学习模型不同的性能进行度量呢?今天我们就来看看机器学习中模型的评估指标。

  • 09 | 实验设计

    今天我们就来谈谈机器学习中关于实验设计与分析的一些原则性问题。

  • 10 | 特征预处理

    多明戈斯认为特征工程才是机器学习的关键。那在特征工程之前,数据的特征需要经过哪些必要的预处理?

  • 11 | 基础线性回归:一元与多元

    从今天开始,专栏将进入统计机器学习模块。虽然统计机器学习中千姿百态的模型让人眼花缭乱,但究其本原,它们都来源于最原始的线性回归。

  • 12 | 正则化处理:收缩方法与边际化

    正则化称得上是机器学习里的刮骨疗毒,刮的是过拟合这个任何机器学习方法都无法摆脱的附骨之疽。

  • 13 | 线性降维:主成分的使用

    如何从岭回归推导到主成分回归?主成分分析都有哪些作用?今天我们一起来讨论这两个问题。

  • 14 | 非线性降维:流形学习

    在机器学习中,流形学习通常被视为非线性降维方法的代表。今天就和你分享几种典型的流形学习方法。

  • 15 | 从回归到分类:联系函数与降维

    联系函数是线性模型从回归到分类的桥梁,今天我就和你聊一聊如何使用线性模型来解决分类问题。

  • 16 | 建模非正态分布:广义线性模型

    今天我来和你分享广义线性模型的概念与原理,它克服了狭义线性模型的一些限制,拓展了线性模型的应用范围。

  • 17 | 几何角度看分类:支持向量机

    今天我们来讨论支持向量机的概念与原理,着重从几何意义上解释算法的来龙去脉。

  • 18 | 从全局到局部:核技巧

    今天我来和你分享支持向量机“三宝”中的对偶和核技巧,重点理解它们的概念与原理。

  • 19 | 非参数化的局部模型:K近邻

    在基于实例的学习方法中,最典型的代表就是K近邻,今天我们就来聊聊这个算法。

  • 20 | 基于距离的学习:聚类与度量学习

    聚类分析实际上是一种分组方式,距离在聚类中发挥着重要作用。今天我就以k均值算法为例,和你聊聊基于距离的学习方法。

  • 21 | 基函数扩展:属性的非线性化

    要获得更强的表达能力,必须要把非线性的元素纳入到机器学习模型之中。今天我们就聊聊通过基函数扩展实现非线性模型的方法。

  • 22 | 自适应的基函数:神经网络

    今天我们来讨论神经网络的基本原理,我们从感知器聊起。

  • 23 | 层次化的神经网络:深度学习

    今天我来和你分享深度神经网络一些主要的设计思想,以及看待深度神经网络的不同角度。

  • 24 | 深度编解码:表示学习

    今天我来和你分享由深度网络衍生出来的编解码结构,以及相关的表示学习概念。

  • 25 | 基于特征的区域划分:树模型

    广义来看,决策树可以视为对基本线性模型的层次化集成。今天我们就从线性回归模型出发,来聊一聊树模型。

  • 26 | 集成化处理:Boosting与Bagging

    集成学习的作用就是将这多个弱学习器提升成一个强学习器。今天我们就来聊聊集成学习的基本原理,以及典型的集成学习方法。

  • 27 | 万能模型:梯度提升与随机森林

    今天我们来聊聊“梯度提升决策树”和“随机森林”这两种万能模型。

  • 总结课 | 机器学习的模型体系

    我们学了那么多模型,这些模型背后的共性规律在哪里?这些规律又将如何指导我们对于新模型的理解呢?

  • 28 | 最简单的概率图:朴素贝叶斯

    从今天起,我们将进入概率图模型的模块,以贝叶斯的角度重新审视机器学习。

  • 29 | 有向图模型:贝叶斯网络

    贝叶斯网络也叫信念网络,今天我们就来聊聊贝叶斯网络的基本原理。

  • 30 | 无向图模型:马尔可夫随机场

    将贝叶斯网络中边的方向去掉,得到的就是马尔可夫随机场。

  • 31 | 建模连续分布:高斯网络

    今天我和你分享的主题是高斯网络,是由高斯型连续随机变量构成的概率图模型。

  • 32 | 从有限到无限:高斯过程

    在概率论和统计学中,高斯过程是由出现在连续域上的无穷多个随机变量所组成的随机过程。今天就和你聊聊高斯过程的基本原理。

  • 33 | 序列化建模:隐马尔可夫模型

    隐马尔可夫模型实现的是序列化的建模,它打破了对数据独立同分布的固有假设,侧重于时序上的依赖关系。

  • 34 | 连续序列化模型:线性动态系统

    线性动态系统也是一种动态贝叶斯网络。今天就和你聊聊线性动态系统和一些滤波算法的基本原理。

  • 35 | 精确推断:变量消除及其拓展

    精确推断最基本的方法是变量消除。今天我们就来聊聊变量消除和它的一些拓展。

  • 36 | 确定近似推断:变分贝叶斯

    近似推断可以分为确定性近似和随机性近似两类,今天我先和你聊聊确定性近似。

  • 37 | 随机近似推断:MCMC

    用样本分布来代替难以求解的后验分布,这就是随机性近似的思想。随机性近似的典型方法是马尔可夫链蒙特卡洛方法,简称MCMC。

  • 38 | 完备数据下的参数学习:有向图与无向图

    从今天开始我们进入概率图模型的最后一个任务,也就是学习问题。

  • 39 | 隐变量下的参数学习:EM方法与混合模型

    在今天这一讲中,我将和你分享一种在隐变量模型的参数学习中发挥重要作用的方法:期望最大化算法。

  • 40 | 结构学习:基于约束与基于评分

    结构学习的任务是根据训练数据集找到结构最恰当的模型。今天我就以贝叶斯网络为例,和你分享概率图模型中的结构学习任务。

  • 总结课 | 贝叶斯学习的模型体系

    在今天这篇总结中,我将对贝叶斯机器学习中涉及的模型做一个系统的梳理。

  • 结课 | 终有一天,你将为今天的付出骄傲

    不知不觉间,又一个40期的机器学习专栏也走到了尾声。

“机器学习40讲”终于和你见面了!

2017年12月,王天一老师在极客时间开设了“人工智能基础课”专栏,带你进入人工智能的大门,介绍了人工智能所需要的基础数学、当前流行的深度学习技术、以及其他可能突破的技术路径等方方面面的内容。

人工智能基础课的第2季聚焦于机器学习。在新技术层出不穷的今日,机器学习依然占据着人工智能的核心地位,也是人工智能中发展最快的分支之一。

那么,怎样入门机器学习?又有哪些学习路径呢?无论机器学习领域充斥着多少花哨的技术,归根结底,都是基本模型与基本方法的结合,而理解这些基本模型和基本方法就是掌握机器学习的要义所在。那么,问题来了,这么多模型到底要怎么学习呢?其实,这里面最关键的,是要梳理出机器学习的主线,把握不同模型之间的内在关联,能够融会贯通、系统地理解机器学习。

在本专栏中,王天一老师会从机器学习中的共性问题讲起,从统计机器学习和概率图模型两个角度,详细解读30个最流行的机器学习模型。除了理论之外,在每个模型的介绍中还会穿插一些基于Python语言的简单实例,帮你加强对于模型的理解。

王天一,毕业于北京邮电大学,获得工学博士学位,在读期间主要研究方向是连续变量量子通信理论与系统,主持并参与了多项国家级/省部级科研项目,以第一作者身份发表了5篇SCI论文。目前在贵州大学大数据与信息工程学院担任副教授。 著有《人工智能革命》一书。

人工智能基础课两季的内容相互联系也各自独立,可以分别订阅。但如果想先学习数学基础,对人工智能各方面的技术有一个宏观把握,建议和第一季一起订阅。

专栏模块

专栏共40期,分为3大模块。

机器学习概观。这一模块将从频率学派与贝叶斯学派这两个视角来看机器学习,并讨论超脱于模型和方法之外的一些共性问题,包括模型的分类方式、设计准则、评估指标等。

统计机器学习模型。这一模块将以线性模型为主线,讨论模型的多种扩展和修正,如正则化、线性降维、核方法、基函数变化、随机森林等,探究从简单线性回归到复杂深度网络的发展历程。

概率图模型。这一模块将以高斯分布为起点,将高斯分布应用到从简单到复杂的图模型中,由此认识不同的模型特性与不同的计算技巧,如朴素贝叶斯、高斯混合模型、马尔科夫随机场等。

专栏详细目录如下:

适宜人群及所需基础

人工智能初学者;想系统学习机器学习,理解机器学习流行模型的研发人员;希望查漏补缺,巩固机器学习基础的从业者;对机器学习有浓厚兴趣的其他相关人员。

学习本专栏希望你能有一些高等数学的基础知识,能看懂简单的Python代码。

你觉得怎么样?期待您评价: