程序员的数学基础课 / 在实战中重新理解数学
黄申
LinkedIn资深数据科学家
 
  • 课程目录
  • 课程介绍
  • 开篇词 | 作为程序员,为什么你应该学好数学?

    如果你只想当一个普通的程序员,那么数学对你来说,并不重要。但是如果你想做一个顶级程序员,梦想着改变世界,那么数学对你来说就很重要了。

  • 导读:程序员应该怎么学数学?

    在正式的学习开始之前,我想跟你聊聊,究竟应该怎么学习数学。

  • 01 | 二进制:不了解计算机的源头,你学什么编程

    我们从计算机认知的起源二进制出发,讲讲它在计算机中的“玄机”。

  • 02 | 余数:原来取余操作本身就是个哈希函数

    在编程中,余数有哪些应用,你之前是否有思考过呢?

  • 03 | 迭代法:不用编程语言的自带函数,你会如何计算平方根?

    今天我详细讲解一下“求数值的解”和“查找匹配记录”这两个迭代法的应用。

  • 04 | 数学归纳法:如何用数学归纳提升代码的运行效率?

    我们平时说的归纳,和数学归纳法有什么不一样?

  • 05 | 递归(上):泛化数学归纳,如何将复杂问题简单化?

    递归和循环其实都是迭代法的实现,而且在某些场合下,它们的实现是可以相互转化的。

  • 06 | 递归(下):分而治之,从归并排序到MapReduce

    今天我来讲讲归并排序和分布式系统中的分治思想。

  • 数学专栏课外加餐(一) | 我们为什么需要反码和补码?

    专栏已经更新了6讲,很多同学提出了很多好问题。这篇文章我将对留言里有代表性的问题做个集中的解答。

  • 数学专栏课外加餐(二) | 位操作的三个应用实例

    今天我们主要聊聊位操作的三个应用实例,以及二分查找时的两个细节,并且梳理迭代法、数学归纳法以及递归的一些知识。

  • 07 | 排列:如何让计算机学会“田忌赛马”?

    排列最多的用途就是穷举法,也就是列出所有可能的情况,一个一个验证,然后看每种情况是否符合条件的解。

  • 08 | 组合:如何让计算机安排世界杯的赛程?

    组合在计算机领域有很多应用场景,比如大型比赛中赛程的自动安排、多维度的数据分析以及自然语言处理的优化。

  • 09 | 动态规划(上):如何实现基于编辑距离的查询推荐?

    今天我接着文本搜索的话题,来聊聊查询推荐的实现过程。

  • 10 | 动态规划(下):如何求得状态转移方程并进行编程实现?

    如何得出动态转移方程?如何进行代码实现?

  • 11 | 树的深度优先搜索(上):如何才能高效率地查字典?

    构建和查询前缀树的本质究竟是什么?

  • 12 | 树的深度优先搜索(下):如何才能高效率地查字典?

    深度优先搜索的过程和递归调用在逻辑上是一致的。

  • 13 | 树的广度优先搜索(上):人际关系的六度理论是真的吗?

    如何用队列实现广度优先搜索?

  • 14 | 树的广度优先搜索(下):为什么双向广度优先搜索的效率更高?

    如何高效地求两个用户间的最短路径?

  • 15 | 从树到图:如何让计算机学会看地图?

    Dijkstra算法的实现步骤是什么?有哪些需要注意的点?

  • 16 | 时间和空间复杂度(上):优化性能是否只是“纸上谈兵”?

    这一讲我来说说如何使用数学的思维,来进行系统性的复杂度分析。

  • 17 | 时间和空间复杂度(下):如何使用六个法则进行复杂度分析?

    6个法则中的数学思想并不高深,却可以帮我们有效地分析复杂度。

  • 18 | 总结课:数据结构、编程语句和基础算法体现了哪些数学思想?

    数据结构其实就是一个个解决问题的模型。

  • 数学专栏课外加餐(三):程序员需要读哪些数学书?

    我围绕专栏的三大模块给你推荐几本可以配套学习的书籍。

  • 19 | 概率和统计:编程为什么需要概率和统计?

    我们需要掌握哪些概率统计知识?这些知识可以用在什么地方?第二模块第一节,我们就来聊聊这些问题,让你对这一模块的学习做到心中有数。

  • 20 | 概率基础(上):一篇文章帮你理解随机变量、概率分布和期望值

    今天我们讲概率论中最基本也最重要的概念几个概念,随机现象、随机变量、概率分布和期望值。

  • 21 | 概率基础(下):联合概率、条件概率和贝叶斯法则,这些概率公式究竟能做什么?

    联合概率、条件概率、边缘概率这三者之间的推算关系,直接构成了贝叶斯定理的核心。

  • 22 | 朴素贝叶斯:如何让计算机学会自动分类?

    今天我从一个非常简单的例子出发,介绍如何通过物体的属性及其数值,让计算机理解现实世界中的事物,并通过朴素贝叶斯方法来对其进行分类。

  • 23 | 文本分类:如何区分特定类型的新闻?

    今天我通过文本分类系统的基本框架,来给你讲朴素贝叶斯方法的应用。

  • 24 | 语言模型:如何使用链式法则和马尔科夫假设简化概率模型?

    今天介绍基于概率论的语言模型,以及它在信息检索和中文分词领域中的应用。

  • 25 | 马尔科夫模型:从PageRank到语音识别,背后是什么模型在支撑?

    我们来学习马尔科夫模型、隐马尔科夫模型,以及它们在PageRank和中文分词中的应用。

  • 26 | 信息熵:如何通过几个问题,测出你对应的武侠人物?

    熵的计算是基于集合内各组元素分布的概率来进行的,信息增益是集合划分前后整体熵的差值。

  • 27 | 决策树:信息增益、增益比率和基尼指数的运用

    决策树的优缺点分别是什么?

  • 28 | 熵、信息增益和卡方:如何寻找关键特征?

    无论是使用何种统计度量,我们都可以计算相应的数值、排序、并得到排名靠前的若干特征。

  • 29 | 归一化和标准化:各种特征如何综合才是最合理的?

    为什么有时候需要转换特征值?如何使用归一化进行特征值转换?如何使用标准化进行转换?

  • 30 | 统计意义(上):如何通过显著性检验,判断你的A/B测试结果是不是巧合?

    显著性差异是差异显著性检验区别于简单的平均值方法的关键。

  • 31 | 统计意义(下):如何通过显著性检验,判断你的A/B测试结果是不是巧合?

    方差分析可以帮助我们检测差异的显著性,它分析的内容是受一个或多个因素影响的因变量在不同水平分组的差异。

  • 32 | 概率统计篇答疑和总结:为什么会有欠拟合和过拟合?

    拟合模型其实就是指通过模型的假设和训练样本,推导出具体参数的过程。

  • 33 | 线性代数:线性代数到底都讲了些什么?

    线性代数是解决多个变量相关问题的有力工具。

  • 34 | 向量空间模型:如何让计算机理解现实事物之间的关系?

    向量空间模型充分利用了空间中向量的距离和夹角特性,来描述文档和查询之间的相似程度,或者说相关性。

  • 35 | 文本检索:如何让计算机处理自然语言?

    今天我从文本的信息检索出发,介绍如何使用向量空间模型。

  • 36 | 文本聚类:如何过滤冗余的新闻?

    我们来聊聊如何在聚类算法中使用向量空间模型,并最终实现过滤重复文章。

  • 37 | 矩阵(上):如何使用矩阵操作进行PageRank计算?

    今天我们讲矩阵的点乘操作在PageRank算法中的应用。

  • 38 | 矩阵(下):如何使用矩阵操作进行协同过滤推荐?

    协同过滤分为基于用户的过滤和基于物品的过滤两种,它们的核心思想是相同的,因此矩阵操作也是类似的。

  • 39 | 线性回归(上):如何使用高斯消元求解线性方程组?

    今天我们一起探讨求解线性方程组最常见的方法,高斯消元法。这个方法主要包含消元和回代两个步骤。

  • 40 | 线性回归(中):如何使用最小二乘法进行直线拟合?

    最小二乘法通过向量空间的欧氏距离之平方,定义了预测值和真实值之间的误差。

  • 41 | 线性回归(下):如何使用最小二乘法进行效果验证?

    上一节我们讲了最小二乘法的核心思想和具体推导过程,今天我们就用实际的数据操练一下。

  • 42 | PCA主成分分析(上):如何利用协方差矩阵来降维?

    PCA主成分分析的主要步骤有:标准化原始数据、获得不同特征的协方差矩阵、计算协方差矩阵的特征值和特征向量、选择最重要的主成分以及通过主成分来转换原始数据集。

  • 43 | PCA主成分分析(下):为什么要计算协方差矩阵的特征值和特征向量?

    如果你弄清楚了求解协方差矩阵的特征值和特征向量,那么PCA方法也就不难理解了。

  • 44 | 奇异值分解:如何挖掘潜在的语义关系?

    SVD可以对原始的数据矩阵进行分解,并运用最终的奇异向量进行降维。

  • 45 | 线性代数篇答疑和总结:矩阵乘法的几何意义是什么?

    今天我重点说说矩阵乘法的几何意义,为什么SVD中X'X的特征向量组成了V矩阵,XX'的特征向量组成了U矩阵。

  • 46 | 缓存系统:如何通过哈希表和队列实现高效访问?

    今天开始,我会综合性地运用之前所讲解的一些知识,设计并实现一些更有实用性的核心模块或者是原型系统。

  • 47 | 搜索引擎(上):如何通过倒排索引和向量空间模型,打造一个简单的搜索引擎?

    搜索引擎中的倒排索引,也是基于哈希表结构来设计的。这种倒排索引可以大大提升数据对象的检索效率。

  • 48 | 搜索引擎(下):如何通过查询的分类,让电商平台的搜索结果更相关?

    今天我结合自己曾经碰到的一个真实案例,为你讲解如何利用分类技术,改善搜索引擎返回结果的相关性。

  • 49 | 推荐系统(上):如何实现基于相似度的协同过滤?

    今天我通过一个常用的实验数据,设计并实现最简单的基于用户的协同过滤。

  • 50 | 推荐系统(下):如何通过SVD分析用户和物品的矩阵?

    推荐系统是个很大的课题,我们这次尝试不同的想法。

  • 51 | 综合应用篇答疑和总结:如何进行个性化用户画像的设计?

    今天我来回答一下综合应用模块的问题,并对这一模块做个总结。

  • 结束语 | 从数学到编程,本身就是一个很长的链条

    专栏到今天就结束了,但是学习应该是持续进行的。

限时拼团 ¥79,立省 ¥20,点击「拼团按钮」,立即加入。

数学基础的好坏,会直接决定一个程序员的发展潜力。

往大了说,数学是一种思维模式,考验的是一个人归纳、总结和抽象的能力。把这个能力放到程序员的世界里,其实就是解决问题的能力

往小了说,不管是数据结构与算法,还是程序设计,很多底层原理和编程技巧都源自数学,比如你熟悉的分页功能,用的其实是余数的思想。所以很多大公司招人时,会优先考虑数学专业的毕业生。数学基础好,学编程也更容易上手。

如果说编程语言是血肉,那数学的思想和知识就是灵魂。它可以帮你选择合适的数据结构和算法、提升系统效率,并且赋予机器智慧。尤其在大数据和智能化的时代,更是如此。

因此,学数学绝不是死背那些艰深晦涩的定理和公式,洞悉技术本质,掌握知识规律,具备数学思维,拥有发现问题、分析问题、解决问题的能力,才是你的终极目标。

那程序员究竟该如何学习数学呢?在这个专栏里,黄申从编程的视角,结合自己十多年学术经验和工业实践,总结了一套适合程序员的数学学习方法和知识体系。希望通过“知识-应用-知识”的讲解路线,为你贡献一堂实用精彩的数学课。

黄申,LinkedIn资深数据科学家,博士毕业于上海交通大学计算机科学与工程专业,师从俞勇教授。微软学者,IBM ExtremeBlue天才计划成员。长期专注于大数据相关的搜索、推荐、自然语言处理、广告以及用户精准化领域。

曾在微软亚洲研究院、IBM美国研究院、eBay中国、1号店和大润发飞牛网担任要职,带队完成了若干公司级的战略项目。同时担任《计算机工程》特邀审稿专家,著有20多篇国际论文并拥有10多项国际专利。

专栏模块

专栏用51节,四大模块,精讲那些程序员真正用得上的数学知识。

  • 基础思想篇

梳理了编程中最常用的数学概念和思想,比如余数、迭代、排列、组合,由浅入深精讲数据结构与数学是如何你中有我,我中有你。帮你彻底掌握这些最基础、最核心的数学知识,同时也能让你明白,数学对编程和算法究竟意味着什么。

  • 概率统计篇

以概率统计中最核心的贝叶斯公式为圆心,向上讲解随机变量、概率分布这些基础概念,向下讲解朴素贝叶斯,并分析它们在生活和编程中的实际应用,在应用中反哺概念。让你真正理解概率统计的本质,跨过概念和应用之间的鸿沟。

  • 线性代数篇

从线性代数中最核心的概念向量、矩阵、线性方程入手,逐步深入分析,这些概念是如何与计算机互帮互助,融会贯通,解决实际问题的。比如,线性代数究竟是在讲什么?怎样让计算机理解现实世界?如何过滤冗余的新闻?从概念到应用,再到本质,让你不再害怕新技术中的“旧知识”。

  • 综合实战篇

将通过缓存系统、搜索引擎、推荐系统中的实际应用,串讲前面讲到的数学知识和概念,帮你加深对知识的理解,学会用数学思维来分析问题和解决问题,让数学思维成为你的一种基础能力。

你觉得怎么样?期待您评价: