深入浅出计算机组成原理 / 带你掌握计算机体系全貌
徐文浩
bothub创始人
 
  • 课程目录
  • 课程介绍
  • 开篇词 | 为什么你需要学习计算机组成原理?

    学好计算机组成原理,能够引领你进入底层知识大门,更深入地去学习体系结构、操作系统、编译原理,成为真正的“内家高手”。

  • 01 | 冯·诺依曼体系结构:计算机组成的金字塔

    学习组成原理,其实就是学习控制器、运算器的工作原理,也就是CPU是怎么工作的,以及为何这样设计。

  • 02 | 给你一张知识地图,计算机组成原理应该这么学

    在学习零散的知识点之前,我整理了一份学习地图,好让你对将要学习的内容有一个总纲层面的了解。

  • 03 | 通过你的CPU主频,我们来谈谈“性能”究竟是什么?

    我们常常挂在嘴边的“性能”到底指的是什么呢?能不能给性能下一个明确的定义,然后来进行准确的比较呢?

  • 04 | 穿越功耗墙,我们该从哪些方面提升“性能”?

    除了“摩尔定律”和“并行计算”,我还会讲在整个计算机组成层面,几个原则性的性能提升方法。

  • 05 | 计算机指令:让我们试试用纸带编程

    我们来看一条指令是怎么变成机器码的。

  • 特别加餐 | 我在2019年F8大会的两日见闻录

    上周我在美国参加了F8大会,期间我把见闻记录了下来,今天分享给你。

  • 06 | 指令跳转:原来if...else就是goto

    我们在单条指令的基础上,学习程序里的多条指令,究竟是怎么样一条一条被执行的。

  • 07 | 函数调用:为什么会发生stack overflow?

    这一节我们讲,一个程序的函数间调用,在CPU指令层面是怎么执行的。

  • 08 | ELF和静态链接:为什么程序无法同时在Linux和Windows下运行?

    同样一个程序,不能同时在Linux和Windows下执行,其中一个重要原因是,两个操作系统下可执行文件的格式不一样。

  • 09 | 程序装载:“640K内存”真的不够用么?

    比尔·盖茨说的“640K ought to be enough for anyone”,到底有没有道理呢?

  • 10 | 动态链接:程序内部的“共享单车”

    如何在静态链接和程序装载之后,利用动态链接把我们的内存利用到极致?

  • 11 | 二进制编码:“手持两把锟斤拷,口中疾呼烫烫烫”?

    只要建立起字符集和字符编码,并且得到大家的认同,我们就可以在计算机里面表示任意信息。

  • 12 | 理解电路:从电报机到门电路,我们如何做到“千里传信”?

    我们通过电报机这个设备来看,如何通过“螺旋线圈+开关”,构造基本的门电路。

  • 13 | 加法器:如何像搭乐高一样搭电路(上)?

    这一节我们通过门电路搭建算术计算的过程,体会计算机中的“分层”思想。

  • 14 | 乘法器:如何像搭乐高一样搭电路(下)?

    用更少更简单的电路,还是复杂的电路,来完成复杂的计算,这其实就是计算机体系结构中经典的RISC和CISC历史路线之争。

  • 15 | 浮点数和定点数(上):怎么用有限的Bit表示尽可能多的信息?

    为什么浮点数让我们表示的数据范围一下子大了很多?

  • 16 | 浮点数和定点数(下):深入理解浮点数到底有什么用?

    我们今天讲浮点数的表示、加法计算以及可能会遇到的精度损失问题。

  • 17 | 建立数据通路(上):指令+运算=CPU

    只要搞清楚这些电路的运作原理,你自然也就弄明白了CPU的工作原理。

  • 18 | 建立数据通路(中):指令+运算=CPU

    我们通过反馈电路创建了时钟信号,然后利用这个时钟信号和门电路组合,实现“状态记忆”的功能。

  • 19 | 建立数据通路(下):指令+运算=CPU

    我们凑齐了一个CPU的零件。今天我们就来看一看,怎么把这些零件组合起来,实现指令执行和算术逻辑计算的CPU。

  • 20 | 面向流水线的指令设计(上):一心多用的现代CPU

    我们可以把指令的执行过程,切分成一个一个流水线级,来提升CPU的吞吐率。

  • 21 | 面向流水线的指令设计(下):奔腾4是怎么失败的?

    从Intel和AMD的桌面CPU之战,到移动时代的CPU之战,竞争从Intel和AMD之间,转移到了高通、华为和三星上。

  • 22 | 冒险和预测(一):hazard是“危”也是“机”

    我们可以通过增加资源或者等待的方式,来解决冒险问题。

  • 23 | 冒险和预测(二):流水线里的接力赛

    上一节讲的两种解决方案,“堆资源”和“等排期”,只是避免冲突的无奈之举,所以这一节我们就来讲一种更高级的方案。

  • 24 | 冒险和预测(三):CPU里的“线程池”

    乱序执行是在指令执行的阶段通过一个类似线程池的保留站,让系统自己去动态调度先执行哪些指令,巧妙地解决了流水线阻塞的问题。

  • 25 | 冒险和预测(四):今天下雨了,明天还会下雨么?

    这一讲我们来讲控制冒险及其对应的三种应对方式。

  • 26 | Superscalar和VLIW:如何让CPU的吞吐率超过1?

    我们一起向CPU的性能发起一个新的挑战:让CPU的吞吐率,也就是IPC超过1。

  • 27 | SIMD:如何加速矩阵乘法?

    SIMD技术的出现,使得我们在Pentium时代的个人PC,开始有了多媒体运算的能力。

  • 28 | 异常和中断:程序出错了怎么办?

    当CPU遭遇异常的时候,计算机需要有哪些应对措施?

  • 29 | CISC和RISC:为什么手机芯片都是ARM?

    为什么ARM真正能够战胜Intel,成为手机芯片的霸主?

  • 30 | GPU(上):为什么玩游戏需要使用GPU?

    这一讲我们来了解一个基于多边形建模的三维图形的渲染过程,以此来看看玩游戏为什么需要使用GPU。

  • 31 | GPU(下):为什么深度学习需要使用GPU?

    GPU里面的多核、多ALU,加上多Context,使得它的并行能力极强。

  • 32 | FPGA和ASIC:计算机体系结构的黄金时代

    FPGA本质上是一个可以通过编程,来控制硬件电路的芯片。ASIC是针对特定的使用场景设计出来的芯片。

  • 33 | 解读TPU:设计和拆解一块ASIC芯片

    这一节,我从第一代TPU的设计目标讲起,为你解读了TPU的设计。你可以通过这篇文章,回顾我们过去32讲提到的各种知识点。

  • 34 | 理解虚拟机:你在云上拿到的计算机是什么样的?

    正是虚拟机技术的出现,使得整个云服务生态得以出现。

  • 35 | 存储器层次结构全景:数据存储的大金字塔长什么样?

    今天我们进入存储器的部分,我们先从层次结构说起,让你对各种存储器设备有一个整体的了解。

  • 36 | 局部性原理:数据库性能跟不上,加个缓存就好了?

    如何花最少的钱,装下亚马逊网站上的所有商品?

  • 37 | 高速缓存(上):“4毫秒”究竟值多少钱?

    很多时候,程序的性能瓶颈,来自使用DRAM芯片的内存的访问速度。

  • 38 | 高速缓存(下):你确定你的数据更新了么?

    Java内存模型和CPU、CPU Cache以及主内存的组织结构非常相似。

  • 39 | MESI协议:如何让多核CPU的高速缓存保持一致?

    这一节,我们讲两块儿内容,一个是缓存一致性,另一个是MESI协议。

  • 40 | 理解内存(上):虚拟内存和内存保护是什么?

    内存需要被分成固定大小的页,然后再通过虚拟内存地址到物理内存地址的地址转换,才能到达实际存放数据的物理内存位置。

  • 41 | 理解内存(下):解析TLB和内存保护

    机器指令里面的内存地址都是虚拟内存地址。程序里的每一个进程,都有一个属于自己的虚拟内存地址空间。

  • FAQ第一期 | 学与不学,知识就在那里,不如就先学好了

    专栏进入后半段了,我看看还有多少人在坚持。

  • 42 | 总线:计算机内部的高速公路

    之前很多同学留言问,我什么时候会讲一讲总线。那这一讲,你就要听仔细了。

  • 43 | 输入输出设备:我们并不是只能用灯泡显示“0”和“1”

    实际上,输入输出设备,并不只是一个设备。

  • 44 | 理解IO_WAIT:I/O性能到底是怎么回事儿?

    并不是所有问题都能靠利用内存或者CPU Cache做一层缓存来解决,这一讲我们就来看看硬盘I/O性能那些事儿。

  • 45 | 机械硬盘:Google早期用过的“黑科技”

    我们就从机械硬盘的物理构造开始,从原理到应用剖析一下,看看我们可以怎样用好机械硬盘。

  • 46 | SSD硬盘(上):如何完成性能优化的KPI?

    怎么最大化利用SSD的工作原理,使得访问速度最快,使用寿命最长?

  • 47 | SSD硬盘(下):如何完成性能优化的KPI?

    SSD硬盘的使用寿命受限于块的擦除次数,所以我们需要通过一个磨损均衡的策略,来管理SSD硬盘的各个块的擦除次数。

  • 用户故事 | 赵文海:怕什么真理无穷,进一寸有一寸的欢喜

    今天是一篇用户故事,赵文海同学和大家分享一下他学习专栏的收获和改变。

  • 48 | DMA:为什么Kafka这么快?

    在我们实际的系统开发过程中,利用好DMA的数据传输机制,可以大幅提升I/O的吞吐率。最典型的例子就是Kafka。

  • 49 | 数据完整性(上):硬件坏了怎么办?

    今天,我给你介绍了我亲身经历的,一个硬件错误带来的Bug,以及由这个Bug产生的思考。

  • FAQ第二期 | 世界上第一个编程语言是怎么来的?

    今天是第二期FAQ,我搜集了第3讲到第6讲,大家在留言区问的比较多的问题,来做一次集中解答。

  • 50 | 数据完整性(下):如何还原犯罪现场?

    海明码不仅能够检测到数据中的错误,还能在只有单个位的数据出错的时候,把错误的一位纠正过来。

  • 51 | 分布式计算:如果所有人的大脑都联网会怎样?

    怎么设计整个硬件部署,来保障高可用性?

  • 特别加餐 | 我的一天怎么过?

    在进入实战篇之前,我想先和你分享一个专栏之外的话题,那就是我的一天是怎么样过的。

  • 52 | 设计大型DMP系统(上):MongoDB并不是什么灵丹妙药

    我们今天进入应用篇,先从搭建一个大型的DMP系统开始,利用学过的存储器知识,来做选型判断。

  • 53 | 设计大型DMP系统(下):SSD拯救了所有的DBA

    如果现在让你自己写一个最简单的关系型数据库,你的数据要怎么存放在硬盘上?

  • 54 | 理解Disruptor(上):带你体会CPU高速缓存的风驰电掣

    Disruptor这个框架到底有啥神奇之处?今天我就带你来看一看。

  • 55 | 理解Disruptor(下):不需要换挡和踩刹车的CPU,有多快?

    今天最后一讲,我带着你一起看Disruptor代码的核心设计,也就是它的RingBuffer是怎么做到无锁的。

  • 结束语 | 知也无涯,愿你也享受发现的乐趣

    专栏到今天就结束了,希望能给你带来发现的乐趣,能为你在未来的生活里铺垫上小小的一步。

在计算机专业十余门核心课程中,计算机组成原理是当之无愧的第一课。

无论你想要向上学习计算机的底层知识,比如编译原理、操作系统、体系结构,还是想要向下学习数字电路、数字逻辑等内容,都要先掌握计算机组成原理。这门课不仅能让你对计算机体系有一个总纲的认识,当你选择研究更深入的领域时也大有裨益。

那如何才能学会计算机组成原理呢?作为一名工程师,你应该明白,学习的关键是要搞懂原理、掌握本质、解决问题。而学习计算机组成原理,其实就是理解计算机是怎么运作的以及为什么要这么运作,在此基础上,我们才能又快又准地优化性能,提升效率。

徐文浩,bothub创始人。毕业于上海交通大学计算机系试点班,在Trilogy Software写过大型企业软件;在MediaV担任技术总监,从零开始搭建支撑每天百亿流量的广告算法系统;2015年,加入拼多多,参与重写拼多多的交易系统;2016年底创办bothub.ai,通过自然语言处理技术,为走向海外的中国企业提供英语的智能客服和社交网络营销服务。

在他看来,学习计算机组成原理,就是通过指令、计算、CPU、存储系统和I/O,掌握整个计算机运作过程的核心知识点;通过拆解程序的执行过程,对计算机系统有一个全貌的了解。

因此,在这个专栏里,他将结合自己多年的硬件研究成果和软件开发经验,通过硬件发展历史和软件开发案例,深入浅出地为你讲解计算机组成原理的核心知识和典型应用,继而帮你从源头理解硬件原理和软件架构的共通之处,洞悉性能问题的本质。

专栏分三个模块,共55讲。

入门篇

学习计算机组成原理,最关键的问题就是学什么、怎么学、有什么用。因此这一模块会给你一张知识地图,告诉你学习路径,并提供“从多方面提升性能”这一最终目标的实现思路。

原理篇

这一模块将为你摘出计算机组成的五大部分(控制器、运算器、存储器、输入和输出设备)中,与当下开发最相关的知识和问题,从历史视角讲清楚“是什么”,结合案例讲清楚“怎么做”。带你搞懂计算机组成原理中最核心、最重要的内容。

应用篇

理解了计算机各个组件的运作之后,最后一个模块将手把手带你实操。利用存储器层次结构设计大型DMP系统,并通过Disruptor,跟你一起感受CPU的风驰电掣,让你真正学有所用。

限时福利

你觉得怎么样?期待您评价: