网络排查案例课

网络排查案例课 / 案例+策略+技巧,全面提升网络排查能力

杨胜辉

eBay资深运维专家,流量系统负责人

  • 课程目录
  • 课程介绍
  • 开篇词 | 网络排查是工程师的必备能力

    网络问题的排查过程,其实就像读一本侦探小说一样,充满了神秘感和吸引力。当你掌握了网络排查技术之后,你在遇到问题的那一刻,反而会像猎人遇到猎物一样兴奋,很想一试身手,最终把案件调查彻底,水落石出。

  • 01 | 网络模型和工具:网络为什么要分层?

    咱们是以案例实战为导向的课程,所以我除了会在网络的每一层,给你介绍相关的技术细节以外,还会带你认识相应的排查工具。学完这节课,哪怕你原本是网络方面的小白,你也可以在网络排查方面“一试身手”了。

  • 02 | 抓包分析技术初探:你会用tcpdump和Wireshark吗?

    这节课,我会带你走进抓包分析技术大家庭。你会从中了解到抓包分析技术的光荣历史和渊源,以及通过实际的例子,感受到它的精妙设计和强大能力。

  • 03 | 握手:TCP连接都是用TCP协议沟通的吗?

    应用都靠连接,连接都靠握手。掌握好了握手,你的TCP就算入门了。

  • 04 | 挥手:Nginx日志报connection reset by peer是怎么回事?

    为了搞清楚connection reset by peer时具体发生了什么,我们需要突破应用层这口井,跳出来看到更大的网络世界。

  • 05 | 定位防火墙(一):传输层的对比分析

    无论防火墙有多么神秘,它本质上是一种网络设备。既然是网络设备,那么它必然同样遵循我们知道的技术原理和网络规范。所以,防火墙的踪迹,虽然表面上给人一种虚无缥缈的感觉,但从理论上说,总是有迹可循的。

  • 答疑(一)| 第1~5讲思考题答案

    通过问题来理解概念是一种很好的学习方法,我希望通过这个答疑环节,能帮助你把看过的知识都真的消化掉,成为你自己知识体系的一部分。

  • 06 | 定位防火墙(二):网络层的精确打击

    包乱序是一种相对来说比较普遍的现象,除了防火墙,还有网络设备、主机本身都可能引起乱序。所以,单纯根据包乱序就断定是防火墙在中间捣鬼,就有点以偏概全了。

  • 07 | 保活机制:心跳包异常导致应用重启?

    抓包分析中,面对Wireshark里千奇百怪的报文,有时候也会遇到不知道从何下手的窘况,那么你可以直接查看Expert Information,从那里寻找线索也不失为一个有效的办法。

  • 08 | 分段:MTU引发的血案

    如果你对网络中间环节有权限,又不想改动两端机器的MTU,那么可以选择在中间环节实施“暗箱操作”,也就是用iptables规则改动双方的MSS,从而间接地达到“双方不发送超过MTU的报文”的目的。

  • 09 | 长肥管道:为何文件传输速度这么慢?

    当你把理论和数据这两条“腿”都锻炼健壮后,你一定能在网络排查的世界里,更加坚定有力地前行。

  • 10 | 窗口:TCP Window Full会影响传输效率吗?

    有时候,不少知识点在过段时间重新回看的时候,又会有新的体会和发现。所以这节课里,我也将带你继续挖掘窗口这个细分领域,这样你以后遇到跟窗口相关的问题,就知道如何破解了。

  • 答疑(二)| 第6~10讲思考题答案

    我们做运维工作,有一个重要的原则:优先选择简洁又容易维护的方案,而不是复杂且不易维护的方案,避免给以后的运维工作埋下隐患。

  • 11 | 拥塞:TCP是如何探测到拥塞的?

    TCP传输的起始阶段,速度都是从低到高升上来的,很少有一上来就直接以最终速度运行的情形。其实,这个行为跟TCP拥塞控制有着密切的关系。

  • 12 | 重传的认识:重传到底是怎么回事?

    在我看来,TCP最核心的价值,如果说只有一个的话,那就是对可靠传输的保证。

  • 13 | 重传的再认识:没有任何丢包却也一直重传?

    网络排查过程中要仔细核对各种事实和数据,避免仅根据表面现象轻易下结论。

  • 14 | 安全:用Wireshark把DDoS攻击照出原形

    有明就有暗。不遵照TCP规范,甚至寻找漏洞、发起攻击,这种“小人”乃至“强盗”的行为,也并非少见,比如DDoS攻击。今天我们就来了解下“小人”可能有的各种伎俩,通过Wireshark把这种种攻击行为照个彻底,认个清楚

  • 春节特别放送(一)| 书单推荐

    希望这些好书能够充实你的春节假期,也能在新的一年里给你充充电,帮助你更好地成长。

  • 春节特别放送(二)| 聊聊能力陷阱和终身学习

    只要计算机基础知识掌握得越牢靠,我们就越有希望在技术潮流的动荡中立于不败之地。

  • 春节特别放送(三)| 我的学习资料和工具

    “纸上得来终觉浅”,我们可以在测试环境中,不断把自己学到的知识通过实验进行验证,加深印象。

  • 春节特别放送(四)| 测一测你的网络排查能力

    一套习题,测试你对网络排查知识的掌握程度。

  • 15 | Nginx的499状态码是怎么回事?

    Nginx 499是Nginx自身定义的状态码,并非任何RFC中定义的HTTP状态码。它表示的是“Nginx收到完整的HTTP request前,客户端试图关闭TCP连接”这种反常情况。

  • 答疑(三)| 第11~15讲思考题答案

    为了“压榨”网络性能,让传输的启动阶段尽可能快地达到理想的传输速度,Linux在传输刚开始还没有网络质量信息的时候,直接用了“碰到拥塞再快速恢复”的方式。

  • 16 | 服务器为什么回复HTTP 400?

    网络协议就是这样,是一种“方言”,互相要用对方听得懂的方式对话。如果语法出现了问题,我们的自然语言就是“不明白你的意思,你说啥”。在HTTP这个“方言”里,就是用HTTP 400表达了同样的意思。

  • 17 | 为什么前端页面里多选一个城市就报错?

    今天这节课,我们来探讨下前端方面的报错的排查技巧。跟往常一样,我们还是从案例说起。在这个过程中,你可以跟随我的脚步,通过抓包分析,把问题表象拆解为底层的数据流,然后深入到协议和应用的细节来找到根因。

  • 18 | 偶发性问题如何排查?

    网络排查是一项偏向实践性的工作,只要有效的方法,我们都可以参考采用。

  • 19 | TLS的各种特性:TLS握手为什么会失败?

    掌握HTTPS/TLS的相关知识和排查技巧,对于我们开展网络排查来说,是一项必备的技能。接下来的两节课,我们会集中到HTTPS/TLS这个主题上,来全面学习一下它的工作原理、常见问题和排查思路。

  • 20 | TLS加解密:如何解密HTTPS流量?

    如果排查工作确实需要我们解开密文,查看应用层信息,那我们又该如何做到呢?所以在这节课里,我会带你学习TLS解密的技术要点,以及背后的技术原理,最后进行实战演练,让加密不再神秘。

  • 答疑(四)| 第16~20讲思考题答案

    通过前面课程的学习,结合解密技能和应用层排查技能,相信你对应用层的网络难题的排查也增加了不少把握。接下来,就让我们继续进入答题环节。

  • 21 | 为什么用了负载均衡更加不均衡?

    掌握网络排查技能固然重要,但完全脱离操作系统和架构体系方面的知识,仅根据网络知识去做排查,也有可能会面临知识不够用的窘境。所以,作为一个技术人,我们任何时候都不要限制自己的学习和成长的可能。

  • 22 | 为什么压力测试TPS总是上不去?

    性能问题,是我们日常技术工作中的一个重要话题。在出现性能问题以后,我们要有能力搞定它;而在出现性能问题之前,最好能提前预见到它。而要“预见”性能瓶颈,最好的方法就是做压力测试。

  • 23 | 路径排查:没有网络设备权限要如何做排查?

    一个现实的问题是,我们一般不是专职的网络工程师,也没有相关的网络设备的查看权限,那要如何在这种条件下,尽可能做一些网络层排查的工作呢?这就需要我们对协议有深入的理解,对工具能做到灵活地运用。

  • 24 | 丢包:如何确定丢包的存在及其程度?

    在这一讲里,我们将对“丢包”这个十分典型的问题场景进行一次深入的探讨。这样,下次你遇到丢包等问题的时候,就有很多种“兵器”,也知道在什么场景下使用它们,从而真正突破“丢包”这个难点了。

  • 不定期加餐(一) | 八仙过海,各显神通:透传真实源IP的各种方法

    在实际的工作中,其实并没有一个普适于一切场景的获取真实源IP的方案,而是应该根据不同的需求和基础架构特点,来选取最适合自己的那一个。

  • 用户故事 | 小S:学习是人生路上生生不息的活泉

    有追求的人不会想困在一潭死水中,而是会付诸实际行动去学习、去实践,这才是取得进步的活泉。

  • 用户故事 | 王未:网络排查能力是一名合格运维工程师的必备技能

    作为一个运维工程师,维护系统稳定是天职,而这就需要我们能够在出现问题的时候,迅速解决故障,把损失降低到最小。

  • 25 | 抓包分析的回顾、拾遗,和提高

    如果我们来一次系统性的总结和提高,对我们的学习效果一定是一种更大的促进。所以在这节课里,我们就来对过去的二十多讲进行一次回顾、总结和提高吧。

  • 结束语 | 珍惜握手,难说再见

    我们的连接是长连接,虽然课程的事务结束了,但是长连接继续,期待我们后续的互动。

  • 结课测试 | “网络排查案例课”100分试卷等你来挑战!

    一套习题,测试你对网络排查知识的掌握程度。

【网络排查】交流群

订阅专栏后,戳此加入交流群

你将获得

  • 40+ 真实网络排查案例解析
  • 20 个网络故障疑难点的排查思路
  • Wireshark、tcpdump 工具使用技巧
  • 18 年架构老兵的网络排障心法

讲师介绍

杨胜辉,eBay资深运维专家,流量系统负责人。主要负责eBay全球的流量管理业务,推动Kubernetes在eBay流量管理场景中的落地。

杨胜辉是一名经验丰富的运维专家。在UCloud,他解决过很多网络相关的疑难杂症,是技术服务团队的中流砥柱。在eBay,他作为Team Leader,积极推动新技术的落地,包括Envoy、eBPF等。他对于网络排查这个领域也深感兴趣,在18年工作经验的基础上,不断打磨出了对网络排查这个宏大主题的认知和实践体系,尤其在抓包分析这个领域的能力颇为突出。

杨胜辉乐于分享,擅长把复杂的技术用简单的语言讲清楚。他坚信,在容器化的今天,网络通信已经取代本地通信,成为应用间进行沟通的主要媒介,网络排查是每个工程师都应该掌握的必备技能。

课程介绍

网络排查可以说是每个开发、运维、测试的基本能力,尤其是对服务端工程师来说,一个功能上线后出了问题,能快速定位、排查、解决十分必要,这也是为什么面试时经常会考HTTP、TCP协议相关的内容,你总要弄清楚网络传输的底层逻辑。

当然,程序本身还好排查,主要是因为程序在自己这边,只要花时间总有希望搞定。而网络的难度,一方面是领域不同,很多专门写程序(特别是偏上层的应用)的工程师,对网络很不了解;一方面网络是双方的事,也就是客户端和服务端,还包括中间路径上的设备等,“变量”更多……

尤其是这几年,随着微服务和云计算的普及应用,越来越多的系统从本地的单体服务,变成跨网络的分布式的微服务。随之而来的,就是数不清的跟网络相关的问题。比如:

  • 为什么我的应用在单体应用的时候很正常,拆分成微服务以后却时常超时、报错呢?
  • 为什么我的带宽是足够的,但数据传输速度却很慢?
  • 为什么我的应用偶尔会卡住,但又不是每次都这样?
  • 为什么……

面对这么多问题,我们经常束手无策。当然也有一波优秀的 “SRE”(Server Restart Engineer),遇到问题先上“重启大法”,也许也能搞定不少问题。但是,根因依然是未知,即使问题暂时消失了,不知道什么时候,它又会再次到来,然后再次重启……

可见,我们的工程师,太需要网络排查方面的能力了。

但是,因为大部分同学并不是网络出身,对于跟网络相关的问题,经常无从下手,或者事倍功半。所以这次,我们邀请了eBay的资深运维专家杨胜辉,围绕案例这个核心,展开排查过程,并会聚焦到工具的使用,以及深入到关键技术点的分析上,让你能真正把问题根因搞清楚,把抓包分析技术掌握住。并通过对底层原理和实践经验的理解,达成融会贯通的目的,从而实现真正突破网络排查瓶颈的最终目标。

课程模块设计

课程主要分为五大模块。

  • 预习篇

从网络分层模型出发,来带你了解、学习并掌握整个网络世界的大体层次,以及每层的相关工具。然后带你进入抓包分析这个技术殿堂,了解它的历史和现在,以及初步的使用方法。通过对分层模型和每层工具的理解,以及对抓包分析技术的认识,你就能打下网络排查的底层基础,为后续的学习铺平道路。

  • 实战一:TCP真实案例揭秘篇

接下来,我们就要进入真正的实战了。这个部分会从各种跟TCP相关的实际案例出发,来带你了解、学习并掌握TCP这个精密仪器的核心技术,包括传输性能的关键点、TCP重传的原因和对策、拥塞的优化策略、TCP保活机制等。通过一个个真实的案例,帮助你达成对这些核心知识点的真正理解,最后能够融会贯通,再也不怵TCP相关的难题。

  • 实战二:应用层真实案例揭秘篇

在理解了TCP这部重要篇章之后,网络排查的核心知识,你就掌握了快一半了。不过,还有另外一个同等重量级的篇章等待你去学习,它就是应用层网络排查。所以,这个模块会从一个个典型的应用层网络排查案例出发,来带你了解、学习并掌握如何排查应用层的网络问题,让你通过对抓包分析这个核心技术在应用层的运用,搭建起应用和网络之间的“桥梁”。学完这个部分后,你在应对应用层的网络问题时就会成竹在胸了。

  • 实战三:不用抓包就能做的网络排查篇

掌握抓包分析相当于掌握了网络排查的主干,但还需要补充枝叶,这样你的网络排查技能树才足够完整。所以在这个模块里,依然是从实际案例出发,来带你了解、学习并掌握抓包分析之外的其他网络排查方法,包括工具的背后原理、使用场景、个人总结,让你能够通过对原理和实践经验的理解,达成融会贯通的目的。

  • 总结篇

最后,会带你整体沉淀升华一下,一起把前面学习过的网络知识、抓包分析技术、所有其他的网络工具的技巧复习一遍,把它们打碎后,再次拼接在一起,形成你自己的技术体系。这样,你不仅可以学习到老师的经验,还能够转化为你自己的理解,从而实现你真正突破网络排查瓶颈的这个最终的目标。

课程目录

特别放送

免费领取福利

限时活动推荐

订阅须知

相关教程

Learnfk - iOS教程

Learnfk - Derby教程

Learnfk - React Native教程

Learnfk - Sed教程

Learnfk - JSoup教程

Learnfk - Node.js教程

随机推荐

格兰仕电烤箱家用40L大容量上下独立控温哪个性价比高、质量更好,...

美的空气炸锅无油大容量家用智能电炸锅煎炸锅6.5L大容量使用情况...

奥科美2.5英寸移动硬盘盒子外置壳最真实的图文评测分享!哪款性价...

保宁婴幼儿口腔清洁剂苹果味70g儿童水果味牙膏适合0-4岁告诉你哪...

木丁丁双轮静音健腹轮图文爆料分析,性能评测

三木SUNWOOD21×12mm通用单排标价纸一定要了解的评测情况,评测值...