深入浅出可观测性

深入浅出可观测性 / 理论+实战,为系统可靠性保驾护航

翁一磊 观测云产品技术总监
  • 课程目录
  • 课程介绍
  • 在线阅读:开篇词 | 可观测性,让开发和维护系统的你每晚都能睡个好觉!

    由于各大厂商对云原生的奔赴,传统的技术架构面临着巨大的冲击,监控也被架到了一个不得不革自己命的位置。在这样的背景之下,可观测性(Observability)脱颖而出。

  • 01 | 以史鉴今:监控是如何一步步发展而来的?

    可观测性是怎样发展而来的?让我们从监控的源头讲起。

  • 02 | 基本概念:指标+日志+链路追踪=可观测性?

    这节课我们来具体聊一聊可观测性,以及大家对于可观测性的一些误解。指标+日志+链路追踪就是可观测性吗?

  • 03 | 相互对比:可观测性和传统监控有什么区别?

    这节课我们重点介绍在进行调试或者问题排查的时候,使用可观测性工具和使用传统监控工具有什么不同。通过这种对比,相信你可以更好地理解可观测性和传统监控的区别。

  • 04 | OpenTelemetry:如何利用OpenTelemetry采集可观测数据?

    这节课,我们来看看 OpenTelemetry ,它目前已经是可观测领域非常成熟和热门的标准和规范了。

  • 05 | 构建可观测平台:应该购买商业产品还是自己搭建?

    建立可观测性,是应该自己搭建,还是直接购买商业产品呢?这节课,我们就来聊聊这个问题。

  • 06 | 团队合作:不同团队如何高效共建可观测性?

    这节课,我们会重点讨论可观测与云原生、DevOps 和 SRE 之间的关系,然后聊聊如果想要建立和实施系统的可观测性,开发、测试和运维团队应该从哪些方面着手。

  • 07 | 软件开发:如何利用可观测性进行驱动?

    这节课,我们更近距离看看可观测性驱动的软件开发,看看它如何更加有效地帮助我们分析生产环境问题,保障生产环境的服务可靠性。

  • 08 | 建立 SLO:如何为系统可靠性的量化提供依据?

    这一讲,我们详细介绍一下服务水平目标,也就是 Service Level Objective(SLO)。

  • 09 | 跟踪 SLO:如何基于错误预算采取行动?

    上一讲,我们介绍了 SLO 的概念,以及如何把 SLI 和 SLO 进行关联,最终实现 SLO 的可度量。设定好 SLO 之后,又应该怎么持续跟踪,根据 SLO 的状态来决定下一步的行动计划呢?这是我们这一讲的重点。

  • 10 | 实战 1:从 0 到 1 建立系统应用的可观测性

    这节课,我会基于一个典型的Spring Cloud的应用,给你讲解如何从 0 到 1 来构建端到端的全链路可观测性,如何打通可观测性数据的联合。

  • 11 | 实战 2:基于可观测性数据进行问题分析和根因定位

    这节课,我们来看看在遇到问题的时候,怎么使用可观测性数据进行关联分析,定位到问题原因。

  • 12 | 实战 3:构建基于 Kubernetes 的系统可观测性

    这节课,我们来看看如何构建基于 Kubernetes 的系统和应用的可观测性。

  • 13 | 实战 4:建立软件持续集成和发布的可观测性

    在这一讲中,我会通过 GitLab 持续集成与金丝雀发布这两个具体的例子,来为你具体介绍一下怎么为这些过程建立可观测性。

  • 14 | 文化建设:如何构建可观测性的文化和框架?

    当我们真正开始建立可观测性时,应该如何在组织和企业内进行更好地推广,应该以什么为参照?又应当期待它达到什么效果呢?

  • 15 | 展望未来:可观测性在未来的发展趋势是什么?

    这节课,我们聊聊可观测性的未来。

  • 结束语 | 在实践中,用科学的方法分析和解决问题

    It\'s not stress that kills us, it is our reaction to it.

  • 期末考试 | 来赴一场满分之约吧~

    来赴一场满分之约吧~

18讲

全场 6 折| 程序员节特惠


你将获得

  • 可观测性痛点概念全析
  • 热门规范与平台的深入解读
  • 高效搭建可观测平台的方法论
  • 可观测性文化全貌与技术前瞻

讲师介绍


课程介绍

当下BAT、美团、字节跳动、快手等一线大厂都在加速推进业务的容器化、云原生化。也正是因此,传统的技术架构面临着巨大的冲击,我们的监控对象也由传统的单体结构,变成了分布式的多个微服务。

在这样的背景之下,很多问题成了开发、测试、运维同学的家常便饭:

  • 某个新版本发布上线之后,发现主机的 CPU 使用率持续飙高,但不知道根本原因在哪,只能根据过往的经验一一排查;

  • 新版本上线之后,很难判断功能是不是完全正常,只能等着用户找客服投诉之后,才知道哪个模块出现了报错;

  • 基础设施方面,通过监控搞了一大堆稀奇古怪的仪表盘,看着花花绿绿一大片,可是又不能反映出业务的真实情况,也不能跟随业务的变化而灵活调整。

局面混乱,效率又不高。可以说,监控,被架到了一个不得不革自己命的位置。而可观测性(Observability)就是解决这些问题的关键。

近几年,可观测性的概念逐渐明晰化,相关产品纷纷涌现,可观测性越来越成为云原生一个绕不开的话题。但是可观测性到底是什么?效果又是否真的能达到预期?

为了解答这些困惑,我们请到了观测云的产品技术总监翁一磊老师。他会结合自己在这一领域多年的经验和思考,带你直抵可观测性的内核,合理、高效地部署可观测平台。

课程设计

专栏主要分为四个部分。

概念篇:梳理计算机和互联网的发展,剖析监控在这一过程中的发展历程。详细解读可观测性相关的基本概念,辨析可观测性和传统监控的区别。借助这些内容,你可以了解可观测性以及相关的概念,为接下来的正式学习做好铺垫。

基础篇:介绍目前可观测领域非常成熟和热门的标准和规范:OpenTelemetry。在此基础上,带你了解如何实现和建立非某个供应商锁定的可观测性。辨析购买或自己搭建(例如基于开源软件再进行一些二次开发)可观测性的利弊。让你拥有全局观念,在有需求的时候理智下判断。

实战篇:这部分是专栏的重头戏,毕竟可观测性最重要的目标就是保障系统和应用的服务可靠性。这个模块会讲到团队协作、可观测驱动的开发、建立、跟踪SLO等话题。然后会选取微服务架构的系统,带你搭建起这个系统的可观测性,让你在动手操练的过程中更好地掌握可观测性,并能够通过可观测性来分析和解决问题。

总结与展望篇:为你讲述如何构建可观测性的文化和框架,让你了解在企业中推广可观测性需要优先考虑的关键能力。这一模块还会给你介绍可观测性未来的发展趋势。


课程目录


适合人群

  • 系统可靠性工程师(SRE),或是想要往SRE工程师方向发展的同学;
  • 想要提升自身的软件工程质量和DevOps的开发工程师;
  • 掌握数字化驱动的测试工程师;
  • 关注系统服务质量和可靠性的任何人士。

订阅须知

随机推荐

朗适RS100实际效果怎样?专业达人评测分享!

SANWA SUPPLYMA-ERG9用户体验如何?深度剖析评测结果?

狮王小狮王儿童氟防蛀牙膏 20g评测性价比高吗?达人专业评测?

狮王小狮王儿童氟防蛀牙膏 20g使用体验怎么样?小白买前必看评测...

蒙牛纯甄草莓果粒常温酸奶200g×10评测结果好吗?测评大揭秘分享...

佳沃云南蓝莓14mm 12盒原箱生鲜可靠性如何?详细评测分享?