赵成的运维体系管理课 / 带你直击运维的本质
赵成
美丽联合集团技术服务经理
 
  • 课程目录
  • 课程介绍
  • 开篇词 | 带给你不一样的运维思考

    运维思路上的转变,远比单纯提升运维技术更有价值,而运维真正的价值应该跟研发团队保持一致,真正聚焦到效率、稳定和成本上来。

  • 01 | 为什么Netflix没有运维岗位?

    在运维这个细分领域,Netflix是最佳实践的典范。就让我们一起看看世界顶级的互联网公司是如何定义运维以及如何开展运维工作的。

  • 02 | 微服务架构时代,运维体系建设为什么要以“应用”为核心?

    在微服务的架构模式下,我们的运维视角一定转到应用这个核心概念上来,一切要从应用的角度来分析和看待问题。

  • 03 | 标准化体系建设(上):如何建立应用标准化体系和模型?

    标准化这项工作是运维过程中最基础、最重要的,但也是最容易被忽视的一个环节,所以我们一定要把标准化这个工作做扎实。

  • 04 | 标准化体系建设(下):如何建立基础架构标准化及服务化体系?

    基础架构标准化至关重要,我们在建立标准化的过程中往往存在很普遍的问题,而这一部分又影响着后续一系列效率和稳定性平台的建设方案。

  • 05 | 如何从生命周期的视角看待应用运维体系建设?

    对应用的生命周期阶段进行分解,大致分为四个部分,应用的创建阶段、上线阶段、运行阶段和销毁阶段。

  • 06 | 我是如何走上运维岗位的?

    我做运维是在加入华为1年后开始的,当时华为内部就已经有非常完善和先进的运维体系和运作机制了。

  • 07 | 聊聊CMDB的前世今生

    今天我主要来聊一聊CMDB的前世今生,帮助你更加深刻地理解这个运维的核心部件,对我们后面开展CMDB的建设大有裨益。

  • 08 | 有了CMDB,为什么还需要应用配置管理?

    CMDB是面向资源的管理,应用配置是面向应用的管理。

  • 09 | 如何在CMDB中落地应用的概念?

    应用是整个微服务架构体系下运维的核心,而CMDB又是整个运维平台的基石。今天我就讲讲在CMDB中如何落地应用这个核心概念,以及如何建立应用集群分组的思路。

  • 10 | 如何打造运维组织架构?

    要想做好运维就一定要跳出运维这个框框,从全局的角度来看运维,要考虑如何打造和体现出整个技术架构的运维能力,而不是运维的运维能力。

  • 11 | 谷歌SRE运维模式解读

    从借鉴意义上来讲,谷歌SRE可以给我们提供很好的学习思路和样板。

  • 12 | 从谷歌CRE谈起,运维如何培养服务意识?

    谷歌CRE这个角色,既具备良好的专业技术能力,又有非常强的问题解决能力,同时还要具有优秀的客户沟通和关怀能力。对我们有哪些启发呢?

  • 13 | 云计算和AI时代,运维应该如何做好转型?

    新时代下,机遇和挑战并存,我们确实面临着岗位和技能的转型。

  • 14 | 运维需要懂产品和运营吗?

    我们说运维要有产品和运营意识,总结起来最本质的就两点:第一,能将需求讲清楚;第二,能将产品推广落地。

  • 15 | 冷静下来想想,员工离职这事真能“防得住”吗?

    今天我们聊聊个人成长的话题,当你从技术岗位转换到管理岗后,应该如何适应新的角色,做好技术管理。

  • 16 | 持续交付知易行难,想做成这事你要理解这几个关键点

    做持续交付就是提升整个研发体系效率的关键,今天我们来讨论做持续交付的几个关键点。

  • 17 | 持续交付的第一关键点:配置管理

    今天我们来看持续交付的第一个关键点:配置管理。配置管理是基础,是关键,我们一起来看版本控制、依赖配置、软件配置和环境配置这几个部分的内容。

  • 18 | 如何做好持续交付中的多环境配置管理?

    持续交付过程中的环境配置管理这个问题是比较复杂的,今天我就结合自己的经验和你聊一聊环境管理的解决方案。

  • 19 | 开发和测试争抢环境?是时候进行多环境建设了

    单单一个线下环境就要如此复杂和繁琐,整个持续交付体系建设是多么的有挑战性,就可想而知了。

  • 20 | 线上环境建设,要扛得住真刀真枪的考验

    环境建设是一项异常繁琐复杂的工作,这些工作不是一蹴而就,而是根据实际的场景和问题催生出来的,所以是个逐步渐进的过程。

  • 21 | 人多力量大vs.两个披萨原则,聊聊持续交付中的流水线模式

    从一个应用的代码提交开始,到发布线上的主要环节,整个流程串起来就是一个简化的流水线模式。

  • 22 | 持续交付流水线软件构建难吗?有哪些关键问题?

    一个完整的软件构建过程给我们带来的启示是:如果充分完善前期的准备工作,那么在做后期的方案时就会顺畅很多。

  • 23 | 持续交付中流水线构建完成后就大功告成了吗?别忘了质量保障

    如果我们将注意力集中到具体的动作和问题上,会更有利于我们理解,而不是从一开始就被概念性的术语和框架束缚住。

  • 24 | 做持续交付概念重要还是场景重要?看“笨办法”如何找到最佳方案

    我们所采取的手段,其实都是些笨办法:即找到问题,分析问题,调研解决方案,讨论碰撞,然后慢慢摸索和实践,找出最合适我们的方式。

  • 25 | 为什么蘑菇街会选择上云?是被动选择还是主动出击?

    以未来3-5年,甚至更长远的视角考量,建设成本、维护管理、技术投入等这些问题必将成为我们将来业务发展的障碍,因此上云就成了我们的不二选择。

  • 26 | 为什么混合云是未来云计算的主流形态?

    有时跳出纯技术思维模式,尝试通过外部合作和沟通的模式,一样可以有很好的解决方案,甚至可以解决在技术层面解决不了的问题。

  • 27 | Spring Cloud:面向应用层的云架构解决方案

    我们应该从效率、成本、稳定性这几个方面来检验架构是否合理,并为架构朝着更加健康的方向发展保驾护航。这也是运维职能转型和思路转变的一个重要方向。

  • 28 | 以绝对优势立足:从CDN和云存储来聊聊云生态的崛起

    利用云计算的优势,拥抱变化,才能够为我们的业务发展和创新带来更多的可能性。

  • 29 | 量体裁衣方得最优解:聊聊页面静态化架构和二级CDN建设

    只有挖掘出对业务有价值的东西,我们的技术才会有创新,才会有生命力。

  • 30 | 云计算时代,我们所说的弹性伸缩,弹的到底是什么?

    我们经常听到的一些高大上的词汇,比如弹性伸缩、水平扩展和自动化扩缩容等等,这些技术手段的主体是谁?它们之间又有什么关系呢?

  • 31 | 极端业务场景下,我们应该如何做好稳定性保障?

    今天我会结合特定的场景,着重从运维和技术运营的角度来分享,在极端业务场景下,我们应该如何做好稳定性保障?

  • 32 | 稳定性实践:容量规划之业务场景分析

    今天,我们从电商大促这个业务场景入手,一起来分析稳定性保障工作中的容量规划。

  • 33 | 稳定性实践:容量规划之压测系统建设

    今天,我们就来看压力测试的技术实现方式:压力测试系统的建设。我们详细讲讲压力测试的几个维度。

  • 34 | 稳定性实践:限流降级

    今天我们来介绍限流降级的解决方案,从梳理概念入手,并重点讨论技术解决方案所面临的难点。

  • 35 | 稳定性实践:开关和预案

    今天我们从业务降级的维度分享“开关和预案”,着重概念理解和技术解决方案。

  • 36 | 稳定性实践:全链路跟踪系统,技术运营能力的体现

    今天我们来分享全链路跟踪系统建设方面的内容,重点讨论全链路跟踪系统在技术运营层面的应用。

  • 37 | 故障管理:谈谈我对故障的理解

    对于任何一个技术团队来说,最令人痛苦的事情无疑就是故障。我们该如何管理故障呢?今天就从对故障的理解说起。

  • 38 | 故障管理:故障定级和定责

    故障定级和定责管理不好,就很容易出推诿扯皮的情况,今天就和你分享蘑菇街在故障定级和定责方面的经验。

  • 39 | 故障管理:鼓励做事,而不是处罚错误

    我们应该如何对待定责和处罚呢?当故障发生后,一定要严肃对待,要对关键责任人定责,但是定责的目的不是处罚,一旦以处罚为导向,就会导致非常严重的负面效应。

  • 40 | 故障管理:故障应急和故障复盘

    当故障真实发生后,我们该怎么办?今天就和你分享我们在故障通报和故障复盘方面的实践经验。

  • 41 | 唇亡齿寒,运维与安全

    今天我们来分享运维安全的内容,简要介绍一下我们的安全体系,以及每个系统与运维系统之间的关系。

  • 42 | 树立个人品牌意识:从背景调查谈谈职业口碑的重要性

    俗话说“千里之堤溃于蚁穴”,往往一不留神,因为一件负面的事情或行为,就会使你个人职场口碑和个人品牌瞬间坍塌。

  • 划重点:赵成的运维体系管理课精华(一)

    今天我们来梳理“应用运维体系”这个模块。

  • 划重点:赵成的运维体系管理课精华(二)

    今天我们来梳理第二模块“效率和稳定性最佳实践”。

  • 划重点:赵成的运维体系管理课精华(三)

    今天我们来梳理“云计算时代的运维实践”和“个人成长”这两部分内容。

  • 结束语 | 学习的过程,多些耐心和脚踏实地

    学习的过程可以多一些耐心,多一些脚踏实地。愿你已拥有不一样的运维思考。

  • 新书 |《进化:运维技术变革与实践探索》

    经过近5个月的打磨,《进化:运维技术变革与实践探索》这本书终于和你见面了。

专栏简介

“赵成的运维体系管理课”是由美丽联合集团(旗下拥有蘑菇街和美丽说两大主力产品)技术服务经理赵成贡献并维护的专栏内容。

赵成,是公众号“Forrest随想录”的作者,多届ArchSummit运维专题明星讲师和优秀出品人,TGO杭州分会会员。目前专注于云计算和人工智能时代的运维转型和提升。

加入蘑菇街之前,赵成在华为工作了七年,经历过开发、测试、运维以及一线客户服务等诸多岗位。他在不断的历练中迅速成长,培养了全面思考的意识和能力,积累了丰富的电信级和互联网业务研发及运维经验。

赵成说他踏上运维之路有很大的偶然性,第一,不忍心看着自己跟团队开发出来的系统到了线上总是出问题,所以每当有问题时,他总是第一个冲在前面解决问题,久而久之,便积累了丰富的经验,也成为团队中比较重要的角色;第二,也是更重要的一个因素,他说自己非常享受那种攻克难题之后的成就感。

他所遇到过的挑战,他的尝试、实践经验和感悟体会,他十年来对运维产生的不一样的思考,都将在这个专栏里和你分享。

专栏模块

专栏共42期,围绕以应用为核心的运维体系,分四个模块介绍。

  • 应用运维体系建设。这一模块是运维工作的基础,将从标准化和应用生命周期开始,介绍如何一步步建立运维技术体系和组织架构,如何树立正确的运维建设思路。
  • 效率和稳定性最佳实践。这一模块是运维价值的体现,将围绕持续交付和稳定性建设两个方面,分享如何打造不需要任何运维参与的端到端交付过程,以及如何在实践中锤炼出稳定性保障体系等内容。
  • 云计算时代的运维实践。这一模块是新时代运维升级转型的必备要求,将分享在混合云、云存储、静态化以及CDN上的实践经验,以及这些实践所带来的巨大收益。
  • 个人成长。这一模块将会是作者的一些深度思考,包括运维技术发展趋势、个人成长、热点概念解读、热门事件剖析、观点碰撞等。

专栏详细目录如下:

适宜人群

希望转变运维思路、提升运维能力的公司或团队运维工程师;希望了解运维最佳实践、探寻运维架构的运维团队负责人;希望获得全局思考意识的一线技术经理、技术总监以及架构师;面临岗位转型,希望快速认知运维体系、解决问题的开发工程师;关注开发效率、希望修炼全面视角、培养运维能力的所有开发人员。

你觉得怎么样?期待您评价: