简介(未完成)
Kubecost开源OpenCost:Kubernetes成本监控的开源标准
- 经过一段时间的实践,尽管拉着资源使用者聊利用率、巡检各部门空闲机器、甚至定期制作各类排名榜单,我们还是发现降本工作推进缓慢。技术中台与业务部门间难以联动、研发人员缺乏成本意识、无法量化降本产出等核心问题依旧难以解决。
- 在反复研究相关理论后,我们定下了B站基于FinOps视角下降本的实验路径:
- 成本量化打基础,通过账单提升业务对成本的感知。
- 技术降本和运营降本“双驾马车”并行推进。
- 通过事前计划、事中控制、事后分析多项举措,将成本的指标纳入业务方案和商务采购的考量,成本控制贯穿在整个资源生命周期的管理。
- “成本=单价*用量”,可以从折旧(Opex)的角度,客观反映出平台空闲与超卖情况,推动技术中台和业务协同优化,并量化成本收益。
- 技术中台:角色转变为对单价负责,通过提升资源利用率、技术架构升级,减少平台底层资源采买,多供应商的议价能力,降低各类SKU的单价,各优化项目可以明确的转化为成本收益,让技术中台的成本更具竞争力。
- 业务方:通过治理应用实例的数量/存储量、规模、使用时长、共享与独占方式切换,降低SKU的用量。
- 整个流程就是:平台出账=>业务对账=>账单分析=>针对性优化=>优化效果反映到下一出账周期的资源对账,这样一套闭环流程。通过对账,将IT成本及时同步给Finops中各类干系人,强化成本责任制,为IT成本优化决策提供数据支撑。同时反映IT成本优化效果、预算执行情况等指标。
- 服务器成本优化
- 服务器硬件迭代, 英特尔CPU从Skylake => Cascadelake => Icelake =>Sapphire Rapids,每一代在功耗和单核性能上都有提升。硬件的迭代速度是飞速的,每一次的硬件迭代,也刷新了单位算力的成本的下限。既然新的硬件更有成本优势,那么应该尽量引导业务配合硬件升级,每个硬件代次的迭代成本优化效果都是非常显著的。
- 服务器虚拟化和混部
如下图,IT成本除了带宽、服务器、公有云,还有很多其他资源成本,各项成本FinOps都需要分析并推动优化。在分析和推进的过程中,形成了一套完整的成本模型。随着业务不断的发展,成本模型和优化方案也在不断进步。