《从0开始学架构》笔记

2018/05/06 1 分钟阅读

简介

内容来自李运华在极客时间《从0开始学架构》的分享

优秀的人总是会做一件事，对于一个领域，发现一些tip，提炼一个方法论，试错和完善这个方法论。

tips

架构设计的关键思维是判断和取舍，程序设计的关键思维是逻辑和实现。

架构是什么？

首先梳理几个概念：系统与子系统、模块与组件、框架与架构
系统的定义，维基百科：系统泛指由一群有关联的个体组成，根据某种规则运作，能完成个别元件不能单独完成的工作的群体。包含多个有关联的个体，个体按定义好的规则运行。
逻辑角度拆分，划分模块的主要目的是职责分离。物理角度拆分，划分组件的主要目的是单元复用。比如做一个学生信息管理系统，从逻辑角度拆分可以分为登陆注册、个人信息、个人成绩等，从物理角度来拆分，可以分为Nginx、Web服务器、MySQL
框架通常指的是为了实现某个业界标准或完成特定基本任务的软件组件规范，提供规范所要求之基础功能。软件架构：软件系统的顶层结构。

优秀程序猿和架构师之间一个明显的鸿沟是：不确定性。对于程序猿编程来说，程序是确定的（有语法约束等），执行结果是确定的。而对架构设计来说，A和B公司可能架构完全不同，但都运转的挺好。面对不确定性，就要选择，就要取舍。

业界很多领先的方案，都是逼出来的。
演化优于一步到位，经常拿软件架构和建筑架构举例，但建筑架构一旦完成就不再改变，软件却需要根据业务不断地变化。在迭代中保留优秀的设计，修复有缺陷的设计，改正错误的设计，去掉无用的设计

笔者说一个自己的体会，笔者负责一个项目，与一般的业务处理不同，其更偏向于数据处理，笔者经过调研发现，很像apache 的commons-pipeline. 于是尝试用commons-pipeline 来改写项目，但改动起来发现非常的别扭

commons-pipeline 与 spring 整合起来不是很顺。不是很顺的原因是， commons-pipeline的构建是自成一体的（也就是new 出来的）。同时，一般业务也离不开对数据库的、redis等第三方数据源。
笔者对项目的抽象也未能完全摸清，对项目得理解通常也无法一步到位

此时，以重构的方法来慢慢演化项目，向commons-pipeline 上靠，改一点上线一点，逐步验证，无疑更稳重的多。

架构设计的历史背景

如果要深入理解一个事物的本质，最好的方式就是去追寻这个事物出现的历史背景和推动因素
随着软件系统规模的增加，计算相关的算法和数据结构不再构成主要的设计问题，当系统由许多部分组成时，整个系统的组织，也就是所说的“软件架构”，导致了一系列新的设计问题。笔者想起昨天学习的paxos 算法，虽说是算法，但paxos 明显不再关注各个节点如何存储、检索本地存储的通信数据这类事儿，而是提出proposer、acceptor 等角色，规定了它们的交流规则，这才是难点。

不好的架构有什么特点：不容易写，不容易读/懂，不容易改/debug

架构设计的主要目的是为了解决软件系统复杂度带来的问题（复杂度变大带来了第一次和第二次软件危机）。

复杂度来源

高性能
高可用
可扩展性
低成本、安全和规模。
- 低成本通常不是首要目标，往往只有创新才能达到低成本目标。
- 规模变大后，量变可能会引起质变，如大数据就独立成为一门热门技术。

高性能

硬件性能的提升。通常不会带来复杂度的提升，比如存储从纸带,磁带,磁盘,ssd，替换就完事了
软件系统性能的提升，通常会带来复杂度的提升

软件这块

1 单机内部为提高性能带来的复杂度。单进程 ==> 多进程/多进程通信方案 ==> 多进程/多线程/多线程“通信”方案
2 多台计算机为了高性能带来的复杂度

* 任务分配，调度算法、负载均衡、负载监控报警、动态扩容缩容
* 任务分解

从哪几个方面做好性能提升

如何设计高性能计算(CPU)
减少计算成本: 代码优化计算的时间复杂度O(N^2)->O(N)，合理使用同步/异步、限流减少请求次数等；
让更多的核参与计算: 多线程代替单线程、集群代替单机等等；
如何提升系统IO
加快IO速度: 顺序读写代替随机读写、硬件上SSD提升等；
减少IO次数: 索引/分布式计算代替全表扫描、零拷贝减少IO复制次数、DB批量读写、分库分表增加连接数等；
减少IO存储: 数据过期策略、合理使用内存、缓存、DB等中间件，做好消息压缩等；

高可用

书中内容

系统无中断的执行其功能的能力，主要通过冗余来实现高可用（再就是自动故障转移）

计算高可用
存储高可用，存储高可用的难点不在于如何备份儿数据，而在于如何减少或者规避数据不一致对业务造成的影响（因为网络延迟、中断等不可避免）
高可用状态决策整个互联网分层系统架构的高可用，又是通过每一层的冗余+自动故障转移来综合实现的，比如反向代理层 + 服务层 + 缓存层 + db层冗余。

可扩展性

从文章的材料看，文中的可扩展更多指的是设计的可扩展，而不是性能的可扩展，比如加个机器以提高服务能力之类。

面向对象思想的提出
设计模式
两个基本条件：正确预测变化，完美封装变化

如何避免扩展时改动范围太大，是软件架构可扩展性设计的主要思考点。基本思想就是拆。常见的拆分思路（不是非此即彼，通常可组合使用）

	对应的架构	例子	备注
面向流程拆分	分层	controller-service-dao/tcp协议栈	分层不一定都是自顶向下依赖，比如mvc 就是两两依赖
面向服务拆分	soa、微服务
面向功能拆分	微内核

拆分方式决定了系统的扩展方式
某些扩展，改A也行，改B也行，但团队中总有菜鸟程序猿，改A还是改B完全取决于他觉得哪里容易改。面向容易实现/修改编程
分层
- 我们设计一个系统，一般会先分析系统之间有什么组件/对象/成员，然后就是分析对象之间的交互，最快的情况是所有对象之间两两交互。分层使得在系统——成员+成员的交互之间多了一个“层” 这个层次，有助于从所有对象两两交互的最复杂情况削减不必要的依赖。
- 分层，本质在于隔离关注点，层与层之间要有清晰的边界、层与层的依赖是稳定的。
微服务
- 微服务并不轻量级， serviceA 代码调用 serviceB，可比rpc 调用简单多了。
- 一个微服务由3个人负责开发。3个人的技术小组既能够形成有效地讨论，又能够快速达成一致意见。1个人容易有思维盲区，2个人容易各执己见，4个人容易应付事儿。

完美封装变化

系统需要拆分出变化层和稳定层
需要设计变化层和稳定层之间的接口

引申

就架构设计而言，“可扩展” 这一描述并非良好的设计原则，因其无法作为明晰的设计指导，以协助判断架构抽象是否合理。毕竟没有人会称自己的设计不可扩展，即便再多的功能，也能借新增参数、新增逻辑分支来达成。所以我们进一步详细对于良好的可扩展设计的原则，最理想状态的可扩展性设计目标是：每新增一个功能，便新增一个文件包，无需对原有文件进行文件增量操作。

两个基本架构的架构思维（道的层面，术的层面就是整洁架构/clean architechture）PS：将可扩展性、抽象、分层、架构演进、cleanarch 都串在一起了。

分层抽象思维。抽象的过程就是从 “具象” 事物中归纳出共同特征，“抽取” 得到一般化概念的过程，我们工程师每天都需要运用抽象思维，对问题域进行分析、归纳、综合、判断和推理。从而抽象出各种概念，挖掘概念与概念之间的关系，对问题域进行建模，然后通过编程语言来实现业务功能。
1. 抽象思维 ==> 词思维。当感觉某个地方的命名有些别扭时，通常意味着还没有完全理清这个概念，或者在抽象时出现了偏差。抽象是以概念（词语）来反映现实的过程，因为人类的思考和表达概念，都依赖于语言的力量。这也解释了为什么在设计和代码审查中，需要特别注重命名的合理性。因为一个好的名字，不仅反映了我们对概念的理解是否清晰，还揭示了我们的抽象是否恰当。好的命名直接提升了代码的可读性和可理解性，也使设计更为准确。
2. 抽象具有分层性。抽象就是是以概念（词语）来反映现实的过程，而每一个概念都有一定的外延和内涵。一个概念的内涵和外延成反比，即一个概念的内涵越广，外延越窄。例如 “平行四边形” 这个概念，它的外延包含着一切正方形、菱形、矩形以及一般的平行四边形，而它的内涵包含着一切平行四边形所共有的 “有四条边，两组对边互相平行” 这两个本质属性。我们可以看到抽象层次越高，内涵越小，外延越大，泛化能力越强，然而，其代价就是业务语义变弱。比如我们经常会给某个工具函数取名 handleXXX, handleError、handleEvent 等，但是这种抽象的层级太高，限制太少，导致业务的语义变弱。越抽象，越通用，可扩展性越强，然而其语义的表达能力越弱。越具体，越不好延展，然而其语义表达能力很强。所以，对于抽象层次的权衡，是我们系统设计的关键所在。
3. 抽象过程中的一些常见问题
  1. 上下混乱（抽象层级跳跃）在编码过程中，每个函数对应的就是一个抽象概念。所以不同函数也会对应不同的抽象层级，根据抽象一致性原则，我们不可以在上层抽象中包含下层抽象的细节。再结合树状结构中的非叶子节点和叶子节点类比，叶子节点函数代表拆解到最后一层的代码实现，非叶子节点代表的是对叶子节点的编排和组织，不能包含任何实现细节。我们可以得出一个结论：当一个函数抽象包含对下层的调用时，那么这个函数作为非叶子节点只实现编排功能，不能包含任何具体的业务功能实现。
  2. 无具体业务和现实含义的横向抽象。
持续架构思维。成本 - 质量 - 时间三角形是一种被广泛知晓的项目管理辅助工具，它的表现是：你无法同时对三角形的三个角进行优化 —— 你需要在两个角中做出选择，并舍弃第三个。
1. 推迟设计决策。推迟设计决策，直到它们绝对必要时。基于成本 - 质量 - 时间三角形，我们得出结论，我们需要根据事实而非猜测来设计架构，设计并实施可能永远不会使用的功能是没有意义的 – 这是浪费时间资源。除非业务之初就能确认该组件、能力需要在多个跨业务场景下使用，我们最先开发的组件能力都是默认属于业务组件，不需要过分考虑通用性和扩展性。
2. 最小可行架构。当然推迟设计并不代表我们在项目迭代初期就可以放弃设计，让代码肆意生长。我们在满足当前需求的基础上，需要提供良好的分层设计，满足单一职责的原则，让后续的支持更复杂场景的演化设计更轻松。

如何判断技术演进的方向

大多数时候，是业务驱动了技术
判断业务当前和接下来的一段时间的主要复杂度，如何判断？基于业务的发展阶段。 ==> 架构师必须具备理解业务的能力，包括但不限于：业务是什么，当下的最重要问题是什么，可预见的下一阶段的问题是什么。

业务发展阶段主要有两块

复杂性，复杂可能是现状业务就复杂，也可能是业务日渐演变成复杂。
用户规模，用户规模的扩大会带来性能和可用性的挑战

复杂性的发展阶段

初创期，对技术的要求就是，快速实现业务
发展期，对技术的要求就是，快速实现业务的同时，兼顾用户数量的增长
1. 堆功能期
2. 优化期，加缓存、换oracle等
3. 架构期
竞争期，越来越多的系统对技术的要求就是
1. 平台化，解决重复造轮子的问题
2. 服务化，解决系统交互问题，交互逃不过同步（服务治理框架）和异步（消息队列）
成熟期

普适的架构模板

从宏观角度看，无论bat还是创业公司，其技术架构基本是一样的，只是在具体技术的实现上稍有不同（当然也可能完全不同）。

本章节类似于秒杀，推送，广告，推荐，计数-互联网非典型业务系统架构设计介绍各种典型的互联网业务系统，相比来说《从0开始学架构》组织性更强一些。

网络层

负载均衡
- dns，一般用来实现地理级别的负载均衡，这也是为什么dig 域名会返回多个ip。若是做机器级别的负载均衡，则太耗费ip 资源了。
- http-dns
- nginx，同一个地点内机器级别的负载均衡
- cdn
多机房，多机房的主要目标是灾备，当业务故障时，可以快速的将业务切换到另一个机房。
多中心，要求每个中心都可以对外提供服务，且业务能够自动在多中心间切换。

业务层

互联网的业务千差万别，所以业务层没有办法提炼一些公共的系统或组件。抛开业务上的差异，各个互联网业务发展到最终面临的问题都是类似的：业务复杂度越来越高。

系统越来越庞大，业务越来越多 ==> 拆
子系统太多 ==> 将职责关联比较强的子系统合成一个虚拟业务域，然后通过网关统一对外呈现（类似于facade模式、另一种角度看是将网关进一步下沉）。

心法

是架构重构还是系统优化，一个简单的判断方法：假设我们现在需要从0开始设计当前系统，新架构和老架构是否类似？如果差异不大，说明采取系统优化即可；如果差异很大，那可能就要进行系统重构了。
重构的实施，分阶段实施。将要解决的问题根据优先级、重要性、实施难度等划分为不同的阶段，每个阶段聚焦于一个整体的目标，集中资源和精力解决一类问题。
- 每个阶段都有一个明确的目标，做完之后，效果明显，团队信心足，后续推进更加容易
- 每个阶段工作量不会太大，可以和业务并行
- 每个阶段改动不会太大，降低了总体风险
先易后难
- 一开始就做最难的部分，会发现要解决这个最难的问题，得先解决其他容易的问题
- 最难的问题耗时长，占用资源多，影响士气
- 刚开始的分析不一定全面，所以一开始最难的或者最关键的事项的判断可能会出错。如果同时负责多个项目，需要先通过实现简单的内容，对项目有一定的“沉浸时间”

坚持

坚持梦想
坚持学习，时间总可以挤出来的，你对工作必须有所认可，有激情和兴趣。
坚持输出，逼着你把问题想清楚，锻炼表达能力、临场反应能力等

App 架构

组件化、容器化，区别在于发布方式

组件化，独立开发测试，然后跟随app 的某个版本统一上线，静态发布。
容器化，容器可以动态加载组件，组件准备好了直接发布，无需等待某个app 版本才能上线。

如何学习一个开源项目

不要一上来就看源码，而是要基本掌握了功能、原理、关键设计之后再去看源码。看源码的主要目的是学习其代码的写作方式，以及关键技术的实现。
- 具体的数据接收与算法，应有所了解，但无需深入
- 不建议通读源码
- 写demo 故意打断点来查看调用栈
安装一遍很有意义。可以了解系统有哪些组件，依赖哪些库，配置文件有哪些配置（可以说明一些问题）
原理研究
- 关键特性的基本实现原理
- 项目的设计文档、白皮书，了解一个系统有哪些基本点
- 阅读以后的分析文档
- demo 验证

其它材料

优秀架构师必须掌握的架构思维要点如下：

架构的本质是管理复杂性，抽象、分层、分治和演化思维是我们工程师 /架构师应对和管理复杂性的四种最基本武器。
抽象能力的强弱，直接决定我们所能解决问题的复杂性和规模大小。
有经验的程序员写代码会保持抽象层次的一致性，代码读起来像讲故事，比较清晰易于理解；而没有经验的程序员会有明显的抽象层次跳跃问题，比如一个购买流程：更新库存、打折计算、支付校验、支付、送货。那么你在buy 方法里，突然蹦出来某个银行的调用api，这就是抽象层次跳跃。《clean code》中也在强调避免这个问题。函数中混乱的抽象层次会让读者思考代码用途和实现方式时被迫进行思维跳跃。当前抽象层次的代码告诉我们代码在做什么，而下一层次的代码则是关于代码要如何实现的。
对于互联网系统，基本上可以说是三分设计，七分演化。架构师除了要利用自身的架构设计能力，同时也要学会借助用户反馈和进化的力量，推动架构的持续演进，这个就是演化式架构思维。从另一个角度说，微服务架构就是单体架构逐渐演化来的。

脑图

三高特性，都是从存储 + 计算两个方面来谈的。
感觉这也是我学习这个文章最大的价值，认知程序开发的边界。

会随着阅读的深入，继续补充

个人

个人感觉，首先是分层，最上层是用户怎么操作。最底层是你有什么东西。中间是最上层和最底层的适配，可能有多层。每一层都是多个子模块，划分子模块的依据是

业务层面
- 具有明确的领域边界。比如用户管理、订单管理
- 复用。比如红包和打赏都要用到支付系统
技术层面：
- 易变和不易变的分开
- 流量大和流量小的分开
还是实践
1. 纠结一个方案的时候，拿高性能、高可用、可扩展套一套
2. 大理论与小细节的把握。笔者曾碰到一个问题，查询数据耗时。有两种意见，一种认为mysql 针对特定字段加索引，速度不会很慢的；一种是使用pika（redis的持久化实现）存储。从指标上，前者几ms，后者可以做到1ms 以下，在对性能极端要求的场合，适合采用pika方案。这个问题里，如果你对性能指标没有什么认识，则极容易陷入模棱两可中。

实现架构的时候，做好目标管理。先实现主要的，再实现次要的，这句其实不是废话。为什么？因为主要功能很多时候决定了架构设计，而在迭代的过程中，上层架构会做微调，一旦微调，细节相关的代码就有可能会作废。

《从0开始学架构》教程

笔者个人微信订阅号

李乾坤

《从0开始学架构》笔记

简介

tips

架构设计的历史背景

高性能

高可用

书中内容

可扩展性

引申

如何判断技术演进的方向

普适的架构模板

网络层

业务层

心法

App 架构

如何学习一个开源项目

其它材料

脑图

个人

留下评论

猜您还喜欢

群聊

Loop工程

从长期回报、Credit Assignment 到 PPO

Code Agent