系统设计

在约束条件下做架构决策，支撑系统持续演进的思维模型。

系统设计的本质

什么是系统设计

系统设计关注的是：

系统要解决什么问题（目标）
系统受到哪些不可违背的限制（约束）
在约束下，如何做结构性选择（决策）
这些选择最终塑造了系统的能力边界

系统设计 = 约束下的架构决策过程

系统设计关注的不是"功能"，而是"能力"

功能回答的是：

系统"能不能做某件事"

系统设计回答的是：

系统"在什么条件下、以什么代价、能做到什么程度"

因此，系统设计的核心关注点是：

性能
扩展性
伸缩性
可用性
安全性
可演进性

这些被统称为：系统的质量属性。

系统设计的六层认知模型

业务目标   ↓约束条件   ↓架构决策   ↓实现机制   ↓系统能力   ↓验证/演进

业务目标（Why）

系统首先服务于业务目标，而不是技术理想。

常见目标包括：

用户规模增长
成本可控
响应时间要求
合规与安全要求

没有业务目标的系统设计，只是在堆复杂度。

约束条件（Constraint）

约束决定了设计空间的边界。

常见约束包括：

流量规模（用户量、QPS、数据量）
延迟要求
成本预算
团队规模与技术能力
法规与安全要求

约束不是负担，而是设计的前提条件。

架构决策（Decision）

系统设计的核心不是"选什么技术"，而是做出结构性决策，结构性决策定义了"系统是什么形态"：

单体 vs 分布式
同步 vs 异步
强一致 vs 最终一致
本地状态 vs 无状态
预扩容 vs 弹性扩容

每一个决策，本质上都是在约束条件下做取舍——用某些能力的损失换取其他能力的获得。

系统能力（Outcome）

设计决策最终沉淀为系统的能力边界：

最大吞吐能力
并发承载能力
故障恢复能力
安全防护能力
架构演进空间

实现机制（Implementation）

设计决策需要落地为具体实现方案。

关键实现要素：

**技术选型**：语言、框架、中间件、数据库等
**数据模型**：领域模型、存储结构、数据流设计
**接口设计**：API协议、通信方式、模块边界
**部署架构**：拓扑结构、容灾策略、伸缩机制

实现层是"决策"转化为"能力"的桥梁，也是最容易引入复杂度的地方。

验证/演进（Verification & Evolution）

系统能力需要通过度量验证，并随业务演进。

验证机制：

**SLA/SLO**：定义可度量的能力指标
**错误预算**：量化能力边界内的容错空间
**监控告警**：持续观测能力衰减

演进机制：

**架构评审**：定期审视能力与业务匹配度
**技术债务**：识别能力演进障碍
**迭代计划**：规划能力演进路径

缺乏验证的架构决策是无法迭代优化的赌博。

系统设计方法论

架构决策的结构化思考框架，而非具体技术方案

核心本质

系统设计方法论回答一个根本问题：如何在动手之前，先想清楚？

它的价值在于：避免凭感觉决策、避免遗漏关键要素、避免在错误的方向上走太远。

三条元原则

合适原则 — 优秀架构是约束条件下的最优解，而非技术选型的最优解。大公司方案在小团队往往是灾难。

何时不适用：当合规要求、技术债临界点或组织惯性强制指定了某种方案时，"合适"需要重新定义。此刻的"不合适"可能源于历史包袱而非理性选择，此时的优先级是识别约束的本质可塑性，而非盲目顺从。

简单原则 — 复杂不会让系统更可靠，只会让它更难维护。简单方案和复杂方案都能满足时，选简单的。

何时不适用：高性能计算、硬实时系统、金融级一致性的场景中，适度复杂性是满足指标的代价。此刻的"简单"可能是性能或正确性的敌人，简单原则让位于能力交付。

演化原则 — 没有一步到位的架构。架构的生命力在于持续迭代，而非一步登天。

何时不适用：当系统核心抽象已经固化、上下游依赖已锁定、改造风险远大于收益时，激进重构是陷阱而非机会。此刻的"演化"应改为局部优化与渐进改良，而非推倒重来。

四步法框架

识别复杂度 → 设计备选方案 → 评估选择 → 详细设计

核心价值：避免在错误的复杂度上投入，以及在错误的方向上走太远。

步骤	目的
识别复杂度	做对的事，而非做多的事
设计备选方案	不把鸡蛋放一个篮子
评估选择	用约束而非感觉决策
详细设计	确保方案能落地

第一步：识别复杂度

做什么：找出真正的能力缺口，而非功能需求。

系统设计的起点不是"要做什么功能"，而是"当前系统缺什么能力"。

类型	本质
高性能	单机瓶颈 vs 水平扩展能力
高可用	故障容忍度与恢复速度
可扩展	需求变化的响应成本

关键：不是每个系统都需要高大全。识别出当前阶段下的1-2个主要矛盾即可。

常见错误：用想象的需求替代实际需求，为"未来可能"提前买单。

第二步：设计备选方案

做什么：设计3-5个有显著差异的方案。

方案之间必须有架构级差异（如主备 vs 集群 vs 分片），而非细节差异（如检测周期1分钟 vs 5分钟）。

关键约束：

不要只设计一个方案
不要设计太多
不要只选熟悉的技术

第三步：评估和选择

做什么：建立评估矩阵，从多维度权衡。

核心维度：性能、可用性、硬件成本、项目投入、复杂度、可扩展性。

选择原则：最简单优先、最合适优先、最熟悉优先。

第四步：详细设计

做什么：将选定的方案落实到关键技术细节。

确定：部署架构、配置参数、接口协议、数据模型。

方法论检查清单

阶段	自检问题
开始前	真正的复杂度是什么？还是在解决假问题？
备选方案	有没有明显差异的多个方案？
评估选择	决策依据是什么？还是凭感觉选？
详细设计	细节是否足以落地？

HLD/LLD 分层设计

HLD 回答"系统由什么构成"，LLD 回答"每个部分怎么实现"。

本质：分层的必要性

系统设计天然分为两个层次：

**HLD（高层设计）**：从整体看系统，回答组件构成与关系
**LLD（低层设计）**：从局部看实现，回答每个组件内部怎么写

分层是为了让不同角色、不同阶段关注不同层次的问题，避免认知过载。

HLD：宏观架构

HLD 是系统的"航拍图"——展示整体结构、主要组件及其交互关系，但不触及实现细节。

要素	说明
系统架构	主要组件、组件间关系、部署结构
服务划分	模块边界、职责定义、服务间接口
数据流	模块间数据流动方向
技术栈	框架、数据库、中间件选型
约束权衡	性能、安全、成本的权衡决策

产出物：架构图、服务/模块职责定义、API 接口概览、数据存储策略、关键设计决策。

LLD：微观实现

LLD 是 HLD 每个组件的"施工图纸"——细化到类、方法、算法、数据结构。

要素	说明
类/模块设计	类图、方法签名、模块接口
算法逻辑	关键算法的伪代码或流程
数据结构	具体的数据 schema、索引
错误处理	异常场景、边界条件

产出物：类图与时序图、详细接口定义（请求/响应格式）、数据库表结构、单元测试计划。

关系对照

维度	HLD	LLD
视角	整体	局部
粒度	组件级	类/方法级
关注	结构与关系	逻辑与实现
指导	协调与评审	开发与测试
产出	架构图	类图/时序图

常见问题

问题	本质
HLD 太粗	缺乏关键设计决策，只画方块图
HLD 太细	把 LLD 当 HLD 写，层次不清
LLD 缺失	开发人员自由度过大，偏离设计意图
两者脱节	HLD 描述的架构在 LLD 中未体现

判断要点

**HLD 不是越详细越好** — 细节是 LLD 的职责
**LLD 必须反映 HLD** — 每个 HLD 决策都应落实到 LLD
**分层是为了协作** — 不同角色在不同层次工作

系统设计的权衡

系统设计不只是计算 QPS 和画架构图，更重要的是在多重约束下做取舍。

权衡的第一性原理

权衡之所以存在，两个根本原因：

资源有限 — 预算、人力、时间都是有限的，在有限资源下追求 A 能力，必然挤压 B 能力的空间。

能力互斥 — 有些能力本身就不能共存，选择强一致性就必然放弃可用性，选择高安全就必然增加复杂度。

任何提升都有代价，代价必须在设计阶段被显式接受，而非在故障后被动承受。

核心权衡维度

此处追求	代价是	典型场景
性能	简单性、运维成本	过度优化
强一致性	可用性、响应时间	CP 系统
水平扩展	分布式复杂度	分片、多副本
安全性	开发效率、用户体验	强鉴权
交付速度	架构质量	技术债

权衡判断框架

**明确选择空间** — 有哪些选项？每个选项的能力边界在哪里？
**评估每个选项的代价** — 获得什么能力？放弃什么能力？
**确认代价承受者** — 代价由开发团队、运维团队还是用户承担？
**判断选择可逆性** — 错了能改吗？改动的成本有多大？
**设计验证计划** — 决策基于什么假设？如何验证假设是否成立？

反模式与常见误区

知道什么不该做，与知道什么该做同样重要。

反模式	本质	危险信号
银弹思维	相信某方案能解决所有问题	用同一技术套所有场景
过度设计	为"未来可能"提前付出代价	在解决不存在的问题
最小化陷阱	用短期便利替代长期收益	技术债只增不减
权威依赖	因"大厂这样做"而忽视上下文	问"XX怎么做"而非"我的约束是什么"
沉默的代价	代价存在但从未被显式讨论	没人能解释"为什么这样做"

系统设计能力的本质：不是知道多少种方案，而是知道在什么约束下放弃什么。

系统设计的演进视角

不同阶段的设计重点

阶段	核心关注
小规模	简单性、开发效率
中规模	扩展性、可用性
大规模	伸缩性、治理能力

演进原则

避免过度设计
优先保留演进空间
用约束驱动复杂度，而非预期

结语

系统设计不是一次性工作，而是伴随系统生命周期持续发生的决策过程。

优秀的系统设计，不在于一开始就"设计得多复杂"，而在于：
系统是否能够在不断变化的约束下，持续演进而不失控。

关联内容（自动生成）

[/软件工程/架构/系统设计/可用性.html](/软件工程/架构/系统设计/可用性.html) 系统核心质量属性之一，与约束条件和架构决策密切相关
[/软件工程/架构/系统设计/扩展性.html](/软件工程/架构/系统设计/扩展性.html) 系统核心质量属性，决定需求变化的响应成本
[/软件工程/架构/系统设计/伸缩性.html](/软件工程/架构/系统设计/伸缩性.html) 系统对短期负载变化的响应能力，是弹性设计的具体体现
[/软件工程/架构/系统设计/分布式/分布式系统.html](/软件工程/架构/系统设计/分布式/分布式系统.html) 实现大规模系统的主流架构范式，涉及一致性与可用性的权衡
[/软件工程/架构/系统设计/高并发.html](/软件工程/架构/系统设计/高并发.html) 系统设计的重要实践场景，考验性能、扩展性、可用性的综合能力
[/软件工程/架构/系统设计/缓存.html](/软件工程/架构/系统设计/缓存.html) 提升系统性能和扩展性的关键技术手段
[/软件工程/架构/系统设计/流量控制.html](/软件工程/架构/系统设计/流量控制.html) 保障系统稳定性和可用性的核心机制，与约束条件直接相关
[/软件工程/架构/系统设计/可观测性.html](/软件工程/架构/系统设计/可观测性.html) 系统可维护、可演进的基础，支撑验证与演进阶段
[/软件工程/架构/架构.html](/软件工程/架构/架构.html) 系统设计的高级抽象，系统设计是架构设计的具体实现过程
[/软件工程/架构/架构思维.html](/软件工程/架构/架构思维.html) 系统设计的思维基础，指导在约束下做出架构决策
[/软件工程/架构/演进式架构.html](/软件工程/架构/演进式架构.html) 强调架构的持续演进能力，与系统设计的演化原则一致
[/软件工程/架构/架构治理.html](/软件工程/架构/架构治理.html) 确保架构决策有效执行，是系统设计落地的保障
[/软件工程/架构/系统设计/混沌工程.html](/软件工程/架构/系统设计/混沌工程.html) 主动验证系统韧性，是可用性设计的前置实践
[/软件工程/架构/架构重构.html](/软件工程/架构/架构重构.html) 系统持续演进的的重要手段，体现在变化中保持可控
[/软件工程/架构/技术选型.html](/软件工程/架构/技术选型.html) 实现机制的重要组成部分，决定技术栈与团队能力匹配