PostgreSQL 不再需要分库分表

admin

2026年2月19日 10:41 本文热度 2982

概述

实际上，在超大规模场景下，PostgreSQL 同样可能面临单机瓶颈，仍需分片。但相比传统 MySQL（尤其是 5.7 及更早版本），现代 PostgreSQL 在多个关键维度上显著延后了“必须分库分表”的临界点，使得很多原本在 MySQL 中需要分库分表的业务，在 PG 中可以长期维持单库架构，从而大幅降低运维复杂度。

✅ 一、存储引擎与架构优势：PG 天然更适合大表

表格

维度	MySQL（InnoDB）	PostgreSQL
行存储格式	聚簇索引（主键组织数据）	堆表（Heap Table）+ 独立索引
大字段处理	大字段（如 TEXT/BLOB）可能溢出页，影响性能	TOAST 机制自动压缩/外存大字段，对主行透明
更新性能	原地更新 + Undo Log，频繁更新易产生碎片	MVCC + 新版本写入（Append-Only），无原地更新，碎片少
表大小上限	单表理论上可达 64TB，但实际 >10 亿行时性能陡降	单表支持32TB+，实测百亿行级仍可高效查询

📌关键点：PG 的TOAST + MVCC + Heap 表架构，使其在宽表、大字段、高更新场景下比 InnoDB 更稳定，不易因数据膨胀导致性能崩塌。

✅ 二、分区表能力：PG 原生强大，MySQL 曾长期落后

表格

功能	PostgreSQL（10+）	MySQL（5.7 / 8.0）
声明式分区	✅ 原生支持（Range / List / Hash）	❌ 5.7 无；8.0 才完善
分区剪枝（Pruning）	✅ 优化器智能跳过无关分区	✅ 8.0 支持，但早期版本弱
分区索引	✅ 支持全局/本地索引	❌ 仅全局索引（8.0.21+ 才支持本地）
动态增删分区	✅`ATTACH/DETACH PARTITION` 零拷贝	⚠️ 需`ALTER TABLE` ，大表锁表风险高
子分区（Subpartition）	✅ 支持（PG 12+）	✅ 支持

💡效果：PG 可用单逻辑表 + 多物理分区替代“分库分表”，应用无感，且支持：

按时间自动归档旧分区（DETACH后 DROP）
热点分区单独优化
查询自动只扫相关分区

✅ 三、并行查询：PG 更早、更广、更深

表格

能力	PostgreSQL	MySQL
并行顺序扫描	✅ 9.6+	❌ 直到 8.0 才有限支持
并行 JOIN / 聚合	✅ 10+	⚠️ 8.0 有，但限制多（如不能有子查询）
并行 Bitmap Heap Scan	✅	❌
自适应并行度	✅ 基于成本估算	⚠️ 静态配置为主

📈结果：PG 在OLAP 或混合负载下，单查询可利用多核加速，避免因“慢查询”被迫拆分。

✅ 四、扩展性与生态：PG 的“内置分片”替代方案

虽然 PG 官方不提供透明分片，但其生态提供了更优雅的替代路径：

表格

方案	说明	对比分库分表
Citus（官方扩展）	将 PG 变成分布式数据库，语法 100% 兼容，自动分片、重平衡	✅ 透明分片，无需改应用
FDW（Foreign Data Wrapper）	跨库/跨实例联邦查询，可虚拟化多表为一	✅ 逻辑统一，物理分散
逻辑复制 + 分区路由	应用层按分区键路由，但表结构统一	⚠️ 需简单改造，但比 MyCat/ShardingSphere 轻量

🔥关键优势：这些方案保持 SQL 兼容性，而 MySQL 分库分表通常需引入中间件（如 ShardingSphere），牺牲部分 SQL 能力（如跨分片 JOIN、子查询）。

✅ 五、真实场景对比（典型 SaaS 应用）

表格

指标	MySQL（5.7）	PostgreSQL（14+）
单表行数安全阈值	～5000 万～ 1 亿	10 亿～ 50 亿
写入吞吐（万 TPS）	需分库才能 >5w	单机可扛 3～5w（NVMe + tuning）
复杂查询响应	>1 亿行基本不可用	百亿行 + 分区 + 并行 ≈ 秒级
运维复杂度	分库分表 + 中间件 + 数据迁移	单库 + 分区 + Citus（按需）

📌案例：

很多使用 PG 的 SaaS 公司（如 GitLab、Instacart）在10 亿+ 用户行为日志场景下仍用单 PG 实例 + 分区；
而同类 MySQL 架构往往在几千万行就启动分库。

❗ 重要澄清：PG 也不是“永远不分”

以下场景 PG 依然需要分片：

写入 QPS > 10 万（单机 WAL 瓶颈）
数据量 > 10TB（备份/恢复时间不可接受）
多租户强隔离（需物理隔离）

但区别在于：

MySQL 是“先分再优”，PG 是“先优再分”—— PG 让你把单机压榨到极致，推迟分片决策至少 2～3 年，节省大量工程成本。

✅ 结论：为什么说“PG 不再需要分库分表”？

表格

原因	说明
1. 单机容量更大	TOAST + MVCC + Heap 表支撑百亿行
2. 分区即分片	原生分区替代物理分表，应用无感
3. 并行查询扛住复杂负载	避免因慢查被迫拆分
4. 扩展方案更优雅	Citus/FDW 保持 SQL 完整性
5. 运维成本更低	无中间件、无跨库事务难题