MySQL物理存储结构核心是InnoDB引擎的表空间、段区页分层管理。1. 表空间分系统和独立两种,后者每表一个.ibd文件,便于管理;2. 段、区、页层级中,页为最小I/O单位,大小16KB;3. 行格式有Compact、Dynamic等,Dynamic支持大字段外部存储;4. 索引采用B+树,主键为聚簇索引,数据按主键物理排序,影响查询与插入性能。
MySQL的物理存储结构主要指数据在磁盘上的实际组织方式,理解它有助于优化性能、排查问题和设计合理的表结构。核心在于存储引擎层,尤其是InnoDB,因为它是MySQL默认且最常用的引擎。
1. 表空间(Tablespace)
表空间是InnoDB存储数据的最高层级单位,包含一个或多个数据文件。主要有两种类型:
- 系统表空间(System Tablespace):通常对应ibdata1文件,存放元数据(如数据字典)、undo日志、双写缓冲区等。早期版本中也存储表数据和索引。
- 独立表空间(File-Per-Table Tablespace):每个表有自己的.ibd文件(如user.ibd),包含该表的数据和索引。通过innodb_file_per_table=ON启用,推荐使用,便于管理与备份。
2. 段(Segment)、区(Extent)、页(Page)
InnoDB采用分层管理机制,从大到小依次为表空间 → 段 → 区 → 页。
- 段(Segment):分为数据段、索引段、回滚段等。一张表的数据和索引分别对应不同的段。
- 区(Extent):连续的64个页,大小为1MB(每页16KB)。用于高效分配空间,减少碎片。
- 页(Page):InnoDB最小的I/O单位,默认16KB。不同类型的页负责不同功能,例如:
- 数据页(B-tree Node):存储行数据。
- undo页:记录事务回滚信息。
- 系统页:保存表空间元数据。
3. 行格式(Row Format)
数据最终以“行”形式存放在页中。常见的行格式有:
- Compact:节省空间,但可能产生行溢出。
- Dynamic:支持大字段(如TEXT、BLOB)外部存储,主流推荐。
- Compressed:压缩存储,节省磁盘但增加CPU开销。
行记录中包含隐藏列(如事务ID、回滚指针),用于MVCC和事务控制。
4. 索引与B+树结构
InnoDB使用B+树组织数据和索引。主键索引(聚簇索引)的叶子节点直接包含完整行数据;二级索引叶子节点存储主键值,查找需回表。
所有数据按主键顺序物理存储在聚簇索引中,因此主键设计对插入和查询性能影响很大。
基本上就这些。理解物理结构能帮你更好把握数据如何落地、为何某些操作慢、以及如何合理配置参数。不复杂但容易忽略。