数据库规范化与范式
数据库设计中的规范化旨在减少数据冗余,增强数据完整性,避免数据异常(如插入、更新、删除异常)。这通过将大型数据表分解成更小、更易管理的表,并定义它们之间的关系来实现。
不同的范式代表不同的规范化级别,每个级别都建立在前一个级别的基础上,并遵循特定的规则。以下是几种常用的范式:
第一范式 (1NF)
1NF 是规范化的基础级别,其核心目标是消除重复数据,确保表中每个字段都包含单个、不可分割的值(原子值)。
- 1NF规则:
- 每个字段必须包含原子值,即不可再细分的值。
- 每行数据必须唯一。
- 每列数据类型一致。
- 不允许出现重复的列或字段内包含多个值。
1NF示例:
非1NF:
订单ID | 商品 | 数量 |
---|---|---|
1 | 苹果,香蕉 | 2,3 |
2 | 橙子 | 5 |
—
转换为1NF:
订单ID | 商品 | 数量 |
---|---|---|
1 | 苹果 | 2 |
1 | 香蕉 | 3 |
2 | 橙子 | 5 |
—
第二范式 (2NF)
2NF 在1NF的基础上,进一步消除了部分函数依赖。部分函数依赖是指非主键属性依赖于主键的一部分(对于复合主键)。要满足2NF,必须先满足1NF。
- 2NF规则:
- 满足1NF。
- 每个非主键属性必须完全依赖于整个主键。
2NF示例:
非2NF(部分函数依赖):
订单ID | 商品 | 客户姓名 | 价格 |
---|---|---|---|
1 | 苹果 | John | 10 |
1 | 香蕉 | John | 5 |
2 | 橙子 | Jane | 8 |
—
转换为2NF:
表:
- 订单 (订单ID, 客户姓名)
- 订单明细 (订单ID, 商品, 价格)
订单表:
订单ID | 客户姓名 |
---|---|
1 | John |
2 | Jane |
—
订单明细表:
订单ID | 商品 | 价格 |
---|---|---|
1 | 苹果 | 10 |
1 | 香蕉 | 5 |
2 | 橙子 | 8 |
—
第三范式 (3NF)
3NF 在2NF的基础上,消除了传递函数依赖。传递函数依赖是指非主键属性依赖于其他非主键属性。要满足3NF,必须先满足2NF。
- 3NF规则:
- 满足2NF。
- 任何非主键属性都不应依赖于其他非主键属性。
3NF示例:
非3NF(传递函数依赖):
订单ID | 商品 | 类别 | 供应商 |
---|---|---|---|
1 | 苹果 | 水果 | XYZ |
2 | 胡萝卜 | 蔬菜 | ABC |
—
转换为3NF:
表:
- 订单 (订单ID, 商品, 类别)
- 类别 (类别, 供应商)
订单表:
订单ID | 商品 | 类别 |
---|---|---|
1 | 苹果 | 水果 |
2 | 胡萝卜 | 蔬菜 |
—
类别表:
类别 | 供应商 |
---|---|
水果 | XYZ |
蔬菜 | ABC |
—
Boyce-Codd范式 (BCNF)
BCNF 比3NF更严格。如果每个函数依赖的左部都是候选键,则表满足BCNF。
- BCNF规则:
- 满足3NF。
- 每个决定因素都是候选键。
第四范式 (4NF)
4NF 解决了多值依赖问题,即一个属性决定另一个属性的多个值,且这些值彼此独立。
- 4NF规则:
- 满足BCNF。
- 没有多值依赖。
总结
数据库规范化是确保数据质量的关键步骤。不同的范式提供了不同级别的规范化,选择合适的范式需要权衡数据完整性和性能需求。 虽然高范式能保证数据完整性,但在某些情况下,为了性能考虑,可能会选择降低范式级别。