范式:英文名称是 normal form,它是英国人 e.f.codd(关系数据库的老祖宗)在上个世纪70年代提出关系数据库模型后总结出来的,范式是关系数据库理论的基础,也是我们在设计数据库结构过程中所要遵循的规则和指导方法。目前有迹可寻的共有8种范式,依次是:1nf,2nf,3nf,bcnf,4nf,5nf,dknf,6nf。通常所用到的只是前三个范式,即:第一范式(1nf),第二范式(2nf),第三范式(3nf)。下面就简单介绍下这三个范式。
◆ 第一范式(1nf):强调的是列的原子性,即列不能够再分成其他几列。
考虑这样一个表:【联系人】(姓名,性别,电话)
如果在实际场景中,一个联系人有家庭电话和公司电话,那么这种表结构设计就没有达到 1nf。要符合 1nf 我们只需把列(电话)拆分,即:【联系人】(姓名,性别,家庭电话,公司电话)。1nf 很好辨别,但是 2nf 和 3nf 就容易搞混淆。
◆ 第二范式(2nf):首先是 1nf,另外包含两部分内容,一是表必须有一个主键;二是没有包含在主键中的列必须完全依赖于主键,而不能只依赖于主键的一部分。
考虑一个订单明细表:【orderdetail】(orderid,productid,unitprice,discount,quantity,productname)。
因为我们知道在一个订单中可以订购多种产品,所以单单一个 orderid 是不足以成为主键的,主键应该是(orderid,productid)。显而易见 discount(折扣),quantity(数量)完全依赖(取决)于主键(oderid,productid),而 unitprice,productname 只依赖于 productid。所以 orderdetail 表不符合 2nf。不符合 2nf 的设计容易产生冗余数据。
可以把【orderdetail】表拆分为【orderdetail】(orderid,productid,discount,quantity)和【product】(productid,unitprice,productname)来消除原订单表中unitprice,productname多次重复的情况。
◆ 第三范式(3nf):首先是 2nf,另外非主键列必须直接依赖于主键,不能存在传递依赖。即不能存在:非主键列 a 依赖于非主键列 b,非主键列 b 依赖于主键的情况。
考虑一个订单表【order】(orderid,orderdate,customerid,customername,customeraddr,customercity)主键是(orderid)。
其中 orderdate,customerid,customername,customeraddr,customercity 等非主键列都完全依赖于主键(orderid),所以符合 2nf。不过问题是 customername,customeraddr,customercity 直接依赖的是 customerid(非主键列),而不是直接依赖于主键,它是通过传递才依赖于主键,所以不符合 3nf。
通过拆分【order】为【order】(orderid,orderdate,customerid)和【customer】(customerid,customername,customeraddr,customercity)从而达到 3nf。
第二范式(2nf)和第三范式(3nf)的概念很容易混淆,区分它们的关键点在于,2nf:非主键列是否完全依赖于主键,还是依赖于主键的一部分;3nf:非主键列是直接依赖于主键,还是直接依赖于非主键列。
范式:英文名称是 normal form,它是英国人 e.f.codd(关系数据库的老祖宗)在上个世纪70年代提出关系数据库模型后总结出来的,范式是关系数据库理论的基础,也是我们在设计数据库结构过程中所要遵循的规则和指导方法。目前有迹可寻的共有8种范式,依次是:1nf,2nf,3nf,bcnf,4nf,5nf,dknf,6nf。通常所用到的只是前三个范式,即:第一范式(1nf),第二范式(2nf),第三范式(3nf)。下面就简单介绍下这三个范式。
◆ 第一范式(1nf):强调的是列的原子性,即列不能够再分成其他几列。
考虑这样一个表:【联系人】(姓名,性别,电话)
如果在实际场景中,一个联系人有家庭电话和公司电话,那么这种表结构设计就没有达到 1nf。要符合 1nf 我们只需把列(电话)拆分,即:【联系人】(姓名,性别,家庭电话,公司电话)。1nf 很好辨别,但是 2nf 和 3nf 就容易搞混淆。
◆ 第二范式(2nf):首先是 1nf,另外包含两部分内容,一是表必须有一个主键;二是没有包含在主键中的列必须完全依赖于主键,而不能只依赖于主键的一部分。
考虑一个订单明细表:【orderdetail】(orderid,productid,unitprice,discount,quantity,productname)。
因为我们知道在一个订单中可以订购多种产品,所以单单一个 orderid 是不足以成为主键的,主键应该是(orderid,productid)。显而易见 discount(折扣),quantity(数量)完全依赖(取决)于主键(oderid,productid),而 unitprice,productname 只依赖于 productid。所以 orderdetail 表不符合 2nf。不符合 2nf 的设计容易产生冗余数据。
可以把【orderdetail】表拆分为【orderdetail】(orderid,productid,discount,quantity)和【product】(productid,unitprice,productname)来消除原订单表中unitprice,productname多次重复的情况。
◆ 第三范式(3nf):首先是 2nf,另外非主键列必须直接依赖于主键,不能存在传递依赖。即不能存在:非主键列 a 依赖于非主键列 b,非主键列 b 依赖于主键的情况。
考虑一个订单表【order】(orderid,orderdate,customerid,customername,customeraddr,customercity)主键是(orderid)。
其中 orderdate,customerid,customername,customeraddr,customercity 等非主键列都完全依赖于主键(orderid),所以符合 2nf。不过问题是 customername,customeraddr,customercity 直接依赖的是 customerid(非主键列),而不是直接依赖于主键,它是通过传递才依赖于主键,所以不符合 3nf。
通过拆分【order】为【order】(orderid,orderdate,customerid)和【customer】(customerid,customername,customeraddr,customercity)从而达到 3nf。
第二范式(2nf)和第三范式(3nf)的概念很容易混淆,区分它们的关键点在于,2nf:非主键列是否完全依赖于主键,还是依赖于主键的一部分;3nf:非主键列是直接依赖于主键,还是直接依赖于非主键列。