范式数据库-第四范式数据密集型科学发现 pdf

发布时间：2023-03-10 09:14 浏览次数：次作者：佚名

一个设计合理的表，能给服务器性能带来很大的提高，因此如何设计出比较合理的表就比较重要了，设计范式（范式,数据库设计范式,数据库的设计范式）是符合某一种级别的关系模式的集合。构造数据库必须遵循一定的规则。在关系数据库中，这种规则就是范式。关系数据库中的关系必须满足一定的要求，即满足不同的范式，一般我们设计数据库表的时候只要满足第三范式（3NF）就够了，下面就对这几种范式进行简单讲解。

概念

在介绍三大范式之前我们先要了解几种概念：

键字=码字，所以主键=主码=主关键字，候选键=候选码=候选关键字

第四范式数据密集型科学发现 pdf_第四范式数据免清洗_范式数据库

hwZhYF.png

三大范式介绍第一范式（1NF）

第一范式：有主键，具有原子性范式数据库，字段不可分割

每一列属性都是不可再分的属性值，确保每一列的原子性两列的属性相近或相似或一样，尽量合并属性一样的列，确保不产生冗余数据

CREATE TABLE `user` (
  `user_id` varchar(50) NOT NULL COMMIT '人员编号',
  `name` varchar(50) DEFAULT NULL COMMENT '姓名',
  `mobile` varchar(11) DEFAULT NULL COMMENT '电话',
  `email` varchar(50) DEFAULT NULL COMMENT '邮箱',
  `address` varchar(50) DEFAULT NULL COMMENT '地址'
  PRIMARY KEY (`user_id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8 COMMENT='用户表';

上面这个user表其实不满足第一范式，因为地址的话里面包含省份、市、区、街道等，假如要根据省份进行分类的话就不能完成了，我们要包装每一列的属性都是不可再分的状态，因此我们对user表重新进行拆分，满足第一范式，拆分后的表如下：

CREATE TABLE `user` (
  `user_id` varchar(50) NOT NULL COMMIT '人员编号',
  `name` varchar(50) DEFAULT NULL COMMENT '姓名',
  `mobile` varchar(11) DEFAULT NULL COMMENT '电话',
  `email` varchar(50) DEFAULT NULL COMMENT '邮箱',
  `province` varchar(50) DEFAULT NULL COMMENT '省'
  `city` varchar(50) DEFAULT NULL COMMENT '市'
  `address` varchar(50) DEFAULT NULL COMMENT '详细地址'
  PRIMARY KEY (`user_id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8 COMMENT='用户表';

第二范式(2NF)

第二范式：首先满足第二范式的前提是一定要满足第一范式。如果关系模式R满足第一范式，并且R得所有非主属性都完全依赖于R的每一个候选关键属性，称R满足第二范式，简记为2NF。比如一个关系的关键码为（x,y），非主属性为z首先因为（x,y）是关键码，所以一定能得到z，如果存在x->z或者y->z则说明z是部分依赖，则不满足2NF范式数据库，否则满足2NF。

简单来说就是，表中非主键列对主键列是完全依赖，要求每个表只描述一件事情。也就是说在一个数据库表中，一个表中只能保存一种数据，不可以把多种数据保存在同一张数据库表中。

我们来看个例子：

CREATE TABLE `order_goods` (
    `order_id` VARCHAR (11) NOT NULL COMMENT '订单编号',
    `goods_id` VARCHAR ( 11 ) NOT NULL COMMENT '商品编号',
    `goods_name` VARCHAR ( 100 ) DEFAULT NULL COMMENT '商品名称',
    `price` DECIMAL ( 5, 2 ) DEFAULT NULL COMMENT '商品价格',
    `customer_name` VARCHAR ( 50 ) NOT NULL COMMENT '客户名称',
    `customer_mobile` VARCHAR ( 11 ) DEFAULT NULL COMMENT '客户电话',
PRIMARY KEY ( `order_id`, `goods_id` ) 
) ENGINE = INNODB DEFAULT CHARSET = utf8 COMMENT = '订单商品表';

因为订单中可能会有多种商品，所以要将订单编号(order_id)和商品编号(goods_id)作为数据库表的联合主键。上面这个表设计的有什么问题呢是否符合第二范式呢?显然是不符合的，商品名称、商品价格并非完全依赖于该表的主键（订单编号，商品编号），啥意思呢，也就是说我们根据商品编号能够得到商品名称和商品价格，换句话说实际上商品名称和商品价格只跟商品编号有关，因此不满足第二范式。我们将表进行拆分如下：

CREATE TABLE `goods` (
    `goods_id` VARCHAR ( 11 ) NOT NULL COMMENT '商品编号',
    `goods_name` VARCHAR ( 100 ) DEFAULT NULL COMMENT '商品名称',
    `price` DECIMAL ( 5, 2 ) DEFAULT NULL COMMENT '价格',
PRIMARY KEY (`goods_id` ) 
) ENGINE = INNODB DEFAULT CHARSET = utf8 COMMENT = '商品表';
CREATE TABLE `order` (
    `order_id` VARCHAR (11) NOT NULL COMMENT '订单编号',
    `goods_id` VARCHAR ( 11 ) NOT NULL COMMENT '商品编号',
    `customer_name` VARCHAR ( 50 ) NOT NULL COMMENT '客户名称',
    `customer_mobile` VARCHAR ( 11 ) DEFAULT NULL COMMENT '客户电话',
PRIMARY KEY ( `order_id`) 
) ENGINE = INNODB DEFAULT CHARSET = utf8 COMMENT = '订单表';

第三范式(3NF)

第三范式：首先满足第三范式必然要先满足第二范式，再者就是没有传递依赖，表中的列不存在对非主键列的传递依赖，也就是不能存在x->y y->z或(x,y)->m m->z。

CREATE TABLE `student` (
    `student_colde` VARCHAR ( 11 ) NOT NULL COMMENT '学号',
    `name` VARCHAR ( 100 ) DEFAULT NULL COMMENT '姓名',
    `age` INT ( 3 ) DEFAULT NULL COMMENT '年龄',
    `sex` VARCHAR ( 2 ) DEFAULT NULL COMMENT '性别',
    `school` VARCHAR ( 100 ) DEFAULT NULL COMMENT '所在院校',
    `address` VARCHAR ( 100 ) DEFAULT NULL COMMENT '院校地址',
    `tel` VARCHAR ( 100 ) DEFAULT NULL COMMENT '院校电话',
PRIMARY KEY ( `student_colde` ) 
) ENGINE = INNODB DEFAULT CHARSET = utf8 COMMENT = '学生表';

上面这个表我们可以看到主键是学号(student_code)，其他列也就是非主键列，但是我们能根据学号->所在院校 ->院校地址，也就是说上面的表中存在传递依赖的关系，因此不符合第三范式。将上表进行改造：

CREATE TABLE `student` (
    `student_colde` VARCHAR ( 11 ) NOT NULL COMMENT '学号',
    `name` VARCHAR ( 100 ) DEFAULT NULL COMMENT '姓名',
    `age` INT ( 3 ) DEFAULT NULL COMMENT '年龄',
    `sex` VARCHAR ( 2 ) DEFAULT NULL COMMENT '性别',
    `school` VARCHAR ( 100 ) DEFAULT NULL COMMENT '所在院校',
    PRIMARY KEY ( `student_colde` ) 
) ENGINE = INNODB DEFAULT CHARSET = utf8 COMMENT = '学生表';
CREATE TABLE `school` (
    `school` VARCHAR ( 100 ) DEFAULT NULL COMMENT '所在院校',
    `address` VARCHAR ( 100 ) DEFAULT NULL COMMENT '院校地址',
    `tel` VARCHAR ( 100 ) DEFAULT NULL COMMENT '院校电话',
PRIMARY KEY ( `school` ) 
) ENGINE = INNODB DEFAULT CHARSET = utf8 COMMENT = '学校表';

总结

在我们设计数据库时，可以按照三大范式来进行设计，这样可以建立结构合理、冗余较小的数据库，但是具体设计的时候要结合实际，有时候多一些冗余字段能够对性能有所提高，通过空间换时间，因此要结合实际灵活运用。

参考博客

数据库之设计范式

数据库中1NF，2NF，3NF的判别

ftp怎么上传数据库-免费 ftp上传插件

范式数据库-现代管理学的研究范式与企业管理理论的研究范式