数据库技术与应用复习资料-护理学专业高级护师技术资格考试复习题集
如果对你有帮助,请点赞关注我,让我更有动力产出更好的内容! 大家有什么问题,批评指正,也欢迎在评论区提出!
英文名词解释:
范例
1NF:关系的各个组成部分不能进一步划分,保证数据的原子性,表中不能有表
2NF:关系满足1NF,所有非键属性都依赖于完整主键(单属性主键必须满足2NF)
3NF:满足2NF且不存在非代码属性依赖其他非代码属性的情况
BCNF:bc范式,当且仅当关系满足3NF,并且函数依赖的所有行列式都是候选代码
attribute:实体的某个特征,表中的一列
ad-hoc :即席查询,由用户按需创建,而不是在应用程序中编写
大数据
BI系统:商业智能系统,通过生成评价信息、分析信息、计划信息、控制信息来支持管理决策的系统
增删改查:
即“创建(Create)、删除(Delete)、更新(Update)、读取(Read)”(增删改查)取首字母。
候选键:如果关系中某个属性的值可以唯一标识一个元组,但其子集不能,则该属性组称为候选键; 或可以确定关系中所有其他列的行列式
复合键:包含两列或更多列的代码成为复合键
all-key:在最极端的情况下,关系模式的所有属性值都是关系模式的候选键,称为full-keys。
数据:描述事物的符号记录,数据的最小访问单元是记录
数据库:数据库是集成表的自描述集合。 书籍定义:存放数据的仓库,长期存放在计算机中,有条理,可以共享的大量数据的集合。
数据库设计(作为一个过程):指建立合适的表结构(structure)、合适的表间关系(relationship)、合适的数据约束(data
约束)和其他结构组件。
数据库设计(作为产品)
数据库管理系统 (DBMS):DBMS 是用于创建、操作和管理数据库的大型复杂程序。 或者数据库管理系统是位于用户和操作系统之间的一层数据管理软件,用于科学地组织和存储数据,高效地获取和维护数据。 DBMS的主要功能包括数据定义功能、数据操作功能、数据库运行管理功能、数据库建立和维护功能。
数据库系统:由数据库、dbms、应用程序和数据库管理员组成的系统,用于存储、管理和维护数据。
denormalize:反规范化,利用join操作将规范化关系恢复到非规范化表状态的过程
Determinant:行列式,表示某个属性或一组属性的值可以决定其他属性的值
delete anomaly:删除异常,删除一行时,其他不想删除的信息丢失
domain : 域,一组符合特定数据类型定义的数据
domain integrity constraint:域完整性约束,同一关系下同一列的数据类型应该相同
DK/NF:领域代码范式,关系没有异常时需要什么条件。
实体:客观存在并且可以相互区分的东西,或者更准确地说是用户跟踪的可识别事物
实体集:同一类型实体的集合
实体类型:用实体名称及其属性名称集合来抽象描述相似的实体,比如一个学生(学号,姓名)就是一个实体类型。
entity integrity cinstraint:实体完整性约束,主要属性不能取空值
函数依赖:当确定了关系中的一个或几个属性时,还可以确定其他一些属性; 或者某个属性或一组属性的值可以决定其他属性的值。
外键:一个表中用来引用另一个表的主键数据的键; 或由单列或多列组成,对应于在另一张表中以主键的形式再次出现的键
instance:模式的具体值称为模式的实例
索引:一种支持结构,可加快数据库中数据的排序和查找
集成表:集成表,既存储数据又存储数据之间关系的表
insert anomaly :插入异常,想插入数据,因为表设计的原因,无法成功插入
键:用于标识关系中特定行的列或列组合
metadata:元数据,描述数据的数据
multivalued dependency:多值依赖,当一个行列式的某个值可以决定一组特定的集合值时,就会发生这种情况
修改异常:修改异常、插入异常、更新异常、删除异常
normal forms:范式,符合一定层次的关系模式的集合
规范化:一个低层范式中的关系模式可以通过模式分解转化为多个高层范式中关系模式的集合
nonprime attribute : 非主要属性,不包含在任何候选键中的属性
空值:空值、不存在、未知或无意义的值
主键:表中的某个属性组,可以唯一确定一个元组; 在设计数据库时选择用于检索行的候选键称为主键。
primary attribute:主要属性,任何候选代码中包含的属性
关系:满足特定条件的表
1.行存储实体
2.列存实体属性
3.每行输入的数据类型必须相同
4.列名不能重复
5.表格中的每个单元格只能存储单个数据
6. 列的顺序无关紧要
7.行的顺序无关紧要
8.没有两个相同的行
引用完整性约束:对外键的值进行约束,保证外键中的每个值都有对应的主键值进行匹配或者为空值。引用完整性约束可以维护表间数据的有效性
关系模型:对关系的描述,一般表示为关系名(属性1,属性2,...,属性n)
Surrogate key:代理键,人为加到表中的一列,充当主键,由dbms分配,对用户无意义。
schema:逻辑模式,描述数据的逻辑结构和特征,一个数据库只能有一个模式
external schema:subschema,user schema,描述数据库用户可以看到和使用的逻辑结构和特性,可以有多个external schema,用户只能看到external schema中的数据,其余数据在数据库中是看不见的。
内部模式:存储方式,描述数据的物理结构和存储方式,以及数据在数据库内部是如何组织的。
元组:表中的一行
更新异常:更新异常。 如果要更新某个数据项,需要修改多行,可能会出错。
Transitive dependency:传递依赖,非代码属性依赖其他非代码属性
简答
关系数据库如何将数据存储在表中:
行存储关系数据库中的数据实例,列存储实体的属性。 此外,关系数据库存储表间约束,通过引用完整性约束在多个表之间建立连接。
应用程序的功能
充当 dbms 和用户之间的中介:
应用程序处理用户的查询,向DBMS发送SQL语句,读取或修改数据库中的数据; 将结果展示给用户,将数据以表格或报表的形式展示给用户; 执行特定的应用程序逻辑来控制应用程序。
1.创建加工表单
2.处理用户查询
3.创建加工报告
4.执行应用程序的逻辑
5.控制应用程序本身
3种类型的数据库设计(来源):
1. Database design using existing data(数据库来自现有数据)
2. 新系统开发的数据库设计
发展)
3.现有数据库的数据库重新设计
包括:数据迁移、数据集成、归一化理论的使用和数据模型转换、逆向工程和新数据库设计
为什么数据冗余会导致数据完整性问题:
数据冗余会导致更新异常
你什么时候重新设计一个现有的数据库?
原有表结构设计较差,存在函数依赖、多值依赖,维护数据库时经常出现插入异常、更新异常、删除异常等数据完整性问题。 考虑重新设计数据库。
参照完整性约束的作用和重要性:
参照完整性约束限制外键的值存在于主键对应的值集中,建立主键和外键的关系,建立多表之间的关系,保证表间数据的一致性.
为什么冗余数据会导致数据完整性问题:
冗余数据很可能导致多次删除、更新或删除操作来完成对某个数据的正常操作,即存在插入异常、更新异常、删除异常,容易出现数据不一致。
为什么关系型数据库使用最多?
关系数据库原理简单易懂,使用方便,很好地解决了数据集成和共享的问题,因此被广泛应用。
企业级DBMS产品如何使用SQL
企业级dbms通过sql语句操作数据库,提供创建、处理和管理数据库的功能。企业级dbms包括:Microsoft Access、MySQL、DB2等。
什么时候容易遇到多值多列的问题
从非数据库数据创建数据库时很容易遇到,比如excel表格和txt文件。 这些数据通常将同一类别的多个数据放在同一行。
为什么要警惕通用的备忘栏
通用备注栏中存储的信息冗长口语化,有时数据不一致。 同一列数据可能包含不同类型的数据。
保证数据完整性和数据一致性的区别:
数据完整性问题是指数据冗余很容易导致更新异常,而数据一致性问题不仅要避免更新异常,还要避免插入和修改异常,所以保证数据完整性是保证数据一致性的一部分。
为什么个性化冗余表是典型的逆向规范
对于高度标准化的多表,当业务需要频繁查询多表的列数据时,可以通过连接查询等方式复制数据创建个性化的冗余表。 虽然这样做容易导致数据不一致,表的范式级别也会下降,但是查询效率会提高,所以是典型的反向规范。
关系模型中常用的关系操作包括
1.查询 2.插入 3.删除 4.修改后三者为一组
查询是关系操作中最重要的部分。 选择、投影投影、并集、差除、笛卡尔积是五个基本运算。
数据库如何管理多个表:
1.数据库按行存储实体,按列存储实体的特征
2.通过外键与主键的参照完整性约束,建立表与表之间的关系,管理多张表
什么情况下不需要去除多值依赖:
1.只读数据库
2.更新频率很低的数据库
几乎不会出现修改异常,归一化会导致查询SQL语句非常复杂,会增加dbms的开销
dbms如何控制并发:
DBMS通过保证单个用户对数据库的操作不会影响其他用户来进行并发控制,即无论是一个人还是多人合作使用DBMS,都能得到一致的、预期的处理结果。
数据库用途:
数据库(database)的目的是帮助人们跟踪和理解客观事物(keep track on things)
数据库存在的真正目的:
存储不能用相等表示的功能依赖实体
数据库特点:
1.数据结构
2、数据共享程度高,冗余度低,易扩展
3. 数据独立性高
4、数据由数据库系统统一管控
数据模型包括?
数据结构、数据操作和数据完整性约束三部分组成。
数据结构:描述数据库的组成对象以及它们之间的关系,描述系统的静态特性
数据操作:允许对各种数据对象的实例进行的操作的集合,包括操作和相关的操作规则,以及对系统动态特性的描述。
数据完整性约束:是一组完整性规则,用于限制符合数据模型的数据库状态和状态变化,以确保数据正确、有效、兼容(可增加四种完整性约束)
两种类型的数据模型:
概念模型:信息模型,根据用户的观点对数据进行信息建模,主要用于数据库设计。 从现实世界到机器世界。
逻辑模型和物理模型
常见的数据库逻辑模型:
1. Hierarchical model:分层模型
2. Mesh模型:网络模型
3.关系模型:关系模型
4. Object-oriented data model:面向对象的数据模型
数据库完整性:正确性和兼容性(compat-ability)
数据库限制
1.域完整性约束:列值
2.实体完整性约束:主键的值不能相同
3.参照完整性约束:外键值
关系模型的完整性约束包括三类:关系模型的完整性规则是对关系的一定约束
1.实体完整性 如果属性A是基本关系R的主要属性,则A不能取空值。 所谓空值就是一个未知的、不存在的或无意义的值。
2.参照完整性(实体和引用是最重要的完整性约束)
3. User-defined integrity 用户自定义完整性
解释参照完整性约束在规范化中的作用。
确保数据库中存储的数据正确、有效、兼容。
三层模型两层映射和数据独立性
两层镜像保证了数据库系统中的数据具有高度的逻辑独立性和物理独立性
1.外部模式/模式图像
模式:数据全局逻辑; 外部模式:数据本地逻辑; 一个模式可以有多个外部模式。 对于每个外部模式,dbs 都有一个外部模式/模式图像,它定义了外部模式与模式之间的对应关系。
当schema发生变化时(如增加新关系、新属性、改变数据类型等),数据库管理员会对每个外部schema/schema的形象做相应的改变,可以保持外部schema不变,而应用程序是基于数据的外部方式编写的,这样应用程序不需要修改,保证了数据和程序的逻辑独立性,简称数据的逻辑独立性.
2.模式/模式内图像
数据库只有一种模式和一种外部模式,因此模式/内部模式图像是唯一的,它定义了数据的全局逻辑结构与存储结构之间的对应关系。
当数据库的存储结构发生变化时,比如选择了另一种存储结构,数据库管理员可以对schema/内部schema image做相应的改变,使schema保持不变,这样就不需要改变应用程序,保证数据和程序。 物理独立性,简称数据库的物理独立性
文件系统与数据库系统的区别在于:文件系统是面向某个应用程序的,共享性差,冗余度高,数据独立性差。 数据库系统面向现实世界,具有高共享、低冗余、高物理独立性和一定的逻辑独立性,整体结构,用数据模型描述,数据库管理系统提供数据的安全性和完整性,并发控制和恢复能力。
文件系统与数据库系统的联系是:文件系统和数据库系统都是计算机系统中管理数据的软件。 解析文件系统是操作系统的重要组成部分; 而DBMS是独立于操作系统的软件。 但是DBMS是在操作系统的基础上实现的; 数据库中数据的组织和存储是通过操作系统中的文件系统来实现的。
域完整性的重要性:
1.域完整性是针对特定关系数据库的一种约束,保证表中的某些列不能输入无效值
2、域完整性是指列的值域的完整性,如数据类型、格式、值域范围、是否允许空值等。
3.域完整性限制某些属性中出现的值,比如将属性限制在一个有限的集合中。 例如,如果属性类型引用整数,则它不能是 101.5。
在什么条件下行列式在关系中是唯一的?
该行列式可以确定所有其他列
归一化理论可分为三大类:
1.函数依赖1NF、2NF、3NF、BCNF
2.多值依赖4NF
3.数据受限等未知问题
确定行列式是否唯一的最佳检验是什么?
最好的策略是考虑生成数据的业务活动的性质,并询问用户
引入数据库后计算机系统的层次结构:
硬件-os-数据库管理系统-应用开发工具-应用系统
数据处理的核心问题:数据管理
数据库管理系统的主要功能有哪些
(l) 数据库定义函数; (2) 数据存取功能; (三)数据库运行管理; (4) 数据库建立和维护功能。
实体之间的关系:通常是指不同实体类型的实体集之间的关系。 实体之间存在多种类型的关系,例如一对一、一对多和多对多。
描述关系模型的概念,定义并解释以下术语: (l) 关系 (2) 属性 (3) 域 (4) 元组 (5) 主键 (6) 组件 (7) 关系模型
答:关系模型由三部分组成:关系数据结构、关系操作集和关系完整性约束。 从用户的角度来看,关系模型中数据的逻辑结构是一个二维表,由行和列组成。 (l) 关系:关系对应于通常说的一张表; (2)属性:表中的一列是一个属性; (3)域:属性的取值范围; (4)元组:表中的一列
一行是一个元组; (5) 主键:表中的某个属性组,可以唯一确定一个元组; (6)组件:元组中的一个属性值; (7) 关系模式:pair relationship 的描述一般表示为关系名(属性1,属性2,...,属性n)
动态数据描述语言
DDL:Data Definition Language,一种用于定义数据库模式、外部模式和内部模式的语言。 DML:数据操作语言,用于查询、插入、删除和修改数据库中数据的语句。
关系模型:关系模型要求关系是标准化的,必须满足一定的规范条件。 最基本的一个是关系的每个组成部分必须是一个不可分割的数据项。
关系的特征:
1.行存储实体
2.列存实体属性
3.每一列输入的数据类型必须相同
4.列名不能重复
5.表格中的每个单元格只能存储单个数据
6. 列的顺序无关紧要
7.行的顺序无关紧要
8.没有两个相同的行
所有的关系都必须是表,并不是所有的表都是关系,只有满足这些的表才是关系
规范化的优点和缺点:
优势
1.规范化消除修改异常
2.归一化减少数据冗余(Reduce duplicated data)
为什么说是减少而不是消除数据冗余:因为有时外键会出现重复值,重复值的情况并不能完全消除。
为什么减少数据冗余可以消除数据不一致导致的完整性问题:
因为引用完整性约束禁止了数据不一致的发生,所以外键中重复值的存在不会导致不一致,即只要引用完整性约束有效,重复的外键值就不会导致不一致数据不一致。
缺点:
1. 处理标准化表,应用程序需要编写比较复杂的SQL语句,需要编写子查询或连接查询来恢复存储在多个表中的分散数据
2.对于规范化的数据,DBMS需要读取两个以上的表,降低了应用处理的速度
逆范数的优点:
1. 将可更新数据库中的数据放入只读数据库时,节省了程序员为每个应用程序编写连接语句的时间;
2. 避免了每次用户运行查询或创建报表时都需要执行连接查询和子查询,减少了 DBMS 开销
数据库建设基本规律:三分技术、七分管理、十二分基础数据、十二分基础数据强调数据的收集、整理、组织和持续更新是数据库建设的重要环节
最大的电子商务公司数据库的目的:
1.记录客户的浏览行为
2、在db中进行数据分析和挖掘,根据用户需求进行个性化推荐,实现利益最大化。
数据库是如何重新设计的:
1. 数据迁移
2.数据合并
3.归一化理论、数据模型转换、逆向工程
为什么面向对象的数据库不起作用
1、数据量太大,存储困难
2、与关系型数据库相比,面向对象数据库没有明显的优势
阿姆斯特朗公理系统:阿姆斯特朗公理
设U为属性集的总和,F为对U的函数依赖集,存在关系模式R,对于R有如下推理规则:
1、自反律:自反性规则:如果Y包含在X中,X包含在U中,则X->Y由F隐含。
2.增广律:增广规则:如果F隐含X->Y,U中包含Z,则F隐含XZ->YZ。
3. Transit law:传递性规则:如果X->Y和Y->Z为F所蕴涵,则X->Z为F所蕴涵
X->Y数据库技术与应用复习资料,但Y不⊆\subseteq⊆X,则称X->Y为非平凡函数依赖,若Y⊆\subseteq⊆X,则称X->Y为平凡函数依赖功能依赖。
早期对关系模型的反对意见是什么? (最早反对关系模型的是什么)
(1)理论性太强,难以实际实施
(2) 太慢,并且
(3) 需要太多的存储空间,以至于该模型在商业世界中永远不会有用
目的
== 解释为什么重复数据会导致数据完整性问题。 (解释为什么重复数据会导致数据库完整性问题)==
任何具有重复数据的表都容易受到更新异常的影响。
任何有重复数据的表都容易出现更新异常
SQL后台
在 20 世纪 70 年代,SQL 由 IBM 开发
数据库完整性和安全性:
数据库的完整性是为了防止数据库中存在非语义数据,防止因输入输出错误信息而导致的无效操作和错误结果,安全性是为了防止恶意破坏和非法访问数据库.
事务
一、定义
事务一般是指要做或要做的事情。 在计算机术语中,它是指访问并可能更新数据库中各种数据项的程序执行单元(单元)。
2.特点
事务应该具有四个属性:原子性、一致性、隔离性和持久性。 这四种特性通常被称为 ACID 特性。
原子性。 事务是一个不可分割的工作单元,事务中包含的所有操作要么执行要么不执行。
一致性。 事务必须将数据库从一种一致状态更改为另一种一致状态。 一致性和原子性是密切相关的。
隔离。 一个事务的执行不能被其他事务干扰。 即一个事务内使用的操作和数据与其他并发事务隔离,并发执行的事务之间不能相互干扰。
耐用性。 持久性,也称为永久性,是指一旦事务被提交,它对数据库中数据的改变应该是永久性的。 随后的其他操作或故障不应对其产生任何影响。
视图和表的区别:
1.视图和表都是关系,可以直接在查询中应用
2. db中存储表的schema定义和数据
3.db中只存了视图的定义,不存视图的数据
4.视图数据在使用视图时临时计算
数据库安全:授权:授予和撤销
1、如果指定了WITH GRANT OPTION,那么已经获得某种权限的用户也可以将这个权限授予其他用户。 如果不指定,则无法传播
2.不允许循环授权
3.eg:给U1查询表的权限
授予选择
桌上学生
至 U1;
将Student表和Course表的所有操作赋值给U1、U2
授予所有权限
ON TABLE 学生,课程
至 U1、U2;
授予所有用户对表 SC 的查询权限
授予选择
在餐桌上
公开;
授予U4查询Student表和修改学号的权限
授予更新(Sno)数据库技术与应用复习资料,选择
桌上学生
至 U4;
如果你毕竟添加了 WITH GRANT OPTION
然后你可以给其他用户权限
撤销更新 (Sno)
桌上学生
来自 U4;
撤销选择
在餐桌上
来自公众
从集合论的角度给出关系的形式化定义:
为什么数据库是自描述的:
因为数据库有元数据来描述自己的数据
行列式是否必须是唯一的? :
不,在关系中,行列式是唯一的,当且仅当行列式可以确定关系中所有其他列,但它不能确定所有列,并且可能是唯一的。
总结使用数据库技术的不同方式:
1、为用户提供查询接口
2.使用sql查询db中的数据
3.使用应用程序操作数据