java 通配符查找文件-excel通配符查找
三、数据库篇
1:数据库的分类
关系型数据库ORDBMS:(oracle、MySQL、SqlServer等)
特点:二维表存储,使用sql语言操作,有事务可以控制数据操作的完整性可以复杂的联查
非关系型数据库nosql:(MongoDB、redis等)
特点:键值对或json存储,弱事务或无事务操作数据效率更高可以用于充当缓存
2:SQL语句分为哪几种?
SQL语句主要可以划分为以下几类:
DDL(Data Definition Language):数据定义语言,定义对数据库对象(库、表、列、索引)的操作。
包括:CREATE、DROP、ALTER、RENAME、 TRUNCATE等
DML(Data Manipulation Language): 数据操作语言,定义对数据库记录的操作。
包括:INSERT、DELETE、UPDATE、SELECT等
DCL(Data Control Language): 数据控制语言,定义对数据库、表、字段、用户的访问权限和安全级别。
包括:GRANT、REVOKE等
Transaction Control:事务控制
包括:COMMIT、ROLLBACK、SAVEPOINT等
3:排序
关键字:order by
使用方法:select * from 表名 order by 字段 排序方式
Order by都写在查询语句的最后,如果不加排序方式,默认升序,多个字段排序用逗号分隔
4:分组
关键字:group by
使用方法:select * from 表名 where 条件group by 字段 order by 字段 排序方式
注意:使用group by查询时,查询字段只能是分组字段或聚合函数,当查询的条件为非聚合函数时,可以在group by之前使用where条件判断,如果查询条件为聚合函数,必须在group by之后使用having进行条件判断,having是在分组之后执行的查询条件,having后跟的查询条件必须是聚合函数或者分组字段。
group by多个字段分组,使用逗号分隔,只有分组字段完全相同时,才会正常分租,否则数据全部显示。
5:伪列
Rowid:唯一的物理地址用rowid作为条件查询可以提升查询效率。
Rownum:查询结果的序号可以用于条件查询,不能用于修改和删除
(1)id,Rowid,Rownum的区别?
rowid物理位置的唯一标识。
而id是逻辑上的唯一标识,所以rowid查找速度要快于id,是目前最快的
定位一条记录的方式
rowid和rownum都是"伪数列"
所谓“伪数列”也就是默认隐藏的一个数列。
rownum用于标记结果集中结果顺序的一个字段,
它的特点是按顺序标记,而且是连续的,
换句话说就是只有有rownum=1的记录,才可能有rownum=2的记录。
rownum关键字只能和)判断时,会导致索引失效而转向全表扫描
7、索引字段上使用 is null / is not null 判断时,会导致索引失效而转向全表扫描
8、索引字段使用like以通配符开头(‘%字符串’)时,会导致索引失效而转向全表扫描
由结果可知,like以通配符结束相当于范围查找,索引不会失效。与范围条件(bettween、、in等)不同的是:不会导致右边的索引失效。
9、索引字段是字符串,但查询时不加单引号,会导致索引失效而转向全表扫描
10、索引字段使用 or 时,会导致索引失效而转向全表扫描
(8)B-树索引(BTREE)和哈希索引(HASH)的区别
索引是帮助mysql获取数据的数据结构。最常见的索引是Btree索引和Hash索引。
不同的引擎对于索引有不同的支持:Innodb和MyISAM默认的索引是Btree索引;而Mermory默认的索引是Hash索引。
Hash索引
所谓Hash索引,当我们要给某张表某列增加索引时,将这张表的这一列进行哈希算法计算,得到哈希值,排序在哈希数组上。所以Hash索引可以一次定位,其效率很高,而Btree索引需要经过多次的磁盘IO,但是innodb和myisam之所以没有采用它,是因为它存在着好多缺点:
1、因为Hash索引比较的是经过Hash计算的值,所以只能进行等式比较,不能用于范围查询
1、每次都要全表扫描
2、由于哈希值是按照顺序排列的,但是哈希值映射的真正数据在哈希表中就不一定按照顺序排列,所以无法利用Hash索引来加速任何排序操作
3、不能用部分索引键来搜索,因为组合索引在计算哈希值的时候是一起计算的。
4、当哈希值大量重复且数据量非常大时,其检索效率并没有Btree索引高的。
Btree索引
至于Btree索引,它是以B+树为存储结构实现的。
但是Btree索引的存储结构在Innodb和MyISAM中有很大区别。
13:三范式
1.第一范式,是列的原子性,就是不能再别分割
2.第二范式,是在满足第一范式的前提下,必须有主键,并且非主键的列,必须完全依赖于主键,不能只是依赖主键的一部分。
3.第三范式,是在满足第二范式的前提下,主要说的是外键。就是非主键
列必须直接于主键相关,不能间接相关。
14:存储过程
(1)概述
存储过程和函数是事先经过编译并存储在数据库中的一段sql语句的集合。
(2)存储过程和函数的区别
函数必须有返回值,而存储过程没有。
存储过程的参数可以是IN,OUT,INOUT,类型,而函数只能是IN。
(3)优点
存储过程只在创建时进行编译,而sql语句每次执行都需要编译,所以存储过程可以提高数据库执行速度。
简化复杂业务逻辑,结合事务一起封装。
复用性好,根据需要可重复使用。
安全性高,可指定存储过程的使用权。
(4)缺点
可移植性差,相同的存储过程并不能跨多个数据库进行操作。
大量使用存储过程后,首先会使服务器压力增大,而且维护难度逐渐增加。
(5)使用语法
创建存储过程:
DELIMITER //
CREATE PROCEDURE p1()
BEGIN
SELECT COUNT(*) FROM t_user;
END;//
执行存储过程:
call p1();
15:触发器(trigger)
(1)什么是触发器
本质上是一种与表操作有关的数据库对象。
是SQL server 提供给程序员和数据分析员来保证数据完整性的一种方法,它是与表事件相关的特殊的存储过程,它的执行不是由程序调用,也不是手工启动,而是由事件来触发,比如当对一个表进行操作(insert,delete, update)时就会激活它执行。触发器经常用于加强数据的完整性约束和业务规则等。SQL3的触发器是一个能由系统自动执行对数据库修改的语句。
触发器可以查询其他表,而且可以包含复杂的SQL语句。它们主要用于强制服从复杂的业务规则或要求
(2)触发器的作用
可在写入数据表前,强制检验或转换数据。
触发器发生错误时,异动的结果会被撤销。
部分数据库管理系统可以针对数据定义语言(DDL)使用触发器,称为DDL触发器。
可依照特定的情况,替换异动的指令 (INSTEAD OF)。
(3)为什么需要触发器
因为有很多开发的场景 好多逻辑关系他们是原子的
如果某个操作发生 必然会引发另外一个操作
那么这个时候我们手工去写很多sql语句
这个时候就需要触发器代替我们去完成
(4)创建语法
触发器四要素
监视地点(table)监视事件(insert/delete/update)
触发时间(after/before)触发事件(insert/update/delete)
Create trigger triName After/Before insert/update/delete on 表名
For each row (写死的.行触发器 )
Begin
Sql语句 一句或者多句(insert/update/delete) 范围内
End
(5)优点
触发器可通过数据库中的相关表实现级联更改,不过,通过级联引用完整性约束可以更有效地执行这些更改。触发器可以强制用比CHECK约束定义的约束更为复杂的约束。与 CHECK 约束不同,触发器可以引用其它表中的列。
例如,触发器可以使用另一个表中的 SELECT 比较插入或更新的数据,以及执行其它操作,如修改数据或显示用户定义错误信息。触发器也可以评估数据修改前后的表状态,并根据其差异采取对策。一个表中的多个同类触发器(INSERT、UPDATE 或 DELETE)允许采取多个不同的对策以响应同一个修改语句。
其他:限制,执行顺序…
(6)存储过程与触发器的区别
触发器与存储过程非常相似,触发器也是SQL语句集,两者唯一的区别是触发器不能用EXECUTE语句调用,而是在用户执行Transact-SQL语句时自动触发(激活)执行。触发器是在一个修改了指定表中的数据时执行的存储过程。通常通过创建触发器来强制实现不同表中的逻辑相关数据的引用完整性和一致性。由于用户不能绕过触发器,所以可以用它来强制实施复杂的业务规则,以确保数据的完整性。触发器不同于存储过程,触发器主要是通过事件执行触发而被执行的,而存储过程可以通过存储过程名称名字而直接调用。当对某一表进行诸如UPDATE、INSERT、DELETE这些操作时,SQLSERVER就会自动执行触发器所定义的SQL语句,从而确保对数据的处理必须符合这些SQL语句所定义的规则。
16:存储引擎
1.InnoDB是事务型数据库的首选引擎,支持ACID事务,支持行锁定和外键,InnoDB是默认的MySQL引擎(5.5版本之后)。
2.MyISAM基于ISAM存储引擎,并对其进行扩展。它是在Web、数据仓储和其他应用环境下最常使用的存储引擎之一。MyISAM拥有较高的插入、查询速度,但不支持事务。
3.MEMORY存储引擎将表中的数据存储到内存中,为查询和引用其他表数据提供快速访问。
如果要提供提交、回滚、崩溃恢复能力的事物安全(ACID兼容)能力,并要求实现并发控制,InnoDB是一个好的选择
如果数据表主要用来插入和查询记录,则MyISAM引擎能提供较高的处理效率
如果只是临时存放数据,数据量不大,并且不需要较高的数据安全性,可以选择将数据保存在内存中的Memory引擎,MySQL中使用该引擎作为临时表,存放查询的中间结果
如果只有INSERT和SELECT操作,可以选择Archive,Archive支持高并发的插入操作,但是本身不是事务安全的。Archive非常适合存储归档数据,如记录日志信息可以使用Archive
使用哪一种引擎需要灵活选择,一个数据库中多个表可以使用不同引擎以满足各种性能和实际需求,使用合适的存储引擎,将会提高整个数据库的性能
17:事务
(1)简介
在数据库中,所谓事务是指一组逻辑操作单元即一组SQL语句,当这个单元中的一部分操作失败时,整个事务回滚,只有全部正确才完成提交。通过事务,SQL Server能将逻辑相关的一组操作绑定在一起,以便服务器保持数据的完整性。
(2)事务的四大特性(ACID)
原子性(Atomicity):最小单位,不可切割;
一致性(Consistency):事务数据状态都是一致的,要么都成功,要么都失败,一条发生异常,集体回滚;
隔离性(Isolation):事务和事务之间是互相隔离,互不干扰,一个事务的失败不影响其他事务的运行;
持久性(Durability):事务一旦提交,不可回退。
(3)事务隔离级别
当多个事务同时进行时,通过设置隔离级别来处理脏读、不可重复读、幻读事件
脏读(Dirty Read):A事务读取B事务尚未提交的数据并在此基础上操作,而B事务执行回滚,那么A读取到的数据就是脏数据。
不可重复读(Unrepeatable Read):事务A重新读取前面读取过的数据,发现该数据已经被另一个已提交的事务B修改过了。
幻读(Phantom Read):事务A重新执行一个查询,返回一系列符合查询条件的行,发现其中插入了被事务B提交的行。
第1类丢失更新:事务A撤销时,把已经提交的事务B的更新数据覆盖了。
第2类丢失更新:事务A覆盖事务B已经提交的数据,造成事务B所做的操作丢失。
数据并发访问所产生的问题,在有些场景下可能是允许的,但是有些场景下可能就是致命的,数据库通常会通过锁机制来解决数据并发访问问题,按锁定对象不同可以分为表级锁和行级锁;按并发事务锁定关系可以分为共享锁和独占锁,具体的内容大家可以自行查阅资料进行了解。直接使用锁是非常麻烦的,为此数据库为用户提供了自动锁机制,只要用户指定会话的事务隔离级别,数据库就会通过分析SQL语句然后为事务访问的资源加上合适的锁java 通配符查找文件,此外,数据库还会维护这些锁通过各种手段提高系统的性能,这些对用户来说都是透明的(就是说你不用理解,事实上我确实也不知道)。ANSI/ISO SQL 92标准定义了4个等级的事务隔离级别,如下表所示:
未提交读(Read Uncommitted):允许脏读,也就是可能读取到其他会话中未提交事务修改的数据
提交读(Read Committed):只能读取到已经提交的数据。Oracle等多数数据库默认都是该级别 (不重复读)
可重复读(Repeated Read):可重复读。在同一个事务内的查询都是事务开始时刻一致的,InnoDB默认级别。在SQL标准中,该隔离级别消除了不可重复读,但是还存在幻象读
串行读(Serializable):完全串行化的读,每次读都需要获得表级共享锁,读写相互都会阻塞
需要说明的是,事务隔离级别和数据访问的并发性是对立的,事务隔离级别越高并发性就越差。所以要根据具体的应用来确定合适的事务隔离级别java 通配符查找文件,这个地方没有万能的原则。
18:数据库连接池的介绍?为什么要使用数据库连接池?
(1)数据库连接池的介绍
数据库连接池(Connection pooling)是程序启动时建立足够的数据库连接,并将这些连接组成一个连接池,由程序动态地对池中的连接进行申请,使用,释放。
个人理解:在程序初始化的时候,集中创建多个数据库连接,并把他们集中管理,供程序使用,可以保证较快的数据库读写速度,还更加安全可靠。
(2)为什么要使用数据库连接池?
在我们不使用数据库连接池的时候,每次访问数据库都需要创建连接,使用完成之后需要释放关闭连接,这样是很耗费资源的。当我们使用数据库连接池的时候,在tomcat启动的时候就创建了指定数量的连接,之后当我们程序使用的时候就直接从连接池里面取,不需要创建,当我们使用完成的时候也不需要关闭连接,而是将连接返回到连接池中,供其他请求继续使用。
(3)数据库连接池技术带来的优势
1、资源复用
由于数据库连接得到重用,避免了频繁创建、释放连接引起的大量性能开销.在减少系统消耗的基础上,另一方面也增进了系统运行环境的平稳性(减少内存碎片以及数据库临时进程/线程的数量)。
2、更快的系统响应速度
数据库连接池在初始化过程中,往往已经创建了若干数据库连接至于池中备用。此时连接的初始化工作均已完成。
对于业务请求处理而言,直接利用现有可用连接,避免了数据库连接初始化和释放过程的时间,从而缩减了系统整体响应时间。
3、统一的连接管理,避免数据库连接泄漏
在较为完备的数据库连接池实现中,可根据预先的连接占用超时设定,强制收回被占用连接。 从而避免了常规数据库连接操作中可能出现的资源泄漏。发量的压力下稳定性有所下降,此外不提供连接池监控.
(4)常用的数据库连接池有哪些?分别有什么区别?
DBCP:比较稳定 在具体项目应用中,发现此连接池的持续运行的稳定性还是可以,不过速度稍慢,在大并发量的压力下稳定性有所下降,此外不提供连接池监控
C3P0:性能比较高 在具体项目应用中,发现此连接池的持续运行的稳定性相当不错,在大并发量的压力下稳定性也有一定保证,此外不提供连接池监控。
Druid: Druid提供了一个高效、功能强大、可扩展性好的数据库连接池。可以监控数据库访问性能,提供连接池监控
19:性能分析
20:SQL优化
1)select 子句中避免使用 *, 尽量应该根据业务需求按字段进行查询
2)尽量多使用commit 如对大数据量的分段批量提交释放了资源,减轻了服务器压力
3)在写sql语句的话,尽量保持每次查询的sql语句字段用大写,因为解析sql语句时,总是把小写字母转化为大写字母后再执行
4)sql语句中使用 >= 替换 >
5)尽量避免联查,因为联查,查询数据会比单表查询,多更多数据
6)适度的创建索引。例如:数据一般在 5~6 万条的时候创建索引比较合适。
7)用UNION-ALL 替换UNION,因为UNION-ALL不会过滤重复数据而且不会自动排序,所执行效率要快于UNION。
8) 减少访问数据库的次数。如:如果批量删除多条数据,可以用delete from tableName where id
in (1,2,3) 而不要用多执行delete语句进行删除
9)避免使用LIKE操作符(大数据的全文检索使用luncene或者solr)因为使用like不当,会导致性能问题,原因是like在左右两边都有%的时候,不会使用索引。
10)避免在索引列上使用计算和函数,这样索引就不能使用
11)用NOT EXISTS 或(外连接+判断为空)方案 替换 NOT IN操作符
1、 减少数据访问(减少磁盘访问)
2、 返回更少数据(减少网络传输或磁盘访问)
3、 减少交互次数(减少网络传输)
4、 减少服务器CPU开销(减少CPU及内存开销)
5、 利用更多资源(增加资源)
21:常用的SQL语句
(1)oracle的分页语句
使用rownum,两种如下:
第一种:
select * from (select t.*,rownum row_num from mytable t) b where b.row_num between 1 and 10
第二种:
select * from ( select a.*, rownum rn from mytable a where rownum <= 10 ) where rn >= 1
使用rowid
select * from scott.emp where rowid in (select rd from (select rowid as rd ,rownum as rn from scott.emp ) where rn<=6 and rn>3)
(2)MySQL的分页语句
Select * from table_name?limit?(当前条数,每页条数);
当前条数=(当前页-1)*每页条数
(3)从数据库中随机取50条数据?
select * from (select * from 表名 order by dbms_random.random) where rownum <= 50 select * from table_name order by rand() limit 50;
22:Mybatis中,#{}和${}的区别是什么?
#{}是预编译处理,KaTeX parse error: Expected 'EOF', got '#' at position 22: …替换。 Mybatis在处理#̲{}时,会将sql中的#{}替…{}时,就是把${}替换成变量的值。
使用#{}可以有效的防止SQL注入,提高系统安全性。
23:当实体类中的属性名和表中的字段名不一样,怎么办?
a) 通过在查询的sql语句中定义字段名的别名,让字段名的别名和实体类的属性名一致
b) 通过来映射字段名和实体类属性名的一一对应的关系
24:其他函数
concat(str1,str2)连接两个字符,等同于||(连接符)的效果
lower()转换为小写upper()转换为大写
rtrim|ltrim(str,search)删除右(左)边出现的字符串,参数str为目标字符串search参数为需要删除的指定字符
substr(str,start,count)str为目标字符串,从start开始,取count个,如果count不给值,则截取到最后一位
replace(string,s1,s2)替换字符串,参数string为目标字符串,s1为目标字符,s2为替换字符
reverse(str)反转str字符串的每个字符
to_date(str,格式)将字符串转换为日期类型
to_char(date,格式)将日期或数值类型的参数转换为指定格式的字符串类型
to_number(str)将字符串转换为数值类型