diff --git "a/51 \347\250\213\350\210\234/20231015.md" "b/51 \347\250\213\350\210\234/20231015.md" new file mode 100644 index 0000000000000000000000000000000000000000..8002ff467f62b702554578ad0bb2685a75c2e6cc --- /dev/null +++ "b/51 \347\250\213\350\210\234/20231015.md" @@ -0,0 +1,253 @@ +### 窗口函数 + +窗口函数是MySQL8.0的新增特性 + +非聚合窗口函数:相对于聚合函数来说的,特性为非聚合。一次只处理一行数据 + +窗口聚合函数:窗口聚合函数在单元行上计算某个字段的结果时,可将窗口范围内的数据输入到聚合函数中,并且不会改变行数。 + +#### 语法 + +~~~mysql +窗口函数名称(参数)over (partition by ... order by ... 窗口大小) +-- partition by 分组 等价于 group by +-- order by 排序 +~~~ + +over 没有参数就判断整张表 + +##### 排序函数 + +row_number()、rank() 、dense_rank() + +row_number(): 顺序排序直接占位置 + +rank():并列排序 跳过占位数 + +dense_rank() + +#### 公用表达式 + +with as (子查询) sql语句(select、update、delete) + +#### 日期函数 + +~~~MySQL +-- 获取当前日期 +select curdate(); + +-- 获取当前时间 +select curtime(); + +-- 获取当前日期时间 +select now(); + +-- 从日期字符串获取日期 +select date('2000-02-02'); +select date('2000-02-02 12:12:12'); -- 只获取日期 + +-- 天数差 +select datediff('2001-02-02','2000-02-02'); -- 前减后 + +-- 指定差 +select timestampdiff(day,'2001-02-02','2000-02-02'); -- 后减前 + +-- 日期减法 +select subdate('2001-02-02',interval 2 day); + +-- 日期加法 +select adddate('2001-02-02',interval 2 day); + +-- 获取某日期中的值 +select year('2001-02-02'); +select day('2001-02-02'); +select dayofyear('2001-02-02'); +select dayofweek('2001-02-02'); + +-- 获取该月最后一天 +select last_day('2001-02-02'); + +-- 日期格式 +select date_format('2001-02-02','%Y') + +~~~ + +#### 控制流函数 + +~~~MySQL +-- if(表达式,值1,值2) true返回值1,false返回值2 +select if(1<2,1,2); + +-- ifnull(值1,值2) 如果值1不为null,返回值1,否则返回值2 +select ifnull(null,2); +select ifnull(1,2); + +-- isnull(表达式) 返回1或0 +select isnull(null); +select isnull(''); + +-- nullif(值1,值2) 比较两个值(字符串),如果当等返回null,否则返回值1 +select nullif(25,25); +~~~ + +~~~mysql +-- case when +/* +语法1: +case + when 条件表达式1 then 值1 + when 条件表达式2 then 值2 + ... + else 值n +end + +语法2: +case 表达式 + when 条件值1 then 返回值1 + when 条件值2 then 返回值2 + ... + else 返回值n +end + +*/ +~~~ + +函数一定要有参数 + +### 作业 + +~~~mysql + +create table if not exists `employee` +( + `eid` int not null auto_increment comment '员工id' primary key, + `ename` varchar(20) not null comment '员工名称', + `dname` varchar(50) not null comment '部门名称', + `hiredate` datetime not null comment '入职日期', + `birth` date not null comment '生日', + `salary` double null comment '基本薪资', + `start_sal` double null comment '入职薪资' +); + +insert into `employee` (`ename`, `dname`, `hiredate`,`birth`, `salary`,`start_sal`) values ('傅嘉熙', '开发部', '2002-08-20 12:00:04','1980-12-10', 9000,6500); +insert into `employee` (`ename`, `dname`, `hiredate`, `birth`,`salary`,`start_sal`) values ('武晟睿', '开发部', '2002-06-12 13:54:12', '1984-2-5',9500,6000); +insert into `employee` (`ename`, `dname`, `hiredate`, `birth`,`salary`,`start_sal`) values ('孙弘文', '开发部', '2003-10-16 08:27:06','1979-8-7', 9400,8000); +insert into `employee` (`ename`, `dname`, `hiredate`,`birth`, `salary`,`start_sal`) values ('潘乐驹', '开发部', '2004-04-22 03:56:11','1980-5-12', 9500,6800); +insert into `employee` (`ename`, `dname`, `hiredate`,`birth`, `salary`,`start_sal`) values ('潘昊焱', '人事部', '2007-02-24 03:40:02','1987-2-12', 5000,4500); +insert into `employee` (`ename`, `dname`, `hiredate`,`birth`, `salary`,`start_sal`) values ('沈涛', '人事部', '2012-12-14 09:16:37','1993-4-30', 6000,5500); +insert into `employee` (`ename`, `dname`, `hiredate`, `birth`,`salary`,`start_sal`) values ('江峻熙', '人事部', '2018-05-12 01:17:48','1990-6-8', 5000,3000); +insert into `employee` (`ename`, `dname`, `hiredate`,`birth`, `salary`,`start_sal`) values ('陆远航', '人事部', '2018-04-14 03:35:57','1989-11-13', 5500,5000); +insert into `employee` (`ename`, `dname`, `hiredate`, `birth`,`salary`,`start_sal`) values ('姜煜祺', '销售部', '2020-03-23 03:21:05','1995-1-1', 6000,5500); +insert into `employee` (`ename`, `dname`, `hiredate`, `birth`,`salary`,`start_sal`) values ('邹明', '销售部', '2015-11-23 23:10:06','1996-2-19', 6800,6000); +insert into `employee` (`ename`, `dname`, `hiredate`, `birth`,`salary`,`start_sal`) values ('董擎苍', '销售部', '2012-02-12 07:54:32','1985-10-7', 6500,4800); +insert into `employee` (`ename`, `dname`, `hiredate`,`birth`, `salary`,`start_sal`) values ('钟俊驰', '销售部', '2010-04-10 12:17:06','1981-3-25', 6000,3500); + + +# 员工按工龄,每年增加50元薪水。实发薪资 = 基本薪资 + 工龄 * 50 + + + + +### -- 窗口函数 + + + +#求每个部门的员工总数 +select distinct dname,count(ename) over (partition by dname) 总人数 from employee; + +#求每个部门的平均工资 +select distinct dname,avg(salary) over (partition by dname) 平均工资 from employee; + +#求每个部门的工资排名(从高到低,相同工资并列,并执行跳过排序) +select ename,dname,salary,rank() over (partition by dname order by salary desc) 工资排名 from employee; + +#求公司所有员工的年龄排序(相同年龄并列,执行跳过排序) +select ename,birth,rank() over (order by birth) 年龄排名 from employee; + +#求每个部门的员工工龄排序(相同年龄并列,执行顺序排序) +select ename,row_number() over (order by hiredate) 工龄排名,datediff(now(),hiredate) 工作天数 from employee; + +#计算每个员工的工资与该部门平均工资的差额 +select ename,dname,salary,avg(salary) over (partition by dname) 部门平均工资,salary-avg(salary) over (partition by dname) 差额 from employee; + + + +select * from employee; +#按员工工资进行排序,比较相邻两个员工的工资,输出比较高的工资 +select ename,salary, + max(salary) over ( order by salary rows between current row and 1 following) 工资比较, +from employee; +#按员工工资进行排序,查询当前员工与前一位和后一位的工资平均值 +select ename,salary, + avg(salary) over (order by salary rows between 1 preceding and 1 following) +from employee; +#按员工工资进行排序,查询当前员工至最后一位员工的工资总和 +select ename,salary, + sum(salary) over (order by salary rows between current row and unbounded following ) +from employee; +#计算每个部门内最高薪资与平均薪资的差额 +select distinct dname, + max(salary) over (partition by dname) 最高薪资, + avg(salary) over (partition by dname) 平均薪资, + max(salary) over (partition by dname)-avg(salary) over (partition by dname) as 差额 +from employee; + +#找出各部门年薪第二高的员工 +select a.dname,a.salary,a.排名 from + (select dname,salary,dense_rank() over (partition by dname order by salary) 排名 from employee) a +where a.排名 =2; +#查询各部门中 小于等于当前员工实际薪资的比例 +select ename,salary,cume_dist() over (partition by dname order by salary) as 员工实际薪资的比例 from employee; + +#查询每个员工工资在全部员工中的排名比例 +select ename,salary,sum(salary) over (order by salary) 总工资,salary/sum(salary) over () as 排名比例 from employee; +#查询每个部门工资排名在前25%的员工记录数 +select * from employee where eid in( + select eid from + (select eid,dname,cume_dist() over (order by salary) 工资比例 from employee) as a +where a.工资比例 >= 0.25); +#每个部门按年龄进行排序,求当前员工与前一位员工的年龄差 +select ename,birth, + datediff(lag(birth,1) over (order by birth),birth) 年龄差 +from employee; +#按入职日期进行排序,查询公司每个员工与后面一个员工的入职天数差异 +select ename,hiredate, + datediff(lead(hiredate,1) over (order by hiredate),hiredate) 入职天数差异 +from employee; +#将每个部门的员工按工资平均分为2个组,组1为低工资,组2为高工资 +select ename,dname,salary, + ntile(2) over (partition by dname order by salary) 等级 +from employee; +#将所有员工按照工龄分为4个组,并统计每个组的人数 +select *,count(工龄组) over(partition by 工龄组) 组的人数 + from +(select ename,hiredate,ntile(4) over (order by hiredate) 工龄组 from employee) a; +#将员工按照工资分为3个组,并统计组别,每组平均工资,工资范围(first_value、last_value) +select *,avg(salary) over (partition by 组别) as 每组平均工资, + concat_ws(' - ',first_value(salary) over(partition by 组别),last_value(salary) over(partition by 组别)) as 每组工资范围 + from +(select ename,salary,ntile(3) over (order by salary ) as 组别 from employee) a; + +### -- 非窗口函数 + +#按照工龄区分等级,小于5年为新员工,5-15年为老员工,大于15年为骨灰级员工,输出姓名,部门,工龄,级别 +select ename,dname,hiredate,(datediff(now(),hiredate)/365) as 工龄, + case when (datediff(now(),hiredate)/365) < 5 then '新员工' + when (datediff(now(),hiredate)/365) < 15 then '老员工' + else '骨灰级员工' end as 级别 +from employee; +#返回员工的实际年龄,如果小于当前日期则减1岁 +select ename,dname,floor((datediff(now(),birth)/365)) as 年龄 from employee; + + +select * from employee; +#求每个员工还有多少天过生日,并返回下次生日是星期几 +select ename, + abs(datediff(concat_ws('-',year(curdate()),month(birth),day(birth)),curdate())) as 距离生日天数, + date_format(concat_ws('-',year(curdate())+1,month(birth),day(birth)),'%W') as 下次生日星期 +from employee; + +#求每个员工当前实发工资与入职时工资的增长率,输出员工姓名,部门,入职工资,实际工资,增长率 +select ename,dname,hiredate,salary,round((salary-start_sal) / start_sal,2) as 增长率 from employee + +~~~ \ No newline at end of file diff --git "a/51 \347\250\213\350\210\234/20231017.md" "b/51 \347\250\213\350\210\234/20231017.md" new file mode 100644 index 0000000000000000000000000000000000000000..5644388a956f38cfacbeb89397dca5e72bb21ecc --- /dev/null +++ "b/51 \347\250\213\350\210\234/20231017.md" @@ -0,0 +1,78 @@ +## 1017 窗口函数复习 + +~~~mysql +timestampdiff(单位,a,b) -- 时间差 -- 可计算年差,月差,天数,时差,分差,秒差,毫秒差 -- b-a +~~~ + +## 索引预习笔记 + +索引是对数据库表中一列或多列的值进行排序的一种结构。MySQL索引的建立对于MySQL的高效运行是很重要的,索引可以大大提高MySQL的检索速度。索引只是提高效率的一个因素,如果你的MySQL有大数据量的表,就需要花时间研究建立最优秀的索引,或优化查询语句。 + +#### 索引优点 + +1. 索引大大减小了服务器需要扫描的数据量,从而大大加快数据的检索速度,这也是创建索引的最主要的原因。 +2. 索引可以帮助服务器避免排序和创建临时表 +3. 索引可以将随机IO变成顺序IO +4. 索引对于InnoDB(对索引支持行级锁)非常重要,因为它可以让查询锁更少的元组,提高了表访问并发性 +5. 关于InnoDB、索引和锁:InnoDB在二级索引上使用共享锁(读锁),但访问主键索引需要排他锁(写锁) +6. 通过创建唯一性索引,可以保证数据库表中每一行数据的唯一性。 +7. 可以加速表和表之间的连接,特别是在实现数据的参考完整性方面特别有意义。 +8. 在使用分组和排序子句进行数据检索时,同样可以显著减少查询中分组和排序的时间。 +9. 通过使用索引,可以在查询的过程中,使用优化隐藏器,提高系统的性能。 + +#### 索引缺点 + +1. 创建索引和维护索引要耗费时间,这种时间随着数据量的增加而增加 +2. 索引需要占物理空间,除了数据表占用数据空间之外,每一个索引还要占用一定的物理空间,如果需要建立聚簇索引,那么需要占用的空间会更大 +3. 对表中的数据进行增、删、改的时候,索引也要动态的维护,这就降低了整数的维护速度 +4. 如果某个数据列包含许多重复的内容,为它建立索引就没有太大的实际效果。 +5. 对于非常小的表,大部分情况下简单的全表扫描更高效; + +#### 创建索引准则 + +索引是建立在数据库表中的某些列的上面。因此,在创建索引的时候,应该仔细考虑在哪些列上可以创建索引,在哪些列上不能创建索引。 + +##### 应该创建索引的列 + +1. 在经常需要搜索的列上,可以加快搜索的速度 +2. 在作为主键的列上,强制该列的唯一性和组织表中数据的排列结构 +3. 在经常用在连接(JOIN)的列上,这些列主要是一外键,可以加快连接的速度 +4. 在经常需要根据范围(<,<=,=,>,>=,BETWEEN,IN)进行搜索的列上创建索引,因为索引已经排序,其指定的范围是连续的 +5. 在经常需要排序(order by)的列上创建索引,因为索引已经排序,这样查询可以利用索引的排序,加快排序查询时间; +6. 在经常使用在WHERE子句中的列上面创建索引,加快条件的判断速度。 + +##### 不该创建索引的列 + +- 对于那些在查询中很少使用或者参考的列不应该创建索引。 +- 若列很少使用到,因此有索引或者无索引,并不能提高查询速度。相反,由于增加了索引,反而降低了系统的维护速度和增大了空间需求。 +- 对于那些只有很少数据值或者重复值多的列也不应该增加索引。 +- 这些列的取值很少,例如人事表的性别列,在查询的结果中,结果集的数据行占了表中数据行的很大比例,即需要在表中搜索的数据行的比例很大。增加索引,并不能明显加快检索速度。 +- 对于那些定义为text, image和bit数据类型的列不应该增加索引。 +- 这些列的数据量要么相当大,要么取值很少。 +- 当该列修改性能要求远远高于检索性能时,不应该创建索引。(修改性能和检索性能是互相矛盾的) + +#### 索引语法 + +##### 索引分类 + +- 主键索引 不允许重复,不允许为null + +~~~mysql + ALTER TABLE TableName ADD PRIMARY KEY(column_list); +~~~ + +- 唯一索引 数据列不允许重复,允许为 NULL 值,一张表可有多个唯一索引,索引列的值必须唯一,但允许有空值。如果是组合索引,则列值的组合必须唯一。 + +~~~mysql +CREATE UNIQUE INDEX IndexName ON `TableName`(`字段名`(length)); +# 或者 +ALTER TABLE TableName ADD UNIQUE (column_list); +~~~ + +- 普通索引:一张表可以创建多个普通索引,一个普通索引可以包含多个字段,允许数据重复,允许 NULL 值插入; + +~~~mysql +CREATE INDEX IndexName ON `TableName`(`字段名`(length)); +# 或者 +ALTER TABLE TableName ADD INDEX IndexName(`字段名`(length)); +~~~ \ No newline at end of file diff --git "a/51 \347\250\213\350\210\234/20231019.md" "b/51 \347\250\213\350\210\234/20231019.md" new file mode 100644 index 0000000000000000000000000000000000000000..03b4656acce8f87c8850d9e1faf027848e3a1378 --- /dev/null +++ "b/51 \347\250\213\350\210\234/20231019.md" @@ -0,0 +1,21 @@ +### 子查询三大用法 + + 1. 放在 select 后当列使用,要求子查询单列单行。 + 1. 放在 from 后面 当表使用,要给子查询取别名。 + 3. 放在 where 后面当条件使用 + - 单列单行:此时条件可以直接用 = > < <> 等。 + - 单列多行:就需要使用 in any all 等。 + +### count 的使用 + + 1. count(*) 查询所有,包括 null + 1. count(常量) 查询所有,包括 null + 1. count(列名) 返回列名指定列的记录数,不包括 null + +##### count(*)&count(1)&count(列名)执行效率比较: + +- 如果列为主键,count(列名)效率优于count(1) +- 如果列不为主键,count(1)效率优于count(列名) +- 如果表中存在主键,count(主键列名)效率最优 +- 如果表中只有一列,则count(*)效率最优 +- 如果表有多列,且不存在主键,则count(1)效率优于count(*) \ No newline at end of file diff --git "a/51 \347\250\213\350\210\234/20231024.md" "b/51 \347\250\213\350\210\234/20231024.md" new file mode 100644 index 0000000000000000000000000000000000000000..4c98de217717e0398c19a8ac1c79d4d0916b8d9d --- /dev/null +++ "b/51 \347\250\213\350\210\234/20231024.md" @@ -0,0 +1,289 @@ +# 数据库高级复习 + +### 表之间的关系 + +1.一对一的关系:将其中任一表中主键,放到另一个表当外键; + +2.一对多的关系:将一所在的表的主键,放到多的表当外键; + +3.多对多的关系:必须第三张表,将前面两个表的主键放进来当外键 + + + +### 数据库设计的方法 + +1.直观设计法; + +2.规范设计法:E-R模型; + +3.计算机辅助设计法:PowerDesigner + + + +### E-R图 + +E-R图:实体关系图 + +要素:实体(表)、属性(字段)、关系(类似外键约束) + +绘图软件推荐:visio等 + + + +### 数据库的范式 + +1.第一范式:要求字段的内容,不可再分割,为的是保证数据的原子性 + +2.第二范式:要求在满足第一范式的基础上,要求非主键字段要完全依赖主键(非主键,要依赖整个联合主键),而不能只依赖部分 + +3.第三范式:满足于第二范式的前提上,要求,非关键属性要直接依赖于主键 + +补充:所谓几对几是表中数据相对,不是一整张表相对 + + + +### 概念模型 + +一个软件:PowerDesigner + +第一步,创建概念模型(类似ER图)CDM(以用户的角度) + +第二步,转换成逻辑模型 LDM(以计算机角度) + +第三步,转换成物理模型 PDM(以数据库角度) + +第四步,生成DDL + + + +### RBAC + +基于角色访问控制(Role-Based Access Control) + +数据库能存什么: + +1.业务数据表:用户、商品; + +2.功能资源表:菜单信息表、页面代码表 + +权限的使用场景: + +网页不一样;网页一样,但可用的菜单不一样;菜单一样,但同一个菜单下的网页元素也可能不一样(按钮,数据不一样,权限一样); + +菜单权限:不同的用户登录系统后,展开的菜单不一样; + +按钮权限:不同的用户查看同一个对象时,展示的按钮不一样; + +数据权限:不同用户查看同一个对象时,可见的数据不一样; + +操作权限:能看到,却操作不了; + +文件资源的权限 + +学习RBAC需要掌握的要素: + +RBAC的核心是角色; + +RBAC是目前开发系统中主流的设计模式 + + + +### SKU + +最小存货单位(Stock Keeping Unit),即库存进出计量的基本单元,可以是以件,盒,托盘等为单位 + +针对电商而言,SKU有另外的注解: + +1、SKU是指一款商品,每款都有出现一个SKU,便于电商品牌识别商品; + +2、一款商品多色,则是有多个SKU,例:一件衣服,有红色、白色、蓝色,则SKU编码也不相同,如相同则会出现混淆,发错货 + + + +### 视图view + +1.视图是一种虚拟表,本身是不具有数据的,占用很少的内存空间 + +2.视图建立在已有的基础上,视图耐以建立的这些表叫做基表 + +3.将过滤后的数据,保存成一个视图,有利于数据的安全性 + +4.语法: + +create view 视图名称 + +as 查询语句 + +5.视图只有视图和基表有一对一的情况可以更新,一对多或者多对多不可更新(一般情况下不会去更新视图) + +6.当我们创建好一张视图后,还可以在它基础上再创建视图 + +7.更新视图: + +方法1:使用create or replace view子句修改视图,有这个视图就更新,没有就创建 + +方法2:alter view 视图名称 as select 语句,前提是被修改的视图要先存在 + +8.删除视图:drop view 视图名称 + +9.总结: + +(1)创建视图: + +第一种:create view 视图名称 as select 语句 + +第二种:create view 视图的名称(视图的字段)as select 语句 字段数要与select语句结果的字段数一致 + +(2)查询视图: + +第一种:select * from 视图名称 + +第二种:select 指定的字段名 from 视图名称 + +(3)修改视图: + +第一种:使用create or replace view子句修改视图,有这个视图就更新,没有就创建 + +第二种:alter view 视图名称 as select 语句,前提是被修改的视图要先存在 + +(4)删除视图:drop view 视图名称 + + + +### 数值函数 + +基本函数: + +1.rand()返回大于等于0且小于1的小数--【0,1) + +select floor(rand()*10);随机生成一个【0,9】的数 + +2.length(s)返回字符串s的字节数,和字符集有关 utf8 一个汉字=3个字节 + +3.拼接字符串用concat() + +concant_ws() + +4.trim()去掉字符串两端的空格 + +rtrim()去掉字符串右端的空格 + +ltrim()去掉字符串左端的空格 + +5.替换:replace(原始字符串,要被替换的字符串,新字符串) + +6.upper()把字母全部转化成大写字母 + +lower()把字母全部转化成小写字母 + +7.从一个字符串中取出对应的部分字符串:left(字符串,长度N)从字符串的左边开始,截取对应长度N的字符 + +right(字符串,长度N)从字符串的右边开始截取对应长度N的字符 + +8.直接从某个字符串中截取指定位置指定长度的字符串的函数有三个:substr(str,index,len),substring(),mid() + +9.去除xx中的全部空格:replace(字段名,'','') from .. + +10.if(表达式,值1,值2)类似我们三元运算符 + +11.substring_index(字段名,'',count) + + + +### 存储过程 + +1.存储过程(Stored Procedure)是一种在数据库中存储复杂程序,以便外部程序调用的一种数据库对象; + +2.存储过程是为了完成特定功能的SQL语句集,经编译创建并保存在数据库中,用户可通过指定存储过程的名字并给定参数(需要时)来调用执行; + +3.存储过程思想上很简单,就是数据库 SQL 语言层面的代码封装与重用; + +4.优点: + +存储过程可封装,并隐藏复杂的商业逻辑; + +存储过程可以回传值,并可以接受参数; + +存储过程无法使用 SELECT 指令来运行,因为它是子程序,与查看表,数据表或用户定义函数不同; + +存储过程可以用在数据检验,强制实行商业逻辑等; + +5.缺点: + +存储过程,往往定制化于特定的数据库上,因为支持的编程语言不同。当切换到其他厂商的数据库系统时,需要重写原有的存储过程; + +存储过程的性能调校与撰写,受限于各种数据库系统; + +6.存储过程的创建和调用: + +存储过程就是具有名字的一段代码,用来完成一个特定的功能; + +创建的存储过程保存在数据库的数据字典中。 + + + +### 索引 + +索引(index)是帮助MySQL高效获取数据的数据结构 + +如果不使用索引,MySQL必须从第一条记录开始读完整个表,直到找出相关的行,表越大,查询数据所花费的时间就越多 + +建立索引要花费对应的时间和硬盘空间 + +优点:提高数据检索的效率,降低数据库的IO成本(提升了select速度) + +缺点:降低了insert,update,delete速度,索引列也是要占用空间的。索引大大提高了查询效率。同时却也降低更新表的速度 + +索引的分类 + +单列索引:一个索引建立在一个列上,一张表可以拥有多个单列索引 + +联合索引:可以同时为多个列创建一个索引 + +普通索引:index 单纯地为了提高搜索效率 + +唯一索引:unique index + +主键索引:primary key 唯一性,非空主键约束,不能重复,也不能null,一个只能有一个主键,create index不能用来创建主键索引 + +查看表的索引:show index from tb_1; + +唯一索引:建立列的唯一约束时,会自动创建唯一的索引,索引名就是列名 + +创建主键索引就是创建主键约束 + + + +### 什么是事务? + +事务指的是一个操作序列,该操作序列中的多个操作要么都做,要么都不做,是一个不可分割的工作单位,是数据库环境中的逻辑工作单位,由DBMS(数据库管理系统)中的事务管理子负者事务的处理 + +### 事务的特性 + +事务处理可以确保除非事务性序列内的所有操作都成功完成,否则不会永久更新面向数据的资源。通过将一组相关操作组合为一个要么全部成功要么全部失败的序列,可以简化错误恢复并使应用程序更加可靠 + +但不是所有的操作序列都可以称为事务,这是因为一个操作序列要成为事务,必须满足事务的原子性、一致性、隔离性和持久性。这四个特性简称为ACID特性 + +### 事务的四个特性 + +1.原子性:事务中的所有操作可以看做一个原子(自然界最小的颗粒,具有不可再分的特性),事务是应用中不可再分的最小的逻辑执行体。使用事务对数据进行修改的操作序列,要么全部执行,要么全不执行 + +2.一致性:是指事务执行的结果必须使数据库从一个一致性状态,变到另一个一致性状态。当数据库中只能包含事务成功提交的结果时,数据库处于一致性状态。一致性是通过原子性来保证的 + +例如:在转账时,只有保证转出和转入的金额一致才能构成事务。也就是说事务发生前和发生后,数据的总额依然匹配 + +3.隔离性:是指各个事务的执行互不干扰,任意一个事务的内部操作对其他并发的事务都是隔离的。也就是说:并发执行的事务之间既不能看到对方的中间状态,也不能相互影响 + +例如:在转账时,只有当A账户中的转出和B账户中转入操作都执行成功后才能看到A账户中的金额减少以及B账户中的金额增多。并且其他的事务对于转账操作的事务是不能产生任何影响的 + +4.持久性:持久性指事务一旦提交,对数据所做的任何改变,都要记录到永久存储器中,通常是保存进物理数据库,即使数据库出现故障,提交的数据也应该能够恢复。但如果是由于外部原因导致的数据库故障,如硬盘被损坏,那么之前提交的数据则有可能会丢失 + +### 事务并发问题 + +脏读(Dirty read):当一个事务正在访问数据并且对数据进行了修改,而这种修改还没有提交到数据库中,这时另外一个事务也访问了这个数据,然后使用了这个数据。因为这个数据是还没有提交的数据,那么另外一个事务读到的这个数据是"脏数据",依据"脏数据"所做的操作可能是不正确的 + +不可重复读(Unrepeatableread):指在一个事务内多次读同一个数据。在这个事务还没有结束时,另一个事务也访问该数据。那么,在第一个事务中的两次读数据之间,由于第二个事务的修改导致第一个事务两次读取的数据可能不太一样。这就发生了在一个事务内两次读到的数据是不一样的情况。因此称为不可重复读 + +幻读(Phantom read):幻读与不可重复读类似。它发生在一个事务读取了几行数据,接着另一个并发事务插入了一些数据时。在随后的查询中,第一个事务就会发现多了一些原本吧存在的记录,就好像发生了幻觉一样,所以称为幻读 + +串行 \ No newline at end of file diff --git "a/51 \347\250\213\350\210\234/20231025.md" "b/51 \347\250\213\350\210\234/20231025.md" new file mode 100644 index 0000000000000000000000000000000000000000..4c98de217717e0398c19a8ac1c79d4d0916b8d9d --- /dev/null +++ "b/51 \347\250\213\350\210\234/20231025.md" @@ -0,0 +1,289 @@ +# 数据库高级复习 + +### 表之间的关系 + +1.一对一的关系:将其中任一表中主键,放到另一个表当外键; + +2.一对多的关系:将一所在的表的主键,放到多的表当外键; + +3.多对多的关系:必须第三张表,将前面两个表的主键放进来当外键 + + + +### 数据库设计的方法 + +1.直观设计法; + +2.规范设计法:E-R模型; + +3.计算机辅助设计法:PowerDesigner + + + +### E-R图 + +E-R图:实体关系图 + +要素:实体(表)、属性(字段)、关系(类似外键约束) + +绘图软件推荐:visio等 + + + +### 数据库的范式 + +1.第一范式:要求字段的内容,不可再分割,为的是保证数据的原子性 + +2.第二范式:要求在满足第一范式的基础上,要求非主键字段要完全依赖主键(非主键,要依赖整个联合主键),而不能只依赖部分 + +3.第三范式:满足于第二范式的前提上,要求,非关键属性要直接依赖于主键 + +补充:所谓几对几是表中数据相对,不是一整张表相对 + + + +### 概念模型 + +一个软件:PowerDesigner + +第一步,创建概念模型(类似ER图)CDM(以用户的角度) + +第二步,转换成逻辑模型 LDM(以计算机角度) + +第三步,转换成物理模型 PDM(以数据库角度) + +第四步,生成DDL + + + +### RBAC + +基于角色访问控制(Role-Based Access Control) + +数据库能存什么: + +1.业务数据表:用户、商品; + +2.功能资源表:菜单信息表、页面代码表 + +权限的使用场景: + +网页不一样;网页一样,但可用的菜单不一样;菜单一样,但同一个菜单下的网页元素也可能不一样(按钮,数据不一样,权限一样); + +菜单权限:不同的用户登录系统后,展开的菜单不一样; + +按钮权限:不同的用户查看同一个对象时,展示的按钮不一样; + +数据权限:不同用户查看同一个对象时,可见的数据不一样; + +操作权限:能看到,却操作不了; + +文件资源的权限 + +学习RBAC需要掌握的要素: + +RBAC的核心是角色; + +RBAC是目前开发系统中主流的设计模式 + + + +### SKU + +最小存货单位(Stock Keeping Unit),即库存进出计量的基本单元,可以是以件,盒,托盘等为单位 + +针对电商而言,SKU有另外的注解: + +1、SKU是指一款商品,每款都有出现一个SKU,便于电商品牌识别商品; + +2、一款商品多色,则是有多个SKU,例:一件衣服,有红色、白色、蓝色,则SKU编码也不相同,如相同则会出现混淆,发错货 + + + +### 视图view + +1.视图是一种虚拟表,本身是不具有数据的,占用很少的内存空间 + +2.视图建立在已有的基础上,视图耐以建立的这些表叫做基表 + +3.将过滤后的数据,保存成一个视图,有利于数据的安全性 + +4.语法: + +create view 视图名称 + +as 查询语句 + +5.视图只有视图和基表有一对一的情况可以更新,一对多或者多对多不可更新(一般情况下不会去更新视图) + +6.当我们创建好一张视图后,还可以在它基础上再创建视图 + +7.更新视图: + +方法1:使用create or replace view子句修改视图,有这个视图就更新,没有就创建 + +方法2:alter view 视图名称 as select 语句,前提是被修改的视图要先存在 + +8.删除视图:drop view 视图名称 + +9.总结: + +(1)创建视图: + +第一种:create view 视图名称 as select 语句 + +第二种:create view 视图的名称(视图的字段)as select 语句 字段数要与select语句结果的字段数一致 + +(2)查询视图: + +第一种:select * from 视图名称 + +第二种:select 指定的字段名 from 视图名称 + +(3)修改视图: + +第一种:使用create or replace view子句修改视图,有这个视图就更新,没有就创建 + +第二种:alter view 视图名称 as select 语句,前提是被修改的视图要先存在 + +(4)删除视图:drop view 视图名称 + + + +### 数值函数 + +基本函数: + +1.rand()返回大于等于0且小于1的小数--【0,1) + +select floor(rand()*10);随机生成一个【0,9】的数 + +2.length(s)返回字符串s的字节数,和字符集有关 utf8 一个汉字=3个字节 + +3.拼接字符串用concat() + +concant_ws() + +4.trim()去掉字符串两端的空格 + +rtrim()去掉字符串右端的空格 + +ltrim()去掉字符串左端的空格 + +5.替换:replace(原始字符串,要被替换的字符串,新字符串) + +6.upper()把字母全部转化成大写字母 + +lower()把字母全部转化成小写字母 + +7.从一个字符串中取出对应的部分字符串:left(字符串,长度N)从字符串的左边开始,截取对应长度N的字符 + +right(字符串,长度N)从字符串的右边开始截取对应长度N的字符 + +8.直接从某个字符串中截取指定位置指定长度的字符串的函数有三个:substr(str,index,len),substring(),mid() + +9.去除xx中的全部空格:replace(字段名,'','') from .. + +10.if(表达式,值1,值2)类似我们三元运算符 + +11.substring_index(字段名,'',count) + + + +### 存储过程 + +1.存储过程(Stored Procedure)是一种在数据库中存储复杂程序,以便外部程序调用的一种数据库对象; + +2.存储过程是为了完成特定功能的SQL语句集,经编译创建并保存在数据库中,用户可通过指定存储过程的名字并给定参数(需要时)来调用执行; + +3.存储过程思想上很简单,就是数据库 SQL 语言层面的代码封装与重用; + +4.优点: + +存储过程可封装,并隐藏复杂的商业逻辑; + +存储过程可以回传值,并可以接受参数; + +存储过程无法使用 SELECT 指令来运行,因为它是子程序,与查看表,数据表或用户定义函数不同; + +存储过程可以用在数据检验,强制实行商业逻辑等; + +5.缺点: + +存储过程,往往定制化于特定的数据库上,因为支持的编程语言不同。当切换到其他厂商的数据库系统时,需要重写原有的存储过程; + +存储过程的性能调校与撰写,受限于各种数据库系统; + +6.存储过程的创建和调用: + +存储过程就是具有名字的一段代码,用来完成一个特定的功能; + +创建的存储过程保存在数据库的数据字典中。 + + + +### 索引 + +索引(index)是帮助MySQL高效获取数据的数据结构 + +如果不使用索引,MySQL必须从第一条记录开始读完整个表,直到找出相关的行,表越大,查询数据所花费的时间就越多 + +建立索引要花费对应的时间和硬盘空间 + +优点:提高数据检索的效率,降低数据库的IO成本(提升了select速度) + +缺点:降低了insert,update,delete速度,索引列也是要占用空间的。索引大大提高了查询效率。同时却也降低更新表的速度 + +索引的分类 + +单列索引:一个索引建立在一个列上,一张表可以拥有多个单列索引 + +联合索引:可以同时为多个列创建一个索引 + +普通索引:index 单纯地为了提高搜索效率 + +唯一索引:unique index + +主键索引:primary key 唯一性,非空主键约束,不能重复,也不能null,一个只能有一个主键,create index不能用来创建主键索引 + +查看表的索引:show index from tb_1; + +唯一索引:建立列的唯一约束时,会自动创建唯一的索引,索引名就是列名 + +创建主键索引就是创建主键约束 + + + +### 什么是事务? + +事务指的是一个操作序列,该操作序列中的多个操作要么都做,要么都不做,是一个不可分割的工作单位,是数据库环境中的逻辑工作单位,由DBMS(数据库管理系统)中的事务管理子负者事务的处理 + +### 事务的特性 + +事务处理可以确保除非事务性序列内的所有操作都成功完成,否则不会永久更新面向数据的资源。通过将一组相关操作组合为一个要么全部成功要么全部失败的序列,可以简化错误恢复并使应用程序更加可靠 + +但不是所有的操作序列都可以称为事务,这是因为一个操作序列要成为事务,必须满足事务的原子性、一致性、隔离性和持久性。这四个特性简称为ACID特性 + +### 事务的四个特性 + +1.原子性:事务中的所有操作可以看做一个原子(自然界最小的颗粒,具有不可再分的特性),事务是应用中不可再分的最小的逻辑执行体。使用事务对数据进行修改的操作序列,要么全部执行,要么全不执行 + +2.一致性:是指事务执行的结果必须使数据库从一个一致性状态,变到另一个一致性状态。当数据库中只能包含事务成功提交的结果时,数据库处于一致性状态。一致性是通过原子性来保证的 + +例如:在转账时,只有保证转出和转入的金额一致才能构成事务。也就是说事务发生前和发生后,数据的总额依然匹配 + +3.隔离性:是指各个事务的执行互不干扰,任意一个事务的内部操作对其他并发的事务都是隔离的。也就是说:并发执行的事务之间既不能看到对方的中间状态,也不能相互影响 + +例如:在转账时,只有当A账户中的转出和B账户中转入操作都执行成功后才能看到A账户中的金额减少以及B账户中的金额增多。并且其他的事务对于转账操作的事务是不能产生任何影响的 + +4.持久性:持久性指事务一旦提交,对数据所做的任何改变,都要记录到永久存储器中,通常是保存进物理数据库,即使数据库出现故障,提交的数据也应该能够恢复。但如果是由于外部原因导致的数据库故障,如硬盘被损坏,那么之前提交的数据则有可能会丢失 + +### 事务并发问题 + +脏读(Dirty read):当一个事务正在访问数据并且对数据进行了修改,而这种修改还没有提交到数据库中,这时另外一个事务也访问了这个数据,然后使用了这个数据。因为这个数据是还没有提交的数据,那么另外一个事务读到的这个数据是"脏数据",依据"脏数据"所做的操作可能是不正确的 + +不可重复读(Unrepeatableread):指在一个事务内多次读同一个数据。在这个事务还没有结束时,另一个事务也访问该数据。那么,在第一个事务中的两次读数据之间,由于第二个事务的修改导致第一个事务两次读取的数据可能不太一样。这就发生了在一个事务内两次读到的数据是不一样的情况。因此称为不可重复读 + +幻读(Phantom read):幻读与不可重复读类似。它发生在一个事务读取了几行数据,接着另一个并发事务插入了一些数据时。在随后的查询中,第一个事务就会发现多了一些原本吧存在的记录,就好像发生了幻觉一样,所以称为幻读 + +串行 \ No newline at end of file