【软考】 4 数据库_jkfg-程序员宅基地

技术标签: 软考  数据库  

4.1 基本概念

数据库系统DBS、数据库管理系统DBMS、数据库管理员DBA

4.1.1 三级模式、两级映像

  • 内模式:管理如何存储物理数据,对应具体物理存储文件

  • 概念模式:通常使用的基本表,根据应用、需求将物理数据划分成一张张表

  • 外模式:对应数据库的视图,将表处理后提供给用户使用

  • 外模式-概念模式:表和视图的映射,修改了表中数据,只需要修改此映射,无需修改应用程序

  • 概念模式-内模式:表和数据的物理存储的映射,修改了数据存储方式,只需修改此映射,无需修改应用程序

4.1.2 数据库设计

  • 需求分析:分析数据存储的要求。产出数据流图、数据字典、需求说明书
  • 概念结构设计:设计E-R图(实体-属性图),与物理实现无关
  • 逻辑结构设计:将E-R图转换为关系模式,即实际的表和表中的列属性
  • 物理设计:根据生成的表等概念,生成物理数据库

4.2 模型

4.2.1 E-R模型

数据模型三要素:数据结构(所研究对象类型的集合)、数据操作(对数据库中各种对象的实例允许执行的操作的集合)、数据的约束条件(一组完整性规则的集合)

E-R模型:实体-联系模型,椭圆表示属性(一般没有)、矩形表示实体、菱形表示联系、联系两端要标注联系类型

联系类型:1:1、1:n、m:n

属性分类:简单属性和复合属性(属性是否可以分割)、单值属性和多值属性(属性有多个取值)、NULL属性、派生属性(由其他属性生成)

4.2.2 关系模型

即数据库中的表,包括实体的属性,标示出实体的主键和外键
S(Sno, Sname, SDm Sagem Sex)学生
T(Tno, Tname, Age, Sex)教师
C(Cno, Cname, Pcno)课程
SC(Sno, Cno, Grade)学生选课

4.2.3 模型转换

E-R图的每个实体都对应一个关系模式

  • 1:1联系:联系可以放到任意两端的实体中,作为一个属性(要保证一对一的两端关联)
  • 1:n的联系:联系可以单独作为一个关系模式,也可以在n端加入1端实体的主键
  • m:n的联系:联系必须作为一个单独的关系模式,其主键是m端和n端的联合主键(多个实体的关键字)

4.3 关系代数

  • 笛卡尔积:S1 X S2,产生的结果包括S1和S2的所有属性列,并且S1中每条记录一次和S2中所有记录组合成一条记录,最终属性列为S1+S2属性列,记录数为S1*S2记录数
  • 投影:按条件选择某关系模式中的某列,可以用数字表示
  • 选择:按条件选择某关系模式中的某条记录
  • 自然连接:显示全部的属性列,但相同属性列只显示一次,显示两个关系模式中属性相同且值相同的记录自然连接

关系代数

4.4 规范化

4.4.1 函数依赖

给定一个X能唯一确定一个Y,就称X确定Y,或者说Y依赖于X,例如Y = X * X函数
完全函数依赖:AB能得出C,通过A、B单独不能得出C,则C完全依赖于AB
部分函数依赖:AB能得出C,AB中的一部分(A或B)也可以确定C**,称为部分函数依赖
传递函数依赖:AB不等价,A可确定B,B可确定C,则A可确定C,为传递函数依赖。若A和B等价,则不存在传递

4.4.2 键与约束

超键:能唯一标识此表的属性的组合
候选键:超键中去掉冗余的属性,剩下的属性为候选键
主键:任意一个候选键
外键:其他表的主键
主属性:候选键内的属性为主属性,其他为非主属性

实体完整性约束:主键约束,主键值不能为空,也不能重复
参照完整性约束:外键约束,外键必须是其他表中存在的值,或者为空
用户自定义完整性约束:自定义表达式约束

4.4.3 范式

  • 第一范式:所有属性不可分
  • 第二范式:非主属性都完全依赖于主属性,比如候选键是单属性(单属性不可能存在部分函数依赖),消除部分依赖
  • 第三范式:非主属性没有传递依赖与候选键。解决方式是拆分传递依赖的非主属性为一个新的关系模式。本质就是主键要直接决定所有非主属性,不能通过非主属性间接决定,消除传递依赖
  • BC范式:R属于BCNF当且仅当其中每个依赖的决定因素必定包含R的某个候选码
    在这里插入图片描述
    在这里插入图片描述

从入度为零的节点寻找能遍历整个图的属性,就是候选字

4.4.4 模式分解

范式之间的转换一般是拆分属性,即模式分解。将具有部分函数依赖和传递依赖的属性分离出来

  • 保持函数依赖分解
    • 对于关系模式R,有依赖集F,若对R进行分解,分解出来的多个关系模式,保持原来的依赖集不变,则为保持函数依赖的分解。另外要注意要消除冗余依赖
      在这里插入图片描述
  • 无损分解:分解后的关系模式能还原出原关系模式在这里插入图片描述
  • 定理:R的分解为{R1, R2},分解为无损分解的充要条件是R1交R2等于R1-R2,或R1交R2等于R2-R1在这里插入图片描述

4.5 事务并发

4.5.1 事务

事务提交commit、事务回滚rollback
事务由一系列操作组成,要么全做要么全不做
特点

  • 原子性(操作):要么全做、要么不做
  • 一致性(数据):事物发生后数据是一致的
  • 隔离性(执行):任一事务的更新操作直到其成功提交的整个过程对其他事务都是不可见的,互不干涉
  • 持续性(改变):事务操作的结果是持续性的

4.5.2 并发控制

事务是并发控制的前提条件
三个问题:

  • 丢失更新
  • 不可重复读
  • 读脏数据

三级封锁协议
X锁:排它锁,可读写其他事务不能加任何锁
S锁:共享锁,只能读其他事务只能加共享锁

一级封锁协议:修改前必须先加X锁,事务结束释放,解决丢失更新
二级封锁协议:以及的基础上读数据前先加S锁,读完后释放,解决丢失更新、读脏数据
三级封锁协议:二级加S锁后事务结束才释放,解决丢失更新、读脏数据、数据重复读

4.6 故障备份

完全备份:备份所有数据
差量备份:备份上一次完全备份后变化的数据
增量备份:备份上一次备份后变化的数据
把所有操作写入日志文件,把数据缓冲区内容写入数据文件

4.6.1 分布式数据库

分片模式:

  • 水平分片:将表中水平的记录分别存放在不同地方
  • 垂直分片:将表中的垂直的列分别存放在不同的地方

分布透明性:

  • 分片透明性:用户或程序不需要知道逻辑上访问的是如何分块存储的
  • 位置透明性:程序不关心数据存放的物理位置的改变
  • 逻辑透明性:用户或程序无需知道局部使用的哪种数据模型
  • 复制透明性:用户或程序不关心复制的数据从何而来

4.7 数据仓库

特殊的数据库,

  • 面向主题:用来做数据分析
  • 集成不同表
  • 相对稳定:一般不修改,特定时间做大量插入
  • 反映历史的变化

数据源 --抽取清理装载刷新–> 数据仓库 --> 服务

4.7.1 数据挖掘

发现剩余价值
方法:

  • 关联分析:关联性
  • 序列分析:接连发生的事件
  • 分类分析
  • 聚类分析

4.7.2 商业智能

BI 数据预处理(抽取转换加载ETL)、建立数据仓库、数据分析(联机分析OLAP、数据挖掘)、数据展现(可视化)

4.7.3 反规范化技术

表拆分后不利于查询,所以反规范化以提高效率

  • 增加派生性冗余列
  • 增加冗余列
  • 重新组表
  • 分割表

4.8 SQL语言

创建表create table
指定主键primary key()
指定外键foreign key()
修改表alter table
删除表drop table
索引index
视图view

CREATE TABLE S(Sno CHAR(5) NOT NULL UNIQUE,
			Sname CHAR(30) UNIQUE,
			Status CHAR(8),
			City CHAR(20)
			PRIMARY KEY(Sno));

ALTER TABLE S ADD Zap CHAR(6);
DROP TABLE Student
CREATE UNIQUE INDEX S-SNO ON S(Sno);
CREATE VIEW CS-STUDENT
数据库查询select ... from ... where
分组查询 group by,分组时要注意select后的列名要适应分组,having为分组查询附加条件
select sno, avg(score) from student group by sno having(avg(score)>60)

更名运算as
select sno as "学号" from t1

字符串匹配like, %匹配多个字符串,_匹配任意一个字符串
select * from t1 where sname like'a_'

数据库插入insert into ... values()
insert into t1 values('a',66)

数据库删除delete from ... where
delete t1 where sno=4

数据库修改update ... set ... where
update t1 set sname='aa' where sno=3

排序order by,默认为升序,降序要加关键字DESC
select * from t1 order by sno desc
distinct 过滤重复的选项,只保留一条记录
union 出现在两条sql语句之间,将两个sql语句的查询结果取或运算
intersect 对两个sql语句的结果做与运算
min avg max 分组查询的聚合函数

在这里插入图片描述

在这里插入图片描述
select - pi

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/weixin_43680300/article/details/127546633

智能推荐

Python+Selenium UI自动化之元素定位方式_python ui自动化判断元素是否存在-程序员宅基地

文章浏览阅读1.3k次。1. 网页元素介绍?元素: 由标签头+标签尾+标签头和标签尾包括的文本内容元素的信息就是指元素的标签名以及元素的属性元素的层级结构就是指元素之间相互嵌套的层级结构元素定位最终就是通过元素的信息或者元素的层级结构来进行元素定位。2. 浏览器开发者工具介绍浏览器开发者工作主要用来查看元素的信息, 同时也可以查看接口的相关信息。 浏览器开发者工作不需要安装,浏览器自带. 浏览器开发者工具的启动: 直接按F12 不区分浏览器 通过右键的方式来启动浏览器开发者工具 (谷歌浏览器右.._python ui自动化判断元素是否存在

中国程序员独立开发9年、最受欢迎的开源Redis客户端——被Redis公司收购-程序员宅基地

文章浏览阅读29次。ioredis 作者@Luin宣布该项目已被 Redis 公司收购。目前 ioredis 在 GitHub 的开源地址已迁移至 Redis 公司旗下:ioredis 是一个用于 Node.js 的 Redis 客户端,健壮、性能好、功能强大且全面。两年前,ioredis超过redis 成为了 Node.js 最流行的 Redis 客户端。当时 ioredis 作者还感叹 redis 历经诸...

javase之序列化与反序列化_ser 序列化 反射-程序员宅基地

文章浏览阅读406次。3.如果一个可序列化对象包含了某个不可序列化对象的引用,那么整个序列化是会失败的,并且会抛出一个NotSerializableException,我们可以将这个引用标记为transient,表示为短暂的,此时该变量就无法被序列化,然后对象依旧可以被序列化。一个类如果想被序列化,则必须实现java.io.Serializable接口,这个接口没有定义任何方法,是一个标志性接口,当一个类实现了该接口,就表示这个类的对象是可以被序列化的。2.如果一个对象的成员变量是一个对象,那么这个对象的数据成员也会被保存。.._ser 序列化 反射

Zuul_zuul: prefix: /api-程序员宅基地

文章浏览阅读139次。zuul 路由1. zuul:1.1 zuul是什么?Zuul包含了对请求的路由和过滤两个最主要的功能:其中路由功能负责将外部请求转发到具体的微服务实例上,是实现外部访问统一入口的基础而过滤器功能则负责对请求的处理过程进行干预,是实现请求校验、服务聚合等功能的基础.Zuul和Eureka进行整合,将Zuul自身注册为Eureka服务治理下的应用,同时从Eureka中获得其他微服务的消息,也即以后的访问微服务都是通过Zuul跳转后获得。注意:Zuul服务最终还是会注册进Eureka1.2 路由:_zuul: prefix: /api

推荐五款你从未见过的嵌入式电子电路仿真APP-程序员宅基地

文章浏览阅读2.1w次,点赞30次,收藏204次。摘要:在这个人人一部甚至多部智能手机的年代,各种APP充斥在各种应用市场作为一名电子爱好者或者电子工程师,你在为如何选择APP而头痛吗?哪些你正在使用的APP使你在工作、生活、学习中如虎添翼呢?现在,小师弟特意整理了一些电子爱好者和电子工程师能用到的手机APP和你没见过的电脑仿真软件。ElectroDroid电路专家ElectroDroid是一款电路电子器件的学习软件,比较专业化,它能够为你提供各种电路方面的信息查询和计算服务,是电子相关行业人士的必备工具之一。它包括:电阻色码计算器贴片电阻代码_电路仿真app

卷积神经网络的几种模型_卷积神经网络模型-程序员宅基地

文章浏览阅读7.9k次,点赞9次,收藏53次。关于卷积神经网络的模型,我们这里只谈论关于图像分类的卷积神经网络的四种模型。在这里我们就不对卷积神经网络的结构进行阐述,不了解的同学可以参考我之前的博客LeNet-5首先我们先阐述的是1989年提出来的的LeNet-5结构。它其实就是最原始的结构,卷积层后衔接池化层,再接卷积层和其后的池化层,最后一个全连接层。(c1=convolution layer1,s1=subsampling layer1[降采样层,就是池化层])这个模型是实现识别手写数字的功能为目的而提出..._卷积神经网络模型

随便推点

科普帖:什么是IaaS?与SaaS、PaaS有何不同_google drive iaas-程序员宅基地

文章浏览阅读853次,点赞24次,收藏18次。到底什么是IaaS?它与PaaS和SaaS等其他云服务有何不同?​本文将介绍它们之间的区别。随着91%的公司至少部分迁移到云,我们都应该对它们有基本了解。下面让我们探讨一下IaaS是什么,与其他云服务的区别,及一些实际使用中的示例。_google drive iaas

滚动栏范围位置函数(SetScrollRange、SetScrollPos、GetScrollRange、GetScrollPos)-程序员宅基地

文章浏览阅读194次。滚动栏的范围是一对整数,默认情况下,滚动栏的范围是0~100。SetScrollRange(hwnd,iBar,iMin,iMax,bRedraw)这里的iBar參数要么是SB_VERT,要么是SB_HORZ,iMin和iMax分别相应滚动栏范围的最小值和最大值,须要Windows依据新的范围来重绘滚动栏时将bRedraw设为TRUE.SetScrollPos(hwnd..._setscrollerbarpos

【Java基础】之AWT,一篇文章搞懂awt(包含绘图)-程序员宅基地

文章浏览阅读1.3w次,点赞45次,收藏177次。入门awt不错的文章,带你快速上手awt_awt

C++ Primer问题总结(7)_executionpolicy&&-程序员宅基地

文章浏览阅读170次。10.3int main(){ vector<string>v{ "Hello","World" }; auto sum = accumulate(v.begin(), v.end(), string{ "Tim Wu" }); cout << sum << endl;}int main(){ int v1 = 42; auto f ..._executionpolicy&&

《近匠》专访机智云 CTO 刘琰——从 0 到 1 开启智能化硬件开发-程序员宅基地

文章浏览阅读1.1k次。在物联网浪潮之下,智能硬件的火爆程度不断升温。未来十年,全球接入互联网的硬件设备将达到1万亿台。如今的智能硬件产品正成为下一个“台风口”,同时这对于终端市场也是一个机遇。然而从创新走向产品,作为开发者应该如何步步为营?面对传统硬件与智能硬件之间思维理念及技术差异的“鸿沟”,开发者如何提升自己的技能,更加高效地开发?由此,我们带着探索道路上的种种疑问,采访了机智云 CTO ..._机智云科技有限公司刘焱

动态规划 | 完全背包问题 | 组合数、排列数 | leecode刷题笔记_完全背包问题 输出有几种排列-程序员宅基地

文章浏览阅读857次。跟随carl代码随想录刷题语言:python。_完全背包问题 输出有几种排列