关于学科形态和内在联系第1页,共35页,星期日,2025年,2月5日三个学科形态:抽象,理论,设计认识过程感性认识(抽象)—理性认识(理论)—实践(设计)科学技术方法论抽象、理论和设计3个过程称为学科形态抽象、理论和设计是其研究的主要内容计算机科学与技术方法论是对计算领域认识和实践过程中一般方法及其性质、特点、内在联系和变化发展进行系统研究的学问。三个学科形态概括了计算学科的基本内容。引言第2页,共35页,星期日,2025年,2月5日现实问题:现给出“学生”和“课程”二个实体,它们的联系为:一个学生可以选修若干门课程,每门课程可以被任意学生所选修。建立一个信息管理系统,以实现对“学生选课”这一信息的管理。解题步骤:感性认识(抽象):概念模型(E-R模型),数据模型理性认识(理论):关系模型的形式化实践(设计):关系数据库、编程1、一个关于“学生选课”的例子第3页,共35页,星期日,2025年,2月5日概念模型用于信息世界的建模,是客观世界到信息世界的抽象。概念模型中的主要概念有:实体、属性、码、域、联系等。实体:客观存在并可相互区别的事物。属性:实体所具有的某一种特性。码:能惟一标识实体的属性集。域:属性的取值范围。联系:指不同实体集之间的联系。两个实体之间的联系分为:一对一(1:1)、一对多(1:N)、多对多(N:M)3类。第4页,共35页,星期日,2025年,2月5日E-R模型(Entity-Relationship)1976年,美籍华人陈平山提出的实体-联系方法。用E-R模型来描述客观世界并建立概念模型的抽象方法,从中抽取实体和实体间的联系。实体用矩形表示,属性用椭圆形表示,联系用菱形表示,实体间的联系有3种:1:1,1:N,N:M要实现对客观事物的感性认识,必须将客观世界(如“学生选课”)抽象为信息世界。联系也可以有属性。E-R模型是各种数据模型的共同基础,它比数据模型更一般、更抽象、更现实世界。第5页,共35页,星期日,2025年,2月5日选修学生课程mn学生选课E-R图关系模型:学生(学号,姓名,年龄,性别)课程(课程号,课程名)学生选课(学号,课程号,成绩)性别年龄学号性别成绩课程号课程名第6页,共35页,星期日,2025年,2月5日数据模型概念模型不是机器世界所支持的数据模型, 而是客观世界到机器世界的一个中间层次。概念模型还需要转换成机器世界能支持的数据模型。在数据库领域中,数据库管理系统(DBMS)能支持的数据模型有:层次模型,网状模型,关系模型,面向对象模型关系模型支持的是一种二维表结构的数据模型,它由关系数据结构、关系数据操作和关系数据的完整性约束条件三部分组成。其中关系就是一张二维表。关系模型:前图第7页,共35页,星期日,2025年,2月5日对“学生选课”的感性认识“学生选课”的感性认识概念模型实体-关系(E-R)模型数据模型:关系模型感性认识中存在的问题在学生关系中增加系名、系主任等属性时,出现插入异常、删除异常问题。例如,未招学生时无法将系名和系主任插入到数据库中。冗余太大,系名和系主任重复。如何解决?理性认识(理论)使问题形式化,内容与形式分开。第8页,共35页,星期日,2025年,2月5日问题形式化:关系模式的形式化定义关系模式(R)是一个四元组,即:R=U,D,dom,F其中:(1)U表示关系中所有属性的集合;(2)D表示属性集合U中属性所来自的域;(3)dom是属性到域的映射;(4)F是属性集合U上的一组数据依赖。数据依赖1NF的定义:每一个分量必须是不可再分的数据项。2NF的定义:R∈1NF,且每一个非主属性不存在对码的部分函数依赖。即每一个非主属性完全函数依赖于码。3NF的定义:R∈2NF,且每一个非主属性不存在对码的传递函数依赖。BCNF、4NF、5NF。对“学生选课”的理性认识简化为:R=U,F第9页,共35页,星期日,2025年,2月5日例子最初是属于1NF、2NF、3NF,但是当在属性集U中增加系名和系主任后,它就不属于3NF了。因为出现了传递函数依赖:学号(码)→系名,系名→系主任。不属于3NF的所有关系模型都会出现插入异常、删除异常和冗余的问题。还必须依靠分解算法对模式进行分解,并满足3NF的要求。例如,可以再划分一个关系,即系(系号,系名,系主任名),从而满足了关系模式规范化的要求,实现了对例子的理性认识。在数据依赖理论的指导下