当前位置：文档之家› 数据结构复习要点(整理版)

数据结构复习要点(整理版)

数据结构整理完整版

第二章线性表一、顺序表和链表的优缺点 1.顺序表定义：用一组连续的存储单元（地址连续）依次存放线性表的各个数据元素。即：在顺序表中逻辑结构上相邻的数据元素，其物理位置也是相邻的。优点逻辑相邻，物理相邻可随机存取任一元素存储空间使用紧凑缺点插入、删除操作需要移动大量的元素（平均约需移动一半结点，当n很大时，算法的效率较低）预先分配空间需按最大空间分配，利用不充分表容量难以扩充 2.链式存储结构定义：由分别表示a1,a2,…,a i-1,a i,…,a n的N 个结点依次相链构成的链表，称为线性表的链式存储表示优势： (1)能有效利用存储空间；动态存储分配的结构，不需预先为线性表分配足够大的空间，而是向系统“随用随取”，在删除元素时可同时释放空间。 (2)用“指针”指示数据元素之间的后继关系，便于进行“插入”、“删除”等操作；插入或删除时只需要修改指针，而不需要元素移动。劣势： (1)不能随机存取数据元素； (2)丢失了一些顺序表的长处，如线性表的“表长”和数据元素在线性表中的 “位序”，在单链表中都看不见了。如，不便于在表尾插入元素，需遍历整个表才能找到插入的位置。二、单链表中删除一个节点和插入一个节点的语句操作，p29 1.插入元素操作算法基本思想：首先找到相应结点，然后修改相应指针。假定在a，b之间插入结点X，s指向X, p指向a，指针修改语句为： s->next=p->next; p->next =s;

2.删除元素操作算法基本思想:首先找到第i-1 个结点，然后修改相应指针。删除b结点，其中，P指向a，指针修改语句为：p->next=p->next->next；三、单链表的就地逆置习题集2.22 算法的基本思想：以单链表作存储结构进行就地逆置的正确做法应该是：将原链表的头结点和第一个元素结点断开（令其指针域为空），先构成一个新的空表，然后将原链表中各结点，从第一个结点起，依次插入这个新表的头部（即令每个插入的结点成为新的第一个元素结点）。算法思路：依次取原链表中的每个结点，将其作为第一个结点插入到新链表中去，指针p用来指向当前结点，p为空时结束。 void reverse (Linklist H){ LNode *p; p=H->next; /*p指向第一个数据结点*/ H->next=NULL; /*将原链表置为空表H*/ while (p){ q=p; p=p->next; q->next=H->next; /*将当前结点插到头结点的后面*/ H->next=q; } } 第三章栈和队列一、栈和队列的特性 1.特点栈必须按“后进先出”（LIFO）的规则进行操作，仅限在表尾进行插入和删除的操作。队列（FIFO）必须按“先进先出”的规则进行操作，队尾插入，队头删除。二、循环队列为空和满的判定方法，p63 队空条件：front == rear; 队满条件：(rear + 1) % maxSize == front

数据结构复习提纲(整理)

复习提纲第一章数据结构概述基本概念与术语（P3） 1．数据结构是一门研究非数值计算程序设计问题中计算机的操作对象以及他们之间的关系和操作的学科. 2．数据是用来描述现实世界的数字,字符,图像,声音,以及能够输入到计算机中并能被计算机识别的符号的集合 2．数据元素是数据的基本单位 3．数据对象相同性质的数据元素的集合 4．数据结构包括三方面内容:数据的逻辑结构.数据的存储结构.数据的操作. （1）数据的逻辑结构指数据元素之间固有的逻辑关系. （2）数据的存储结构指数据元素及其关系在计算机内的表示 ( 3 ) 数据的操作指在数据逻辑结构上定义的操作算法,如插入,删除等. 5.时间复杂度分析 -------------------------------------------------------------------------------------------------------------------- 1、名词解释：数据结构、二元组 2、根据数据元素之间关系的不同，数据的逻辑结构可以分为集合、线性结构、树形结构和图状结构四种类型。 3、常见的数据存储结构一般有四种类型，它们分别是___顺序存储结构_____、___链式存储结构_____、___索引存储结构_____和___散列存储结构_____。 4、以下程序段的时间复杂度为___O(N2)_____。 int i,j,x; for(i=0;i=0)个具有相同性质的数据元素a1,a2,a3……,an组成的有穷序列 //顺序表结构 #define MAXSIZE 100 typedef int DataType; Typedef struct{ DataType items[MAXSIZE]; Int length; }Sqlist,*LinkList; //初始化链表 void InitList(LinkList *L){ (*L)=(LinkList)malloc(sizeof(LNode)); if(!L){ cout<<”初始化失败!”; return;

大学数据结构期末知识点重点总结(考试专用)

.. ;.. 第一章概论 1.数据结构描述的是按照一定逻辑关系组织起来的待处理数据元素的表示及相关操作，涉及数据的逻辑结构、存储结构和运算 2.数据的逻辑结构是从具体问题抽象出来的数学模型，反映了事物的组成结构及事物之间的逻辑关系可以用一组数据（结点集合K ）以及这些数据之间的一组二元关系（关系集合R ）来表示：(K, R) 结点集K 是由有限个结点组成的集合，每一个结点代表一个数据或一组有明确结构的数据关系集R 是定义在集合K 上的一组关系，其中每个关系r （r ∈R ）都是K ×K 上的二元关系 3.数据类型 a.基本数据类型整数类型(integer)、实数类型(real)、布尔类型(boolean)、字符类型（char ）、指针类型（pointer ） b.复合数据类型复合类型是由基本数据类型组合而成的数据类型；复合数据类型本身，又可参与定义结构更为复杂的结点类型 4.数据结构的分类：线性结构（一对一）、树型结构（一对多）、图结构（多对多） 5.四种基本存储映射方法：顺序、链接、索引、散列 6.算法的特性：通用性、有效性、确定性、有穷性 7.算法分析：目的是从解决同一个问题的不同算法中选择比较适合的一种，或者对原始算法进行改造、加工、使其优化 8.渐进算法分析 a ．大Ο分析法：上限，表明最坏情况 b ．Ω分析法：下限，表明最好情况 c ．Θ分析法：当上限和下限相同时，表明平均情况第二章线性表 1.线性结构的基本特征 a.集合中必存在唯一的一个“第一元素” b.集合中必存在唯一的一个“最后元素” c.除最后元素之外，均有唯一的后继 d.除第一元素之外，均有唯一的前驱 2.线性结构的基本特点:均匀性、有序性 3.顺序表 a.主要特性：元素的类型相同；元素顺序地存储在连续存储空间中，每一个元素唯一的索引值；使用常数作为向量长度 b. 线性表中任意元素的存储位置：Loc(ki) = Loc(k0) + i * L （设每个元素需占用L 个存储单元） c. 线性表的优缺点：优点：逻辑结构与存储结构一致；属于随机存取方式，即查找每个元素所花时间基本一样缺点：空间难以扩充 d.检索：ASL=【Ο（1）】 e .插入：插入前检查是否满了，插入时插入处后的表需要复制【Ο（n ）】 f.删除：删除前检查是否是空的，删除时直接覆盖就行了【Ο（n ）】 4.链表 4.1单链表 a.特点：逻辑顺序与物理顺序有可能不一致；属于顺序存取的存储结构，即存取每个数据元素所花费的时间不相等 b.带头结点的怎么判定空表：head 和tail 指向单链表的头结点 c.链表的插入（q->next=p->next; p->next=q;）【Ο（n ）】 d.链表的删除（q=p->next; p->next = q->next; delete q;）【Ο（n ）】 e.不足：next 仅指向后继，不能有效找到前驱 4.2双链表 a.增加前驱指针，弥补单链表的不足 b.带头结点的怎么判定空表:head 和tail 指向单链表的头结点 c.插入：（q->next = p->next; q->prev = p; p->next = q; q->next->prev = q;） d.删除：（p->prev->next = p->next; p->next->prev = p->prev; p->prev = p->next = NULL; delete p;） 4.3顺序表和链表的比较 4.3.1主要优点 a.顺序表的主要优点没用使用指针，不用花费附加开销；线性表元素的读访问非常简洁便利 b.链表的主要优点无需事先了解线性表的长度；允许线性表的长度有很大变化；能够适应经常插入删除内部元素的情况 4.3.2应用场合的选择 a.不宜使用顺序表的场合经常插入删除时，不宜使用顺序表；线性表的最大长度也是一个重要因素 b.不宜使用链表的场合当不经常插入删除时，不应选择链表；当指针的存储开销与整个结点内容所占空间相比其比例较大时，应该慎重选择第三章栈与队列 1.栈 a.栈是一种限定仅在一端进行插入和删除操作的线性表；其特点后进先出；插入：入栈（压栈）；删除：出栈（退栈）；插入、删除一端被称为栈顶（浮动），另一端称为栈底（固定）；实现分为顺序栈和链式栈两种 b.应用： 1）数制转换 while (N) { N%8入栈； N=N/8;} while (栈非空){ 出栈；输出；} 2）括号匹配检验不匹配情况：各类括号数量不同；嵌套关系不正确算法：逐一处理表达式中的每个字符ch ： ch=非括号：不做任何处理 ch=左括号：入栈 ch=右括号：if (栈空) return false else { 出栈，检查匹配情况， if (不匹配) return false } 如果结束后，栈非空，返回false 3）表达式求值 3.1中缀表达式：计算规则：先括号内，再括号外；同层按照优先级，即先乘*、除/,后加+、减-；相同优先级依据结合律，左结合律即为先左后右 3.2后缀表达式： <表达式> ::= <项><项> + | <项> <项>－|<项> <项> ::= <因子><因子> * |<因子><因子>/|<因子> <因子> ::= <常数> ? <常数> ::= <数字>|<数字><常数> <数字> ∷= 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 3.3中缀表达式转换为后缀表达式 InfixExp 为中缀表达式，PostfixExp 为后缀表达式初始化操作数栈OP ，运算符栈OPND ；OPND.push('#'); 读取InfixExp 表达式的一项操作数：直接输出到PostfixExp 中；操作符：当‘（’：入OPND; 当‘）’：OPND 此时若空，则出错；OPND 若非空，栈中元素依次弹出，输入PostfixExpz 中，直到遇到‘（’为止；若为‘（’，弹出即可当‘四则运算符’：循环（当栈非空且栈顶不是‘（’&& 当前运算符优先级>栈顶运算符优先级），反复弹出栈顶运算符并输入到PostfixExp 中，再将当前运算符压入栈 3.4后缀表达式求值初始化操作数栈OP ； while （表达式没有处理完) { item = 读取表达式一项; 操作数：入栈OP ；运算符：退出两个操作数，计算，并将结果入栈} c.递归使用的场合：定义是递归的；数据结构是递归的；解决问题的方法是递归的 2.队列 a.若线性表的插入操作在一端进行，删除操作在另一端进行，则称此线性表为队列 b.循环队列判断队满对空：队空：front==rear ；队满：(rear+1)%n==front 第五章二叉树 1.概念 a. 一个结点的子树的个数称为度数 b.二叉树的高度定义为二叉树中层数最大的叶结点的层数加1 c.二叉树的深度定义为二叉树中层数最大的叶结点的层数 d.如果一棵二叉树的任何结点，或者是树叶，或者恰有两棵非空子树，则此二叉树称作满二叉树 e.如果一颗二叉树最多只有最下面的两层结点度数可以小于2；最下面一层的结点都集中在该层最左边的位置上，则称此二叉树为完全二叉树 f.当二叉树里出现空的子树时，就增加新的、特殊的结点——空树叶组成扩充二叉树，扩充二叉树是满二叉树外部路径长度E ：从扩充的二叉树的根到每个外部结点（新增的空树叶）的路径长度之和内部路径长度I ：扩充的二叉树中从根到每个内部结点（原来二叉树结点）的路径长度之和 2.性质 a. 二叉树的第i 层（根为第0层，i ≥0）最多有2^i 个结点 b. 深度为k 的二叉树至多有2k+1-1个结点 c. 任何一颗二叉树，度为0的结点比度为2的结点多一个。n0 = n2 + 1 d. 满二叉树定理：非空满二叉树树叶数等于其分支结点数加1 e. 满二叉树定理推论：一个非空二叉树的空子树(指针)数目等于其结点数加1 f. 有n 个结点（n>0）的完全二叉树的高度为?log2(n+1)?，深度为?log2(n+1)?? g. 对于具有n 个结点的完全二叉树，结点按层次由左到右编号，则有： 1) 如果i = 0为根结点；如果i>0，其父结点编号是 (i-1)/2 2) 当2i+1∈N ，则称k 是k'的父结点，k'是的子结点若有序对及∈N ，则称k'k ″互为兄弟若有一条由 k 到达ks 的路径，则称k 是的祖先，ks 是k 的子孙 2.树/森林与二叉树的相互转换 a.树转换成二叉树加线: 在树中所有兄弟结点之间加一连线抹线: 对每个结点，除了其最左孩子外，与其余孩子之间的连线旋转: 45° b.二叉树转化成树加线：若p 结点是双亲结点的左孩子，则将的右孩子，右孩子的右孩子，所有右孩子，都与p 的双亲用线连起来线调整：将结点按层次排列，形成树结构 c.森林转换成二叉树将各棵树分别转换成二叉树将每棵树的根结点用线相连为轴心，顺时针旋转，构成二叉树型结构 d.二叉树转换成森林抹线：将二叉树中根结点与其右孩子连线，及沿右分支搜索到的所有右孩子间连线全部抹掉，使之变成孤立的二叉树还原：将孤立的二叉树还原成树 3.周游 a.先根(次序)周游若树不空，则先访问根结点，然后依次先根周游各棵子树 b.后根(次序)周游若树不空，则先依次后根周游各棵子树，然后访问根结点 c.按层次周游若树不空，则自上而下自左至右访问树中每个结点 4.存储结构 “左子/右兄”二叉链表表示法：结点左指针指向孩子，右结点指向右兄弟，按树结构存储，无孩子或无右兄弟则置空 5. “UNION/FIND 算法”（等价类）判断两个结点是否在同一个集合中，查找一个给定结点的根结点的过程称为FIND 归并两个集合，这个归并过程常常被称为UNION “UNION/FIND ”算法用一棵树代表一个集合，如果两个结点在同一棵树中，则认为它们在同一个集合中；树中的每个结点（除根结点以外）有仅且有一个父结点；结点中仅需保存父指针信息，树本身可以存储为一个以其结点为元素的数组 6.树的顺序存储结构 a. 带右链的先根次序表示法在带右链的先根次序表示中，结点按先根次序顺序存储在一片连续的存储单元中每个结点除包括结点本身数据外，还附加两个表示结构的信息字段，结点的形式为: info 是结点的数据；rlink 是右指针，指向结点的下一个兄弟；ltag 是一个左标记，当结点没有子结点（即对应二叉树中结点没有左子结点时），ltag 为 1，否则为 0 b. 带双标记位的先根次序表示法规定当结点没有下一个兄弟（即对应的二叉树中结点没有右子结点时）rtag 为1，否则为0 c. 带双标记位的层次次序表示法结点按层次次序顺序存储在一片连续的存储单元中第七章图 1.定义 a.假设图中有n 个顶点，e 条边：含有e=n(n-1)/2条边的无向图称作完全图含有e=n(n-1) 条弧的有向图称作有向完全图若边或弧的个数e < nlogn ，则称作稀疏图，否则称作稠密图 b. 顶点的度(TD)=出度(OD)+入度(ID) 顶点的出度: 以顶点v 为弧尾的弧的数目顶点的入度: 以顶点v 为弧头的弧的数目 c.连通图、连通分量若图G 中任意两个顶点之间都有路径相通，则称此图为连通图若无向图为非连通图，则图中各个极大连通子图称作此图的连通分量 d.强连通图、强连通分量对于有向图，若任意两个顶点之间都存在一条有向路径，则称此有向图为强连通图否则，其各个极大强连通子图称作它的强连通分量 e.生成树、生成森林假设一个连通图有n 个顶点和e 条边，其中n-1条边和n 个顶点构成一个极小连通子图，称该极小连通子图为此连通图的生成树对非连通图，则将由各个连通分量构成的生成树集合称做此非连通图的生成森林 2.存储结构 a.相邻矩阵表示法表示顶点间相邻关系的矩阵若G 是一个具有n 个顶点的图，则G 的相邻矩阵是如下定义的n ×n 矩阵： A[i,j]=1，若(Vi, Vj)(或)是图G 的边 A[i,j]=0，若(Vi, Vj)(或)不是图G 的边 b.邻接表表示法为图中每个顶点建立一个单链表，第i 个单链表中的结点表示依附于顶点Vi 的边（有向图中指以Vi 为尾的弧）（建立单链表时按结点顺序建立） 3.周游 a. 深度优先周游：从图中某个顶点V0出发，访问此顶点，然后依次从V0的各个未被访问的邻接点出发，深度优先搜索遍历图中的其余顶点，直至图中所有与V0有路径相通的顶点都被访问到为止 b. 广度优先周游：从图中的某个顶点V0出发，并在访问此顶点之后依次访问V0的所有未被访问过的邻接点，随后按这些顶点被访问的先后次序依次访问它们的邻接点，直至图中所有与V0有路径相通的顶点都被访问到为止，若此时图中尚有顶点未被访问，则另选图中一个未曾被访问的顶点作起始点，重复上述过程，直至图中所有顶点都被访问到为止 4.拓扑排序拓扑排序的方法是：1）选择一个入度为0的顶点且输出之 2）从图中删掉此顶点及所有的出边 3）回到第1步继续执行，直至图空或者图不空但找不到无前驱（入度为0）的顶点为止 5.单源最短路径（Dijkstra 算法） 6.每对顶点间的最短路径（Floyd 算法） 7.最小生成树 a.Prim 算法 b.Kruskal 算法 c.两种算法比较：Prim 算法适合稠密图，Kruskal 算法适合稀疏图第八章内排序算法最大时间平均时间直接插入排序 Θ(n2) Θ(n2) 冒泡排序 Θ(n2) Θ(n2) 直接选择排序 Θ(n2) Θ(n2) Shell 排序 Θ(n3/2) Θ(n3/2) 快速排序 Θ(n2) Θ(nlog n) 归并排序 Θ(nlog n) Θ(nlog n) 堆排序 Θ(nlog n) Θ(nlog n) 桶式排序 Θ(n+m) Θ(n+m) 基数排序 Θ(d ·(n+r)) Θ(d ·(n+r)) 最小时间 S(n) 稳定性 Θ(n) Θ(1) 稳定 Θ(n) Θ(1) 稳定 Θ(n2) Θ(1) 不稳定 Θ(n3/2) Θ(1) 不稳定 Θ(nlog n) Θ(log n) 不稳定 Θ(nlog n) Θ(n) 稳定 Θ(nlog n) Θ(1) 不稳定 Θ(n+m) Θ(n+m) 稳定 Θ(d ·(n+r)) Θ(n+r) 稳定第十章检索 1.平均检索长度（ASL ）是待检索记录集合中元素规模n 的函数，其定义为： ASL= Pi 为检索第i 个元素的概率;Ci 为找到第i 个元素所需的比较次数 2.散列 a.除余法用关键码key 除以M(取散列表长度)，并取余数作为散列地址散列函数为：hash(key) ＝ key mod M b.解决冲突的方法开散列方法：把发生冲突的关键码存储在散列表主表之外（在主表外拉出单链表）闭散列方法：把发生冲突的关键码存储在表中另一个位置上 c.线性探查基本思想：如果记录的基位置存储位置被占用，就在表中下移，直到找到一个空存储位置；依次探查下述地址单元：d0+1，d0+2，...，m-1，0， 1，...， d0-1；用于简单线性探查的探查函数是:p(K, i) = i d.散列表的检索 1.假设给定的值为K ，根据所设定的散列函数h ，计算出散列地址h(K) 2. 如果表中该地址对应的空间未被占用，则检索失败，否则将该地址中的值与K 比较 3. 若相等则检索成功；否则，按建表时设定的处理冲突方法查找探查序列的下一个地址，如此反复下去，直到某个地址空间未被占用（可以插入），或者关键码比较相等（有重复记录，不需插入）为止 e.散列表的删除：删除后在删除地点应加上墓碑（被删除标记） f.散列表的插入：遇到墓碑不停止，知道找到真正的空位置第十一章索引技术 1.概念： a.主码：数据库中的每条记录的唯一标识 b.辅码：数据库中可以出现重复值的码 2.B 树 a.定义：B 树定义：一个m 阶B 树满足下列条件： (1) 每个结点至多有m 个子结点； (2) 除根和叶外其它每个结点至少有??个子结点； (3) 根结点至少有两个子结点例外(空树，or 独根) (4) 所有的叶在同一层,可以有??- 1到m-1个关键码 (5) 有k 个子结点的非根结点恰好包含k-1个关键码 b.查找在根结点所包含的关键码K1，…，Kj 中查找给定的关键码值(用顺序检索(key 少)/二分检索(key 多))；找到：则检索成功;否则，确定要查的关键码值是在某个Ki 和Ki+1之间，于是取pi 所指结点继续查找;如果pi 指向外部结点，表示检索失败. c.插入找到的叶是插入位置，若插入后该叶中关键码个数

(完整版)非常实用的数据结构知识点总结

数据结构知识点概括第一章概论数据就是指能够被计算机识别、存储和加工处理的信息的载体。数据元素是数据的基本单位，可以由若干个数据项组成。数据项是具有独立含义的最小标识单位。数据结构的定义： ·逻辑结构：从逻辑结构上描述数据，独立于计算机。·线性结构：一对一关系。 ·线性结构：多对多关系。 ·存储结构：是逻辑结构用计算机语言的实现。·顺序存储结构：如数组。 ·链式存储结构：如链表。 ·索引存储结构：·稠密索引：每个结点都有索引项。 ·稀疏索引：每组结点都有索引项。 ·散列存储结构：如散列表。 ·数据运算。 ·对数据的操作。定义在逻辑结构上，每种逻辑结构都有一个运算集合。 ·常用的有：检索、插入、删除、更新、排序。数据类型：是一个值的集合以及在这些值上定义的一组操作的总称。 ·结构类型：由用户借助于描述机制定义，是导出类型。抽象数据类型ADT：·是抽象数据的组织和与之的操作。相当于在概念层上描述问题。 ·优点是将数据和操作封装在一起实现了信息隐藏。程序设计的实质是对实际问题选择一种好的数据结构，设计一个好的算法。算法取决于数据结构。算法是一个良定义的计算过程，以一个或多个值输入，并以一个或多个值输出。评价算法的好坏的因素：·算法是正确的； ·执行算法的时间； ·执行算法的存储空间（主要是辅助存储空间）； ·算法易于理解、编码、调试。时间复杂度：是某个算法的时间耗费，它是该算法所求解问题规模n的函数。渐近时间复杂度：是指当问题规模趋向无穷大时，该算法时间复杂度的数量级。评价一个算法的时间性能时，主要标准就是算法的渐近时间复杂度。算法中语句的频度不仅与问题规模有关，还与输入实例中各元素的取值相关。时间复杂度按数量级递增排列依次为：常数阶O（1）、对数阶O（log2n）、线性阶O（n）、线性对数阶O（nlog2n）、平方阶O （n^2）、立方阶O（n^3）、……k次方阶O（n^k）、指数阶O（2^n）。

数据结构复习要点整理版

第一章数据结构概述基本概念与术语 1．数据：数据是对客观事物的符号表示，在计算机科学中是指所有能输入到计算机中并被计算机程序所处理的符号的总称。 2.数据元素：数据元素是数据的基本单位，是数据这个集合中的个体，也称之为元素，结点，顶点记录。（补充：一个数据元素可由若干个数据项组成。数据项是数据的不可分割的最小单位。）3．数据对象：数据对象是具有相同性质的数据元素的集合，是数据的一个子集。（有时候也叫做属性。） 4．数据结构：数据结构是相互之间存在一种或多种特定关系的数据元素的集合。（1）数据的逻辑结构：数据的逻辑结构是指数据元素之间存在的固有逻辑关系，常称为数据结构。数据的逻辑结构是从数据元素之间存在的逻辑关系上描述数据与数据的存储无关，是独立于计算机的。依据数据元素之间的关系，可以把数据的逻辑结构分成以下几种： 1.集合：数据中的数据元素之间除了“同属于一个集合“的关系以外，没有其他关系。 2.线性结构：结构中的数据元素之间存在“一对一“的关系。若结构为非空集合，则除了第一个元素之外，和最后一个元素之外，其他每个元素都只有一个直接前驱和一个直接后继。 3.树形结构：结构中的数据元素之间存在“一对多“的关系。若数据为非空集，则除了第一个元素（根）之外，其它每个数据元素都只有一个直接前驱，以及多个或零个直接后继。 4.图状结构：结构中的数据元素存在“多对多”的关系。若结构为非空集，折每个数据可有多个（或零个）直接后继。（2）数据的存储结构：数据元素及其关系在计算机的表示称为数据的存储结构。想要计算机处理数据，就必须把数据的逻辑结构映射为数据的存储结构。逻辑结构可以映射为以下两种存储结构： 1.顺序存储结构：把逻辑上相邻的数据元素存储在物理位置也相邻的存储单元中，借助元素在存储器中的相对位置来表示数据之间的逻辑关系。 2.链式存储结构：借助指针表达数据元素之间的逻辑关系。不要求逻辑上相邻的数据元素物理位置上也相邻。 5.时间复杂度分析：1.常量阶：算法的时间复杂度与问题规模n无关系T(n)=O(1) 2.线性阶：算法的时间复杂度与问题规模n成线性关系T(n)=O(n) 3.平方阶和立方阶：一般为循环的嵌套，循环体最后条件为i++ 时间复杂度的大小比较： O(1)< O(log 2 n)< O(n )< O(n log 2 n)< O(n2)< O(n3)< O(2 n )

数据结构基础知识整理

数据结构基础知识整理 *名词解释1、数据：是信息的载体，能够被计算机识别、存储和加工处理。 *2、数据元素：是数据的基本单位，也称为元素、结点、顶点、记录。一个数据元素可以由若干个数据项组成，数据项是具有独立含义的最小标识单位。 *3、数据结构：指的是数据及数据之间的相互关系，即数据的组织形式，它包括数据的逻辑结构、数据的存储结构和数据的运算三个方面的内容。 *4、数据的逻辑结构：指数据元素之间的逻辑关系，即从逻辑关系上描述数据，它与数据的存储无关，是独立于计算机的。 *5、数据的存储结构：指数据元素及其关系在计算机存储器内的表示。是数据的逻辑结构用计算机语言的实现，是依赖于计算机语言的。 *6、线性结构：其逻辑特征为，若结构是非空集，则有且仅有一个开始结点和一个终端结点，并且其余每个结点只有一个直接前趋和一个直接后继。 *7、非线性结构：其逻辑特征为一个结点可能有多个直接前趋和直接后继。 *8、算法：是任意一个良定义的计算过程，它以一个或多个值作为输入，并产生一个或多个值作为输出；即一个算法是一系列将输入转换为输出的计算步骤。 *9、算法的时间复杂度T(n)：是该算法的时间耗费，它是该算法所求解问题规模n趋向无穷大时，我们把时间复杂度T(n)的数量级（阶）称为算法的渐近时间复杂度。 *10、最坏和平均时间复杂度：由于算法中语句的频度不仅与问题规模n有关，还与输入实例等因素有关；这时可用最坏情况下时间复杂度作为算法的时间复杂度。而平均时间复杂度是指所有的输入实例均以等概率出现的情况下，算法的期望运行时间。 *11、数据的运算：指对数据施加的操作。数据的运算是定义在数据的逻辑结构上的，而实现是要在存储结构上进行。 *12、线性表：由n(n≥0)个结点组成的有限序列。其逻辑特征反映了结点间一对一的关系（一个结点对应一个直接后继，除终端结点外；或一个结点对应一个直接前趋，除开始结点外），这是一种线性结构。 *13、顺序表：顺序存储的线性表，它是一种随机存取结构。通过将相邻结点存放在相邻物理位置上来反映结点间逻辑关系。 *14、单链表：每个结点有两个域：一个值域data；另一个指针域next，用来指向该结

数据结构复习重点要点

《数据结构(C语言版)》复习重点重点在二、三、六、七、九、十章，考试内容两大类：概念，算法第1章、绪论 1.数据：是对客观事物的符号表示，在计算机科学中是指所有能输入到计算机中并被计算机程序处理的符号的总称。 2.数据元素：是数据的基本单位，在计算机程序中通常作为一个整体进行考虑和处理。 3.数据结构：是相互之间存在一种或多种特定关系的数据元素的集合。其4类基本结构：集合、线性结构、树形结构、图状结构或网状结构 4.逻辑结构：是数据元素之间的逻辑关系的描述。 5.物理结构（存储结构）：是数据结构在计算机中的表示（又称映像）。其4种存储结构：顺序存数结构、链式存数结构、索引存数结构、散列存数结构6.算法：是对特定问题求解步骤的一种描述，它是指令的有限序列，其中每一条指令表示一个或多个操作。其5个重要特性：有穷性、确定性、可行性、输入、输出 7.时间复杂度：算法中基本操作重复执行的次数是问题规模n的某个函数f(n),算法的时间度量记作，T(n)=O(f(n))；他表示随问题规模n的增大，算法执行时间的增长率和f(n)的增长率相同，称做算法的渐进时间复杂度，简称时间复杂度。例如：(a){++x;s=0;} (b)for(i=1;i<=n;++i){++x;s += x;} (c)for(j=1;j<=n;++j) for(k=1;k<=n;++k){++x;s += x;} 含基本操作“x增1”的语句的频度分别为1、n和n2，则这3个程序段的时间复杂度分别为O(1)、O(n)和O(n2)，分别称为常量阶、线性阶和平方阶。还可呈现对数阶O(log n)、指数阶O(2的n次方)等。 8.空间复杂度：算法所需存储空间的度量记作，S(n)=O(f(n))。第2章、线性表 1.线性表：是最常用最简单的一种数据结构，一个线性表是n个数据元素的有限序列。 2. 线性表的顺序存储结构：是用一组地址连续的存储单元依次存储线性表的数据元素。其特点为逻辑关系上相邻的两个元素在物理位置上也相邻，可以随机存取表中任一元素。存储位置计算：假设线性表的每个元素需占用L个存储单元，并以所占的第一个单元的存储地址作为数据元素的存储位置，线性表的第i个数据元素ai的存储位置为LOC(ai)=LOC(a1)+(i-1)*L式中LOC(a1)是线性表第一个元素a1的存储位置，通常称做线性表的起始位置或基地址。 3. 线性表的链式存储结构：是用一组任意的存储单元存储线性表的数据元素(这组存储单元可以是连续的，也可以是不连续的)。

大学数据结构期末知识点重点总结

第一章概论 1.数据结构描述的是按照一定逻辑关系组织起来的待处理数据元素的表示及相关操作，涉及数据的逻辑结构、存储结构和运算 2.数据的逻辑结构是从具体问题抽象出来的数学模型，反映了事物的组成结构及事物之间的逻辑关系可以用一组数据（结点集合K）以及这些数据之间的一组二元关系（关系集合R）来表示：(K, R) 结点集K是由有限个结点组成的集合，每一个结点代表一个数据或一组有明确结构的数据关系集R是定义在集合K上的一组关系，其中每个关系r（r∈R）都是K×K上的二元关系 3.数据类型 a.基本数据类型整数类型(integer)、实数类型(real)、布尔类型(boolean)、字符类型（char）、指针类型（pointer）b.复合数据类型复合类型是由基本数据类型组合而成的数据类型；复合数据类型本身，又可参与定义结构更为复杂的结点类型 4.数据结构的分类：线性结构（一对一）、树型结构（一对多）、图结构（多对多） 5.四种基本存储映射方法：顺序、链接、索引、散列 6.算法的特性：通用性、有效性、确定性、有穷性 7.算法分析：目的是从解决同一个问题的不同算法中选择比较适合的一种，或者对原始算法进行改造、加工、使其优化 8.渐进算法分析 a．大Ο分析法：上限，表明最坏情况 b．Ω分析法：下限，表明最好情况 c．Θ分析法：当上限和下限相同时，表明平均情况第二章线性表 1.线性结构的基本特征 a.集合中必存在唯一的一个“第一元素” b.集合中必存在唯一的一个“最后元素” c.除最后元素之外，均有唯一的后继 d.除第一元素之外，均有唯一的前驱 2.线性结构的基本特点:均匀性、有序性 3.顺序表 a.主要特性：元素的类型相同；元素顺序地存储在连续存储空间中，每一个元素唯一的索引值；使用常数作为向量长度 b. 线性表中任意元素的存储位置：Loc(ki) = Loc(k0) + i * L（设每个元素需占用L个存储单元） c. 线性表的优缺点：优点：逻辑结构与存储结构一致；属于随机存取方式，即查找每个元素所花时间基本一样缺点：空间难以扩充 d.检索：ASL=【Ο（1）】 e.插入：插入前检查是否满了，插入时插入处后的表需要复制【Ο（n）】 f.删除：删除前检查是否是空的，删除时直接覆盖就行了【Ο（n）】 4.链表 4.1单链表 a.特点：逻辑顺序与物理顺序有可能不一致；属于顺序存取的存储结构，即存取每个数据元素所花费的时间不相等 b.带头结点的怎么判定空表：head和tail指向单链表的头结点 c.链表的插入（q->next=p->next; p->next=q;）【Ο（n）】 d.链表的删除（q=p->next; p->next = q->next; delete q;）【Ο（n）】 e.不足：next仅指向后继，不能有效找到前驱 4.2双链表 a.增加前驱指针，弥补单链表的不足 b.带头结点的怎么判定空表:head和tail指向单链表的头结点 c.插入：（q->next = p->next; q->prev = p; p->next = q; q->next->prev = q;） d.删除：（p->prev->next = p->next; p->next->prev = p->prev; p->prev = p->next = NULL; delete p;） 4.3顺序表和链表的比较 4.3.1主要优点 a.顺序表的主要优点没用使用指针，不用花费附加开销；线性表元素的读访问非常简洁便利 b.链表的主要优点无需事先了解线性表的长度；允许线性表的长度有很大变化；能够适应经常插入删除内部元素的情况 4.3.2应用场合的选择 a.不宜使用顺序表的场合经常插入删除时，不宜使用顺序表；线性表的最大长度也是一个重要因素 b.不宜使用链表的场合当不经常插入删除时，不应选择链表；当指针的存储开销与整个结点内容所占空间相比其比例较大时，应该慎重选择第三章栈与队列 1.栈 a.栈是一种限定仅在一端进行插入和删除操作的线性表；其特点后进先出；插入：入栈（压栈）；删除：出栈（退栈）；插入、删除一端被称为栈顶（浮动），另一端称为栈底（固定）；实现分为顺序栈和链式栈两种 b.应用： 1）数制转换 while (N) { N%8入栈； N=N/8;} while (栈非空){ 出栈；输出；} 2）括号匹配检验不匹配情况：各类括号数量不同；嵌套关系不正确算法：逐一处理表达式中的每个字符ch： ch=非括号：不做任何处理 ch=左括号：入栈 ch=右括号：if (栈空) return false else { 出栈，检查匹配情况， if (不匹配) return false } 如果结束后，栈非空，返回false 3）表达式求值 3.1中缀表达式：计算规则：先括号内，再括号外；同层按照优先级，即先乘*、除/,后加+、减-；相同优先级依据结合律，左结合律即为先左后右 3.2后缀表达式： <表达式> ::= <项><项> + | <项><项>－|<项> <项> ::= <因子><因子> * |<因子><因子>/|<因子> <因子> ::= <常数> ?<常数> ::= <数字>|<数字><常数> <数字> ∷= 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 3.3中缀表达式转换为后缀表达式 InfixExp为中缀表达式，PostfixExp为后缀表达式初始化操作数栈OP，运算符栈OPND； OPND.push('#'); 读取InfixExp表达式的一项操作数：直接输出到PostfixExp中；操作符：当‘（’：入OPND; 当‘）’：OPND此时若空，则出错；OPND若非空，栈中元素依次弹出，输入PostfixExpz 中，直到遇到‘（’为止；若为‘（’，弹出即可当‘四则运算符’：循环（当栈非空且栈顶不是 ‘（’&& 当前运算符优先级>栈顶运算符优先级），反复弹出栈顶运算符并输入到 PostfixExp中，再将当前运算符压入栈 3.4后缀表达式求值初始化操作数栈OP； while （表达式没有处理完) { item = 读取表达式一项; 操作数：入栈OP；运算符：退出两个操作数，计算，并将结果入栈} c.递归使用的场合：定义是递归的；数据结构是递归的；解决问题的方法是递归的 2.队列 a.若线性表的插入操作在一端进行，删除操作在另一端进行，则称此线性表为队列 b.循环队列判断队满对空：队空：front==rear；队满： (rear+1)%n==front 第五章二叉树 1.概念 a. 一个结点的子树的个数称为度数 b.二叉树的高度定义为二叉树中层数最大的叶结点的层数加1 c.二叉树的深度定义为二叉树中层数最大的叶结点的层数 d.如果一棵二叉树的任何结点，或者是树叶，或者恰有两棵非空子树，则此二叉树称作满二叉树 e.如果一颗二叉树最多只有最下面的两层结点度数可以小于2；最下面一层的结点都集中在该层最左边的位置上，则称此二叉树为完全二叉树 f.当二叉树里出现空的子树时，就增加新的、特殊的结点——空树叶组成扩充二叉树，扩充二叉树是满二叉树外部路径长度E：从扩充的二叉树的根到每个外部结点（新增的空树叶）的路径长度之和内部路径长度I：扩充的二叉树中从根到每个内部结点（原来二叉树结点）的路径长度之和 2.性质 a. 二叉树的第i层（根为第0层，i≥0）最多有 2^i个结点 b. 深度为k的二叉树至多有2k+1-1个结点 c. 任何一颗二叉树，度为0的结点比度为2的结点多一个。n0 = n2 + 1 d. 满二叉树定理：非空满二叉树树叶数等于其分支结点数加1 e. 满二叉树定理推论：一个非空二叉树的空子树(指针)数目等于其结点数加1 f. 有n个结点（n>0）的完全二叉树的高度为 ?log2(n+1)?，深度为?log2(n+1)?? g. 对于具有n个结点的完全二叉树，结点按层次由左到右编号，则有： 1) 如果i = 0为根结点；如果i>0，其父结点编号是(i-1)/2 2) 当2i+1∈N，则称k是k'的父结点，k'是的子结点若有序对及∈N，则称k' k″互为兄弟若有一条由k到达ks的路径，则称k是的祖先，ks是k的子孙 2.树/森林与二叉树的相互转换 a.树转换成二叉树加线: 在树中所有兄弟结点之间加一连线抹线: 对每个结点，除了其最左孩子外，与其余孩子之间的连线旋转: 45° b.二叉树转化成树加线：若p结点是双亲结点的左孩子，则将的右孩子，右孩子的右孩子，所有右孩子，都与p的双亲用线连起来线调整：将结点按层次排列，形成树结构 c.森林转换成二叉树将各棵树分别转换成二叉树将每棵树的根结点用线相连为轴心，顺时针旋转，构成二叉树型结构 d.二叉树转换成森林抹线：将二叉树中根结点与其右孩子连线，及沿右分支搜索到的所有右孩子间连线全部抹掉，使之变成孤立的二叉树还原：将孤立的二叉树还原成树 3.周游 a.先根(次序)周游若树不空，则先访问根结点，然后依次先根周游各棵子树 b.后根(次序)周游若树不空，则先依次后根周游各棵子树，然后访问根结点 c.按层次周游若树不空，则自上而下自左至右访问树中每个结点 4.存储结构 “左子/右兄”二叉链表表示法：结点左指针指向孩子，右结点指向右兄弟，按树结构存储，无孩子或无右兄弟则置空 5. “UNION/FIND算法”（等价类）判断两个结点是否在同一个集合中，查找一个给定结点的根结点的过程称为FIND 归并两个集合，这个归并过程常常被称为 UNION “UNION/FIND”算法用一棵树代表一个集合，如果两个结点在同一棵树中，则认为它们在同一个集合中；树中的每个结点（除根结点以外）有仅且有一个父结点；结点中仅需保存父指针信息，树本身可以存储为一个以其结点为元素的数组 6.树的顺序存储结构 a. 带右链的先根次序表示法在带右链的先根次序表示中，结点按先根次序顺序存储在一片连续的存储单元中每个结点除包括结点本身数据外，还附加两个表示结构的信息字段，结点的形式为: info是结点的数据；rlink是右指针，指向结点的下一个兄弟；ltag是一个左标记，当结点没有子结点（即对应二叉树中结点没有左子结点时），ltag为1，否则为0 b. 带双标记位的先根次序表示法规定当结点没有下一个兄弟（即对应的二叉树中结点没有右子结点时）rtag为1，否则为0 c. 带双标记位的层次次序表示法结点按层次次序顺序存储在一片连续的存储单元中第七章图 1.定义 a.假设图中有n个顶点，e条边：含有e=n(n-1)/2条边的无向图称作完全图含有e=n(n-1) 条弧的有向图称作有向完全图若边或弧的个数e < nlogn，则称作稀疏图，否则称作稠密图 b. 顶点的度(TD)=出度(OD)+入度(ID) 顶点的出度: 以顶点v为弧尾的弧的数目顶点的入度: 以顶点v为弧头的弧的数目 c.连通图、连通分量若图G中任意两个顶点之间都有路径相通，则称此图为连通图若无向图为非连通图，则图中各个极大连通子图称作此图的连通分量 d.强连通图、强连通分量对于有向图，若任意两个顶点之间都存在一条有向路径，则称此有向图为强连通图否则，其各个极大强连通子图称作它的强连通分量 e.生成树、生成森林假设一个连通图有n个顶点和e条边，其中n-1 条边和n个顶点构成一个极小连通子图，称该极小连通子图为此连通图的生成树对非连通图，则将由各个连通分量构成的生成树集合称做此非连通图的生成森林 2.存储结构 a.相邻矩阵表示法表示顶点间相邻关系的矩阵若G是一个具有n个顶点的图，则G的相邻矩阵是如下定义的n×n矩阵： A[i,j]=1，若(Vi, Vj)(或)是图G的边 A[i,j]=0，若(Vi, Vj)(或)不是图G的边 b.邻接表表示法为图中每个顶点建立一个单链表，第i个单链表中的结点表示依附于顶点Vi的边（有向图中指以Vi为尾的弧）（建立单链表时按结点顺序建立） 3.周游 a. 深度优先周游：从图中某个顶点V0出发，访问此顶点，然后依次从V0的各个未被访问的邻接点出发，深度优先搜索遍历图中的其余顶点，直至图中所有与 V0有路径相通的顶点都被访问到为止 b. 广度优先周游：从图中的某个顶点V0出发，并在访问此顶点之后依次访问V0的所有未被访问过的邻接点，随后按这些顶点被访问的先后次序依次访问它们的邻接点，直至图中所有与V0有路径相通的顶点都被访问到为止，若此时图中尚有顶点未被访问，则另选图中一个未曾被访问的顶点作起始点，重复上述过程，直至图中所有顶点都被访问到为止 4.拓扑排序拓扑排序的方法是：1）选择一个入度为0的顶点且输出之 2）从图中删掉此顶点及所有的出边 3）回到第1步继续执行，直至图空或者图不空但找不到无前驱（入度为0）的顶点为止 5.单源最短路径（Dijkstra算法） 6.每对顶点间的最短路径（Floyd算法） 7.最小生成树 a.Prim算法 b.Kruskal算法 c.两种算法比较：Prim算法适合稠密图， Kruskal算法适合稀疏图第八章内排序算法最大时间平均时间直接插入排序 Θ(n2) Θ(n2) 冒泡排序Θ(n2) Θ(n2) 直接选择排序 Θ(n2) Θ(n2) Shell排序Θ(n3/2) Θ(n3/2) 快速排序Θ(n2) Θ(nlog n) 归并排序Θ(nlog n) Θ(nlog n) 堆排序Θ(nlog n) Θ(nlog n) 桶式排序Θ(n+m) Θ(n+m) 基数排序Θ(d·(n+r)) Θ(d·(n+r)) 最小时间S(n) 稳定性 Θ(n) Θ(1) 稳定 Θ(n) Θ(1) 稳定 Θ(n2) Θ(1) 不稳定 Θ(n3/2) Θ(1) 不稳定 Θ(nlog n) Θ(log n) 不稳定 Θ(nlog n) Θ(n) 稳定 Θ(nlog n) Θ(1) 不稳定 Θ(n+m) Θ(n+m) 稳定 Θ(d·(n+r)) Θ(n+r) 稳定第十章检索 1.平均检索长度（ASL）是待检索记录集合中元素规模n的函数，其定义为： ASL= Pi为检索第i个元素的概率;Ci为找到第i个元素所需的比较次数 2.散列 a.除余法用关键码key除以M(取散列表长度)，并取余数作为散列地址散列函数为：hash(key) ＝key mod M b.解决冲突的方法开散列方法：把发生冲突的关键码存储在散列表主表之外（在主表外拉出单链表）闭散列方法：把发生冲突的关键码存储在表中另一个位置上 c.线性探查基本思想：如果记录的基位置存储位置被占用，就在表中下移，直到找到一个空存储位置；依次探查下述地址单元：d0+1，d0+2，...，m-1， 0，1，...，d0-1；用于简单线性探查的探查函数是:p(K, i) = i d.散列表的检索 1.假设给定的值为K，根据所设定的散列函数h，计算出散列地址h(K) 2. 如果表中该地址对应的空间未被占用，则检索失败，否则将该地址中的值与K比较 3. 若相等则检索成功；否则，按建表时设定的处理冲突方法查找探查序列的下一个地址，如此反复下去，直到某个地址空间未被占用（可以插入），或者关键码比较相等（有重复记录，不需插入）为止 e.散列表的删除：删除后在删除地点应加上墓碑（被删除标记） f.散列表的插入：遇到墓碑不停止，知道找到真正的空位置第十一章索引技术 1.概念： a.主码：数据库中的每条记录的唯一标识 b.辅码：数据库中可以出现重复值的码 2.B树 a.定义：B树定义：一个m阶B树满足下列条件： (1) 每个结点至多有m个子结点； (2) 除根和叶外其它每个结点至少有??个子结点； (3) 根结点至少有两个子结点例外(空树，or独根) (4) 所有的叶在同一层,可以有??- 1到m-1个关键码 (5) 有k个子结点的非根结点恰好包含k-1个关键码 b.查找在根结点所包含的关键码K1，…，Kj中查找给定的关键码值(用顺序检索(key少)/二分检索 (key多))；找到：则检索成功;否则，确定要查的关键码值是在某个Ki和Ki+1之间，于是取 pi所指结点继续查找;如果pi指向外部结点，表示检索失败. c.插入找到的叶是插入位置，若插入后该叶中关键码个数