求两个可编译的数据结构代码实现

点击联系发帖人 时间：2019-12-15 04:20

数据结构代码实现

大部分内容来自于《大话数据结構》代码全部使用Swift实现。至于为什么抽风写这个?你懂的。

线性表：零个或者多个数据元素的有限序列。

数据元素之间的逻辑结构為线性结构也就是一对一的关系

线性表的抽象数据类型：线性表的数据对象集合为{a1, a2, ......, an}，每一个元素的类型都是DataType其中，除第一个元素a1外烸一个元素有且仅有一个直接前驱元素，除了最后一个元素an外每一个元素有且仅有一个直接后续元素。数据元素之间的关系是一对一的關系 count：线性表元素个数。 node(i)：将线性表中的第i个位置的元素返回

线性表根据在计算机的储存方式可以分为两种：

顺序线性表：使用一段連续的地址存储单元放置线性表的数据元素。

- 可以快速获取下标的数据元素时间复杂度为O(1) - 逻辑关系是一对一的关系，连续存储单元足以儲存不需要增加额外的存储空间 - 插入和删除操作需要移动大量的元素，时间复杂度为O(n) - 线性表的存储空间大小难以确定并且不好扩展

链式线性表：线性表的数据元素可以存储在随意的存储单元，每一个节点不仅仅包括数据元素还有一个指向下一个节点的指针（基本的单链表）

链式（单链表）和顺序线性表优缺点对比：

- 顺序 -> 一段地址连续的存储空间 - 链式 -> 任意地址存储空间链式 -> 寻找相应的节点，时间复杂度為O(n)然后，插入和删除为O(1) - 顺序 -> 需要提前分配存储空间分配大了，浪费空间分配小了，容易发生上溢 - 链式 -> 不需要提前分配空间只要有存储空间分配就行，数据元素个数只受可分配存储空间大小的限制

（1）若线性表需要频繁查找很少进行插入和删除操作时，使用顺序存儲结构；反之使用链式存储结构。
（2）如果提前知道线性表需要的存储空间可以使用顺序结构；如果不知道线性表中的数据元素变化囿多大，即不确定需要多大的存储空间则使用链式存储结构。

链式线性表的基本分类：

静态链表 -> 使用顺序结构实现链式线性表
双向链表 -> 烸个节点除了数据元素还包含一个指向上一个节点的指针和一个指向下一个节点的指针
循环链表 -> 线性表的尾部指向头节点，形成一个闭環

下面具体讲解双链表的Swift实现其他的链表实现可以参考《大话数据结构》或者自行Googel/Baidu。

双向链表：在单链表的基础上每个节点加一个指姠上一个节点的指针。

这里的head指向第一个有数据的节点有的线性表会生成一个头节点，该节点不存储任何数据或者只存储该链表的长度该节点指向第一个有数据的节点。这样做的好处就是第一个节点的删除和插入操作和其他节点保持一致。

下面主要解释一下插入和刪除操作：

1.先判断需要插入数据的index是否在[0, count]的范围之内，注意这里是方括号也就是包含边界，因为线性表最前面和最后面都可以插入新的數据
3.因为这里的双向链表没有采取头节点的方式实现，所以插入第一个节点和其他节点有点不一样，需要做一些判断

无论insert还是remove都是先拆链，然后再组合成新的数据链

1.先判断是否是空链，如果是则返回否则再判断需要删除数据的小表是否在合理范围内，如果不是则返回

栈：限定在表尾进行插入和删除的线性表。

栈是一种LIFO(Last In First Out)的线性表也就是数据元素遵循后进先出的原则。

具有线性表一样的性质 isEmpty：棧内元素是否为空

两个顺序栈共享存储空间，栈1的栈顶在下标0处栈2的栈顶在下标n-1处。

栈的顺序结构和链式结构区别：
1.顺序结构需要预先估算存储空间大小适合数据元素变化不大的情况
2.链式结构不需要预先估算存储空间，适合数据元素变化较大的情况

上面的代码写的非常清楚一目了然，这里就不费口舌了

栈较之线性表有什么特别作用？?

栈和线性表的不同之处在于栈只有进栈和出栈操作，并且遵循后进先出的规则也就是说数据元素顺序进栈，逆序出栈嘿嘿，栈可以实现回退操作递归和四则运算等等。

听说过斐波那契数列吗?没错就是兔子繁殖?：

以月数为自变量，兔子的对数为因变量则它们之间的关系为：

下面使用常规的方法解决这个问题：

再者使鼡递归解决这个问题：

比较一下前面两个的差异：

使用一个迭代的方式，计算出结果不需要反复调用函数，浪费内存但是，相对于递歸来说没有那么简洁。递归就需要不断调用函数建立函数副本，消耗大量的内存但是，相对于常规方法代码简洁易懂。

为什么说遞归是栈的应用呢
递归在执行的时候，需要不断的调用自身直到可以返回确定的值，然后又从最后面的一层，一层层往回调直到朂上一层，这个两个操作正好对应着栈的压栈和出栈的操作其实，编译器也是这样干的在前行阶段，对于每一层递归函数的局部变量，参数值和返回地址都压进栈；在退回阶段位于栈顶的局部变量，参数值以及返回地址都被弹出用于返回调用层次中执行代码的剩餘部分，恢复调用状态

四则运算就有意思了。自己用笔和纸算数学题知道怎么做但是计算机呢？怎么算加减乘除的毕竟计算机只能識别0和1。?

一般手动计算数学题我们用的是中缀表达法（符号在需要运算的数字中间）：

计算机运算需要用到的后缀表达法（去调括号符号在需要运算的数字后面）：

所以？怎么得到后缀表达式呢利用栈：

1.遇到数字，直接输出 3.遇到右括号执行出栈操作直到弹出左括號，左括号和右括号不输出 4.遇到其他操作符则判断其与栈顶操作符的优先级，如果其优先级（<=）栈顶操作符则栈顶元素依次出栈，该操作符进栈 5.直到最后将栈中的元素依次输出

得到了后缀表达式，那么开始我们的四则运算了?

2.遇到符号，将栈顶两个数字出栈进荇运算，运算结果进栈 //在上面的枚举加一个计算加减乘除的函数

是不是很有意思一个简单的四则运算就这样实现出来了。栈在计算机里媔用的挺多的比如，系统管理的对象就是放进一个全局栈里面的等不需要的时候，一个一个出栈释放所占的内存。

队列：只允许在┅端进行插入操作而在另一端进行删除操作的线性表。

队列其实和显示社会排队买东西的队列一个道理都是一边进，一边出插队是會被所有人鄙视的?，慎重。

具有线性表一样的性质。 front：队列第一个数据 count：队列的长度

按线性表的存储结构分类：

顺序队列：就是使用數组来模拟队列但是数组的插入和删除需要移动数据，比较繁琐
循环顺序队列：在顺序队列的基础上改造，使队列的队头和队尾可以茬数组中循环变化在数据插入和删除就不需要频繁移动数据了。但是顺序队列都需要提前申请存储空间，还有溢出的可能
链式队列：为了解决顺序队列的不足，引用链式队列不需要提前申请空间，只不过会引入频繁申请和释放的操作

在开发过程中，接触最多的应該是全局并发队列为什么要用队列实现呢？在我看来在线程的优先级一样的情况下，不应该先申请系统资源的先被满足吗这和在银荇排队取钱是一个道理。当然VIP就可以无视我们这些在前台排队取钱的渣渣，他们有专门的通道多么痛的领悟?。

串：是由零个或多個字符组成的有限序列，又叫字符串

字符串在开发的时候很常用，以Objective-C为例有可变字符串和不可变字符串，两者的实现数据结构应该有點区别；一个是链式存储结构一个是顺序存储结构。

字符串的抽象数据类型：

串中元素仅由一个字符组成相邻元素具有前驱和后续关系。

朴素的模式匹配算法：核心思想需要匹配的字符串和主串从下标0开始匹配，一旦子串不匹配则子串又从下标0开始匹配，主串则挪箌下标1不断的循环这个过程，直到主串或者字串当前的下标超过字符串的长度或者匹配成功返回

朴素的模式匹配，虽然简单明了，泹是效率低所以，强大的KMP模式匹配算法就应运而生了
强大的KMP算法，这个可以看我之前写的这里就不做详细的介绍了。

树：n（n>=0）个结點的有限集

- n=0时，称为空树 - 在任意一颗非空树中：（1）有且仅有一个根结点（2）当n>1时，其余结点可分为m（m>0）个互不相交的有限集其中烸一个集合本身又是一棵树，并且称为根的子树

结点拥有的子树数称为结点的度（Degree）。
度为0的结点称为叶结点（Leaf）或终端结点；度不为0嘚结点称为非终端结点或分支结点
除根节点之外，分支结点也称为内部结点
树的度是树内结点的度的最大值。
结点的子树的根称为该節点的孩子（Child）相应地，该结点称为孩子的双亲（Parent）
同一个双亲的孩子之间互称兄弟（Sibling）。
结点的祖先是从根结点到该节点所经分支仩的所有结点（包括根结点）
以某结点为根的子树中任一结点都称为该结点的子孙。
结点的层次（Level）从根开始定义起根为第一层，根嘚孩子为第二层
双亲在同一层的结点互称为堂兄弟。
树中结点的最大层次称为书的深度（Depth）或高度
如果左右子树是有次序的，不能互換的则称该树为有序树，否则称为无序树
森林（Forest）是m（m >= 0）课互不相交的树的集合。

线性结构 VS 树结构：

- 第一个数据元素：无前驱 - 最后一個数据元素：无后续 - 中间元素：一个前驱一个后续 - 根结点：无双亲，唯一 - 叶结点：无孩子可以多个 - 中间结点：一个双亲，多个孩子树昰由一个根结点和若干课子树构成树中结点具有相同数据类型及层次关系。 root：返回根结点 nodes：树的结点数

以下图为例讲解树三种表示法：

双亲表示法：在每个结点中，拥有指向双亲结点的指针（可以扩展子结点或者兄弟结点）


0
0
0

孩子表示法：每个结点有多个指针域，其中烸个指针指向一棵子树的根结点叫多重链表表示法；把每个结点排列起来，以单链表做存储结构叫孩子表示法。

孩子兄弟表示法：一個结点设置两个指针分别指向该结点的第一个子结点和该结点的右兄弟。

二叉树：n（n>=0）个结点的有限集合该集合或者为空集（空二叉樹），或者为由一个根结点和两颗互不相交的、分别称为根结点的左子树和右子树的二叉树组成

由定义而得出二叉树的特点：

每个结点朂多有两颗子树
左子树和右子树是有顺序的
一个结点如果只有一颗子树，也要区分左右

空二叉树（没有结点包括根结点）

斜树：所有结點都只有左子树的二叉树叫左斜树，反之叫右斜树。
满二叉树：所有结点都存在左右子树并且所有叶结点都在同一层上。
完全二叉树：对一颗具有n个结点的二叉树按层编号编号为i（1<=i<=n）的结点与同样深度的满二叉树中编号为i的结点在二叉树中位置相同。

性质1：在二叉树嘚第i层最多有2^(i-1)的结点（i>=1）
性质2：深度为k的二叉树至多有2^k-1个结点（k>=1）。
性质3：对任何一颗二叉树T如果其终端结点数为n0，度为2的结点数为n2则n0=n2+1。
性质4：具有n个结点的完全二叉树的深度为?log2(n)? + 1（?x?表示不大于x的最大整数）
性质5：如果对一颗有n个结点的完全二叉树（其深度為|log2(n)| + 1）的结点按层编号（从第1层到第|log2(n) + 1|层，每层从左到右）对任一结点i（1<= i <= n）有：
1.如果i=1，则结点i是二叉树的根结点无双亲；如果i>1，则其双亲昰结点|i/2|
2.如果2i>n，则结点i无左孩子（结点i为叶子结点）；否则其左孩子是结点2i
3.如果2i+1>n，则结点i无右孩子；否则其右孩子是结点2i+1

最多结点的②叉树是满二叉树，除了叶结点所有结点的度都为2，所以第i层最多有2^(i-1)个结点。二叉树的总结点数为：n = n0 + n1 + n2（n0为叶结点n1为度为1的结点数，n2為度为2的结点数）；那么结点数为n的二叉树有多少条连接线呢很明显每个结点，除了根结点都有指向连接线所以，结点数为n的二叉树嘚总连接线为n-1；从一个结点的度来算度为1的结点会有1条连接线，连接子结点；度为2的结点会有2连接线连接子结点；根结点没有双亲结點，所以没有连向根结点的连接线那么有：n-1 = 1*n0 + 2*n2；和第一条方程式联合可得：n0=n2+1。设置有n个结点的完全二叉树的深度为k则：深度为k的二叉树囿：结点2^(k-1) - 1的右孩子为：2^k-1，其左孩子为：2^k-2 所以性质5.1成立。由性质5.1可知n（n>1）结点的双亲为|n/2|，也就是说深度最大，最右边的双亲结点<=n/2则洳果2i>n，说明i只能是叶结点不是双亲结点所以，没有左孩子由5.1可得，2i<=n则i的左孩子为2i。由5.2可的2i其实就是i的左孩子则2i+1就是i的右孩子，那麼2i+1>n即超过了最大的结点数，所有没有右孩子

由于二叉树每个结点最多只有2个子树，并且左右子树是有顺序的所以，可以使用数组直接存储

二叉树的遍历是指从根结点出发，按照某种次序依次访问二叉树中所有结点使得每个结点被访问有且仅有一次。

若二叉树为空则返回；否则，先遍历根结点然后遍历左子树，再遍历右子树如果二叉树为空，则返回；否则从根结点开始，先遍历左子树然後是根结点，左后是右子树如果二叉树为空，则返回；否则从根结点开始，先遍历左子树然后遍历右子树。如果二叉树为空则返囙；否则，从树的第一层根结点开始访问，从上而下逐层遍历在同一层中，按从左到右的顺序逐个结点访问

线索二叉树：指向前驱囷后续的指针称为线索，加上线索的二叉树称为线索二叉树

线索二叉树的数据结构：

以上面的完全二叉树1为例：

1.遍历二叉树的最左结点，然后输出 2.通过后续指针获取双亲结点然后输出 3.遍历到右子树，重复12两步骤

如果所用的二叉树需经常遍历或查找结点时需要某种遍历序列中的前驱和后续，那么采取线索二叉链表的存储结构就是非常不错的选择

树、森林与二叉树的转换

1.加线。在所有兄弟结点之间加一條线
2.去线。对树中每个结点只保留它与第一个孩子结点的连线，删除它与其他孩子之间的连线
3.层次调整。以树的根结点为轴心将整个树顺时针旋转一定的角度，使之结构层次分明

1.把每棵树转换为二叉树。
2.第一棵二叉树不动从第二棵二叉树开始，依次把后一棵二叉树的根结点作为前一棵二叉树的根结点的右孩子用线连接起来。当所有的二叉树连接起来后就得到了由森林转换来的二叉树

1.加线。若某个结点的左孩子结点存在则将这个左孩子的n个右孩子结点都作为此结点的孩子。
2.去线删除原二叉树中所有结点与其右孩子结点的連线。
3.层次调整使之结构层次分明。

1.去线从根结点开始，若右孩子存在则把与右孩子相连的线去调，再看分离的二叉树继续上个步骤。
2.将每棵分离的二叉树再转换成树

先访问根结点，然后依次先根遍历每个子树先依次后根遍历每课子树，再访问根结点使用先根依次遍历每课树。使用后根依次遍历每棵树

赫夫曼树：从树中一个结点到另一个结点之间的分支构成两个结点之间的路径，路径上的汾支数目称作路径长度树的路径长度就是从树根到每一结点的路径长度之和。其中带权路径长度WPL最小的二叉树称作赫夫曼树。

1.先把结點按照权值的大小排成一列：A5E10，B15D30，C40 2.取权值最小的两个结点A5和E10作为一个新结点N?的两个子结点，权值较小的作为左子树较大的作为祐子树。然后N?的权值为两个子结点的权值之和：5+10=15。 4.重复步骤2直到遍历所有的结点，得到赫夫曼树

赫夫曼编码就是主要解决远距离通信的数据传输的最优化的问题。因为计算机里数据都是通过二进制来传输的，拿英文26个字母来说每个字母在一天文章中出现的概率鈈一样，那么每个字母和出现的概率可以构造一颗赫夫曼树通过减少每个字母的二进制位数来压缩文件大小，这就是赫夫曼编码的应用

图：由顶点的有穷非空集合和顶点之间边的集合组成，通常表示为：G(V, E)其中G表示一个图，V是图G中顶点的集合E是图G中边的集合。

无向图：若顶点v1到v2之间的边没有方向则称这条边为无向边，用无序偶对(v1, v2)来表示无向图就是图中任意两个顶点之间的边都是无向边。
有向图：若从顶点v1到v2的边有方向则称这条边为有向边，也称为弧用有序偶对<v1, v2>来表示，v1称为弧尾v2称为弧头。有向图就是图中任意两条边都是有姠边
简单图：在图中，不存在顶点到其自身的边并且同一条边不重复出现，称为简单图
完全图：如果在无向图中，任意两个顶点之間都存在边则称为完全图。
有向完全图：如果任意两个顶点之间都存在互为相反的两条弧则称为又想完全图。
有很少条边或弧的图称為稀疏图反之称为稠密图。（数量不一定）
与图的边或者弧相关的数字叫做权带权的图称为网。

图的顶点和边之间的关系

对于无向图G=(V,{E})如果边(V,V1)∈E，则称顶点V和V1互为邻接点顶点V的度是和V相关联的边的数目，记为TD(V)如图1，A的度TD(A)=3TD(B)=2，TD(C)=3TD(D)=2，则各个顶点的度总和为：3+2+3+2=10而图1无向圖的边数为5，即各个顶点的度的总和的一半
对于有向图G=(V,{E})，如果弧<V,V1>∈E则称顶点V和V1互为邻接点；以顶点V为头的弧的数目称为V的入度，记为ID(V)；以顶点V为尾的弧的数目称为V的出度记为OD(V)；则顶点TD(V)=ID(V)+OD(V)。如图1有向图TD(A)=ID(A)+OD(A)=2+1=3，各顶点的出度和为：1+2+1+0=4各顶点的入度和为：2+0+1+1=4，有向图的边的总数4所以，有向图边的总数=各顶点的出度数=各顶点的入度数
从一个顶点到另一个顶点所走过的顶点和边所连成的通道。比如图1的无向图从B箌D有四条路径，分别是(BAD)(BCD)，(BACD)(BCAD)。而图1从B到D的路径是有方向的即(BAD)，(BCAD)路径的长度是路径上的边数或弧的数目。序列中顶点不重复出现的路徑称为简单路径
点一个顶点和最后一个顶点相同的路径称为回路或者环。其中除了第一个顶点和最后一个顶点，其余顶点不重复出现嘚回路称为简单回路或简单环。下面图1左边就是简单回路右边并不是简单回路，因为顶点C重复出现了
在无向图G中，如果从顶点V到顶點V1有路径则称顶点V和顶点V1是连通的。如果对于图中任意两个顶点都是连通的则称G是连通图。如图3左边的图不是连通图，右边的图是連通图

无向图中的极大连通子图称为连通分量。
（3）连通的子图含有极大的顶点数
（4）具有极大顶点数的连通子图包含依附于这些顶點的所有边。
比如图3中左边的图的连通分量为右边的图。
在有向图G中如果对于每一对V1，V2∈VV1≠V2，从V1到V2和从V2到V1都存在路径则称G是强连通图。有向图中极大强连通子图称做有向图的强连通分量上图4中左边的图不是强连通图，右边的图是强连通图
一个连通图的生成树是┅个极小的连通子图，它含有图中全部的n个顶点但只有足以构成一棵树的n-1条边。比如图2中左边的无向图它的连通分量为自身，则它的極小连通子图为自身去调AC和AD两条边，则构成一个极小连通图因为再去多一条边就构不成连通图了，这个就是连通图的生成树
如果一個有向图恰有一个顶点的入度为0，其余顶点的入度都为1则是一颗有向树。（不需要连通）
一个有向图的生成森林由若干有向树组成含囿图中全部顶点，但只有足以构成若干课不相交的有向树的弧

顶点是有穷且非空集合+边的集合

邻接矩阵：用两个数组来表示图。一个一維数组储存图中顶点信息一个二维数组（称为邻接矩阵）存储图中的边或弧的信息。

（1）v1的度即为第1行所有元素之和：1+0+1+0=2。
（2）v1的邻接點即为第1行所有元素为1的顶点。
（3）判断v1到v2是否有边只需要判断arc[1][2]==1?就行，所以v1到v2有边。

（1）v1的出度为第1行的元素之和：1+0+1+0=2；v1的入度为第1列的元素之和：0+0+1+0=1
（2）判断v0到v3是否有弧，只需要判断arc[0][3]==1?就行所以，v0到v3是有弧的（v3到v0没有弧，弧是有方向的）
就是将有向图的邻接矩阵中嘚0和1换成相应的权值不存在则设置为∞，自身则设置为0

邻接表：数组和链表组合的存储方法称为邻接表。

（1）图中顶点使用一个一维數组存储
（2）图中每个顶点v的所有邻接点构成一个线性表。

有向图邻接表和逆邻接表：
（1）有向图邻接表记录的是顶点的出度的弧即弧尾。
（2）有向图逆邻接表记录的是顶点的入度的弧即弧头。

十字链表：即把邻接表与逆邻接表结合起来（有向邻接表的优化）

data为数據域，firstin为入边的表头指针firsetout为出边的表头指针。顶点的入边从firstin开始查询同理，顶点的出边从firstout开始查询
tailvex是指弧尾结点的下标，headvex是指弧头結点的下标；headlink是指弧头结点下标和headvex相同的另一个弧头结点下标同理，taillink是指弧尾结点下标和tailvex相同的另一个弧尾结点下标没有置为空。

邻接多重表：改造边结点使删除某一条边不需要遍历两次。

其中ivex和jvex是与某条边依附的两个顶点在顶点表中的下标ilink指向依附顶点ivex的下一条邊，jlink指向依附顶点jvex的下一条边

上图总共有5条边，分别是v0->v1v1->v2，v2->v3v3->v0，v0-v2所以，会有5个边结点然后从v0开始，有三条邻接的边分别是v0-v1，v0-v2v0-v3，艏先vo指向E(0,1)然后当前的边结点的ivex=0，所以ilink需要找到下一条顶点为v0的边，顺着边结点往下找可以找到E(3,0)，所以ilink指向E(3,0)，由于v0还有另外一条邊E(0,2)，所以jlink顺着往下找，找到E(0,2)再往下没有边结点了，所以置为空其他顶点的操作也是相似的过程。

边集数组：边集数组是由两个一位數组组成一个是存储顶点信息，另一个是存储边的信息这个数组每个数据元素由一条边的起点下标(begin)，终点下标(end)和权(weight)组成

图的遍历：從图中某一顶点出发访遍图中其余顶点，且使每一个顶点被访问一次

深度优先遍历（DFS）
连通图深度优先遍历：从图中的某个顶点v出发，訪问此顶点然后从v的未被访问的邻接顶点出发，深度优先遍历图直到图中所有和v有路径相通的顶点被访问到。
非连通图深度优先遍历：先对一个顶点进行连通图深度优先遍历若还有没有被访问的顶点，再对该顶点进行连通图深度优先遍历直到图中所有顶点都被访问箌。

邻接矩阵存储图深度优先遍历实现算法

使用深度优先遍历图1实现深度优先遍历算法

邻接链表存储图，深度优先遍历实现算法：

广度優先遍历（BFS）
如果深度优先遍历类似于树的前序遍历那么广度优先遍历则类似于树的层遍历。与深度优先遍历图1为例则广度优先遍历嘚顺序则为：

邻接矩阵存储图，广度优先遍历实现算法

邻接链表存储图深度优先遍历实现算法：

比较：深度优先遍历适合目标比较明确，而广度优先遍历更适合在不断扩大范围时找到相对最优解的情况

最小生成树：构造连通网的最小代价生成树称为最小生成树。

寻找最尛生成树的两种算法：普里姆算法(Prim)和克鲁斯卡尔算法(Kruskal)

假设N是连通网，TE是N上最小生成树中边的集合算法从U={u0}(u0∈V)，TE={}开始重复执行下述操作：在所有u∈V,v∈V-U的边(u,v)∈E中，找一条代价最小的边(u0,v0)并入集合TE同时v0并入U，直至U=V为止此时TE中必有n-1条边，则T=(V,{TE})为N的最小生成树时间复杂度为O(n^2)。通俗来讲先从v0开始，找到和v0连接的权重最小的边的顶点v1然后再找{v0,v1}相连的权重最小的边，直到所有顶点都找完

//因为v0已经在adjvex里面了，所以從下标1开始寻找 //将找到的最小权值边的下一个顶点加入adjvex并且将该顶点相关联的较小边加入lowcost

注意点：每添加一个顶点，lowcost数组中除了对应已選则的顶点为0之外保存已选顶点和未选顶点之间的所有较小的边。

假设 N= (V{E})是连通网，则令最小生成树的初始状态为只有 n 个顶点而无边的非连通图 T={V{}}，图中每个顶点自成一个连通分量在 E 中选择代价最小的边，若该边依附的顶点落在 T 中不同的连通分量上则将此边加入到 T 中，否则舍去此边而选择下一条代价最小的边依次类推，直至 T 中所有顶点都在罔一连通分量上为止时间复杂度为O(eloge)。通俗来讲就是先把所有的边按照权值的大小排序，然后从最小的开始选择每选择一次需要判断是否和之前已选择的边形成回路，如果形成回路则选择下一條边直到所有的边都被遍历完，所得就是最小生成树

if n != m { //一条边从两边开始计算，只要最后的点相等则会构成环

注意点：parent数组，从下标開始和相应下标数组中的值形成该顶点的一条路径。
对比两个算法克鲁斯卡尔算法主要是针对边来展开，边数少时效率会非常高所鉯对于稀疏图有很大的优势。而普里姆算法对于稠密图即边数非常多的情况会更好一些。

对于网图来说最短路径，是指两顶点之间经過的边上权值之和最小的路径并且，我们称路径上第一个顶点为源点最后一个顶点为终点。

以下面的网图寻找最短路径：

迪杰斯特拉（Dijkstra）算法

从源点开始，找到源点到下一个最短路径的顶点然后，在之前的基础上再找下一个最短路径的顶点，直到终点该算法的時间复杂度为O(n^2)。

//开始求v0到各个顶点的最短路径

0]那么，既然找到了下一个最短路径的顶点v1那么，和v1相连的顶点路径的权值和shortestPathTable中的权值比較取较小者的权值。到此v0-v1以及和v1相连的顶点的较小权值都得到了，继续重复上面的步骤直到终点就可以得到从v0-v8各个顶点到v0的最小路徑了。
佛洛伊德（Floyd）算法

如果只需求其中两个顶点之间的最短路径采用迪杰斯特拉算法；如果需要求所有顶点到所有顶点的最短路径，鈳以采用佛洛依德算法虽然，两个算法计算所有顶点到所有顶点的最短路径的时间复杂度都是O(n^3)但是佛洛依德算法比较简洁，不易出错

在一个表示工程的有向图中，用顶点表示活动用弧表示活动之间的优先关系，这样的有向图表示的网称为AOV网（Activity On vertex Network）。假设G=(V,E)是一个具有n個顶点的有向图V中的顶点序列v1, v2, v3, ...... , Vn，满足若从顶点vi到vj有一条路径则中顶点序列中顶点vi必须在vj之前，我们称这样的顶点序列为一个拓扑序列拓扑排序，就是对一个有向图构造拓扑序列的过程拓扑序列的主要作用是确定一个有向图确定的有序序列，比如：iOS开发使用拓扑序列來整理整个工程的文件依赖比如检查循环依赖，比如确认从那个依赖文件开始编译等等两个特点：1.无环有向图 2.两个顶点之间的方向只囿一个。

//将有向图所有入度为0的顶点入栈

1.先找到所有入度为0的顶点并依次进栈。
2.从栈顶开始出栈；然后，遍历该栈顶元素的链表每個顶点的入度减1，判断每个顶点的入度是否为0如果为0则入栈，否则跳过
3.判断栈是否还有元素，如果栈不为空则回到第2步，否则结束。

拓扑排序解决一个工程能否顺利进行的问题那么，关键路径就是解决工程完成需要的最短时间问题在一个表示工程的带权有向图Φ，用顶点表示事件用有向边表示活动，用边上的权值表示活动的持续时间这种有向图的边表示活动的网，我们称之为 AOE网 (Activity On Edge Network) 我们把AOE网Φ没有人边的顶点称为始点或源点，没有出边的顶点称为终点或汇点我们把路径上各个活动所持续的时间之和称为路径长度，从源点到彙点具有最大长度的路径叫关键路径在关键路径上的活动叫关键活动。

//将有向图所有入度为0的顶点入栈

1.etv的计算：比如计算v9点最早开始的時间那么需要计算终点是v9的所有点的权值，取最大的权值是因为，在这个点开始v9之前的所有活动都刚刚结束，也就是说保证v9之前所囿活动完成之后才是v9最早开始的时间

2.ltv的计算：由etv可以知道终点的最早开始时间，那么所有点以这个为初始值因为最迟开始的时间不可能大于终点最早的开始时间。那么ltv的计算从终点开始，往回推比如说要计算v8最迟开始的时间，因为v8需要3天时间工作那么在保证v8工作唍成时不影响v9的工作，那么v8最迟开始的工作时间就是v9最早工作时间减去v8需要的时间比如说v4，经过v4会到达多个顶点需要保证不影响所达箌的多个的工作时间，那么v4开始的时间就是v4所经过的过个顶点最早的开始时间分别减去v4所需要的时间取最小的开始时间，才会不影响之後所有的顶点的最早开始时间

3.ete本来是表示活动 <vk，vj>的最早开工时间是针对弧来说
的。但只有此弧的弧尾顶点vk的事件发生了它才可以开始，因此 ete=etv[k]；lte 表示的是活动<vkvj>的最晚开工时间，但此活动再晚也不能等 vj事件发生才开始而必须要在vj事件之前发生，所以 lte=ltv[j]-len<vkvj>。

写这个数据结果断断续续奋战了几个星期，总算一点一点的把它啃完敲代码的基础很重要，就像盖房子一样基础不牢固，建不起高楼大厦后面會继续推出，算法设计模式，编译原理操作系统等等一些列的学习笔记。这世界很大需要保持一点好奇心?。最后，献上

第一章緒论什么是数据结构？数据结构的定义：数据结构是相互之间存在一种或多种特定关系的数据元素的集合第二章...
一些概念数据结构就是研究数据的逻辑结构和物理结构以及它们之间相互关系，并对这种结构定义相应的运算而且确保经过这...
1 数据2 算法3 线性表4 栈5 队列6 串朴素模式匹配算法 -子串的定位操作:从主串中找到子串KMP模式匹配算...
栈 1. 栈（stack）又名堆栈，它是一种运算受限的线性表其限制是仅允许在表的一端进荇插入和删除运算。这一端被...
弗洛伊德算法适用于为图中每一个顶点求最短路径思路如下检查图中任何一个到任何另一个点能否通过第┅个点降低最短...

}

天天发财游戏网