组合算法的选择与应用

作者: 发表于2011-06-10 13:56:31 【大中小】浏览:2936次评论:0条

由于贪心策略自身的特点，使得数字10所在的格子成为一个“坏格子”，即运用贪心策略找不到它，而运用动态规划法求解的第一步（1→2）并不是最优选择，但却保证了全局最优解；运用贪心策略求解的第一步（1→3）保证了

图三

局部最优解，却无法保证全局最优解。我们若用图3所示的N×M的矩阵表示一组数,设运用与引例同样的移动规则后得到了由若干个元素组成的数列A。可得如下结论：

若a >a

,则a 、a 、…a 一定不在数列A中。对于一元素a (2≤p≤m)，设a =∞，若保证全局最优解，则a 必在数列A中，但运用贪心策略求解时a 不在数列A中。由此可见，贪心策略并不到达问题状态的全部空间。若用空间图来表示贪心算法和动态规划算法（如下图），我们可以清楚地看到，贪心算法

问题状态空间动态规划所用空间贪心策略所用空间

图 4

是一种对输入数据进行不断收缩的过程。它并不到达问题的全部状态空间。这是由本文所述的贪心策略的线形解题框架所决定的。

四、贪心策略的理论基础

——矩阵胚

正如前文所说的那样，贪心策略是最接近人类认知思维的一种解题策略。但是，越是显而易见的方法往往越难以证明。下面我们就来介绍贪心策略的理论——矩阵胚。

“矩阵胚”理论是一种能够确定贪心策略何时能够产生最优解的理论，虽然这套理论还很不完善，但在求解最优化问题时发挥着越来越重要的作用。

【定义3】 矩阵胚是一个序对M=[S，I] ，其中S是一个有序非空集合，I是S的一个非空子集，成为S的一个独立子集。

如果M是一个N×M的矩阵的话，即

a , a ,......, a

. . . . . .

M= a , a ,......, a

. . . . . .

a , a ,......, a

S是M的各个行，S=（a , a ,......, a

），I是线形无关的若干行a , a , a ......

若M是无向图G的矩阵胚的话，则S为图的边集，I是所有构成森林的一组边的子集。

如果对S的每一个元素X（X∈S）赋予一个正的权值W（X），则称矩阵胚M=（S，I）为一个加权矩阵胚。

适宜于用贪心策略来求解的许多问题都可以归结为在加权矩阵胚中找一个具有最大权值的独立子集的问题，即给定一个加权矩阵胚，M=（S，I），若能找出一个独立且具有最大可能权值的子集A，且A不被M中比它更大的独立子集所包含，那么A为最优子集，也是一个最大的独立子集。

我们认为，针对绝大多数的信息学问题，只要它具备了“矩阵胚”的结构，便可用贪心策略求解。矩阵胚理论对于我们判断贪心策略是否适用于某一复杂问题是十分有效的。

五、几种典型的贪心算法

贪心策略在图论中有着极其重要的应用。诸如Kruskal、 Prim、 Dijkstra等体现“贪心”思想的图形算法更是广泛地应用于树与图的处理。下面就分别来介绍Kruskal算法、Prim算法和Dijkstra算法。

Ⅰ、库鲁斯卡尔（Kruskal）算法

【定义4】 设图G=（V，E）是一简单连通图，｜V｜ =n,｜E｜=m,每条边e

i都给以权W ，W 假定是边e 的长度（其他的也可以），i=1，2，3，...，m。求图G的总长度最短的树，这就是最短树问题。

kruskal算法的基本思想是：首先将赋权图G的边按权的升序排列，不失一般性为：e

,e ,......,e 。其中W ≤W ，然后在不构成回路的条件下择优取进权最小的边。

其流程如下：

（1）对属于E的边进行排序得e

≤e ≤...... ≤e 。

（2）初始化操作 w←0，T←ф ，k←0，t←0；

（3）若t=n-1，则转（6），否则转（4）

（4）若T∪｛e

｝构成一回路，则作

【k←k+1，转（4）】

（5） T←T∪{ e

}，w←w+ w ，t←t+1，k←k+1，转（3）

（6）输出T，w，停止。

下面我们对这个算法的合理性进行证明。

设在最短树中，有边〈v

，v 〉，连接两顶点v ，v ，边〈v ，v 〉的权为wp，若〈v ，v 〉加入到树中不能保证树的总长度最短，那么一定有另一条边〈v ，v 〉或另两条边〈v ，v 〉、〈v ，v 〉，且w<vi，vj><wp或w<vi，vk>+w〈vk，vj〉<wp，因为〈v ，v 〉、〈v ，v 〉不在最短树中，可知当〈v ，v 〉、〈v ，v 〉加入到树中时已构成回路，此时程序终止。因为〈v ，v 〉∈ T，〈v ，v 〉∈T且w〈vI，vk〉+w〈vk，vj〉<w p，与程序流程矛盾。

Ⅱ、普林（Prim）算法：

Kruskal算法采取在不构成回路的条件下，优先选择长度最短的边作为最短树的边，而Prim则是采取了另一种贪心策略。

已知图G=（V，E），V={v ，v

，v ，...， v }，D=（d ）是图G的矩阵，若〈v ，v 〉∈E，则令dij=∞，并假定dij=∞

Prim算法的基本思想是：从某一顶点（设为v

）开始，令S←｛v ｝，求V\S中点与S中点v 距离最短的点，即从矩阵D的第一行元素中找到最小的元素，设为d ，则令S←S∪ { v }，继续求V\S中点与S的距离最短的点，设为v ,则令S←S∪{ v }，继续以上的步骤，直到n个顶点用n-1条边连接起来为止。

流程如下：

(1) 初始化操作：Ｔ←ф，ｑ（1）←-1，ｉ从２到ｎ作

【ｐ（ｉ）←1，ｑ（ｉ）←ｄｉ１】，ｋ←1

(2) 若ｋ≥n,则作【输出T,结束】

否则作【min←∞，ｊ从２到ｎ作

【若０<q(i)<min则作

【min←q(i) h←j】

　　　　　　　　　　】

(3) Ｔ←Ｔ∪{ｈ，p(h)},q(h)←-1

(4) ｊ从２到ｎ作

　　　　【若d <q(j)

则作【q(j)←d ,p(j)←h】】

(5) ｋ←ｋ＋１，转(2)

算法中数组p（i）是用以记录和v

点最接近的属于S的点，q（i）则是记录了v 点和S中点的最短距离，q（i）=-1用以表示v 点已进入集合S。算法中第四步：v 点进入S后，对不属于S中的点vj的p（j）和q（j）进行适当调整，使之分别记录了所有属于S且和S距离最短的点和最短的距离，点v , v ，…，v 分别用1，2，…,n表示。

Ⅲ、戴克斯德拉（Dijkstra）算法：

已知图G=（V，E），V={v

，v ，..., v }，起始顶点v ，求v 点到其他各点的最短路径。

算法如下：

令S表示已求出最短路径的顶点集合。对于不在S中的顶点w，令d（w）表示从v

开始且通过S中的顶点到达w的最短路径的长度。S的初态为空，若v 通过S中的顶点到w有路径，则d（w）为v 到w的最短的一条路径的长度；若v 没有经S中的顶点到w的路径，则d（w）=∞，初始时设d（v ）=0，除v 外的所有顶点v v （v ∈V且v ≠v ），d（v ）=∞。

六、 贪心策略的应用

在现实世界中，我们可以将问题分为两大类。其中一类被称为P类问题，它存在有效算法，可求得最优解；另一类问题被称为NPC类问题，这类问题到目前为止人们尚未找到求得最优解的有效算法，这就需要每一位程序设计人员根据自己对题目的理解设计出求较优解的方法。下面我们着重分析贪心策略在求解P类问题中的应用。

§6.1 贪心策略在P类问题求解中的应用

§6.1.1

贪心策略在求P类最优解问题中的应用

在现实生活中，P类问题是十分有限的，而NPC类问题则是普遍的、广泛的。在国际信息学奥林匹克竞赛的发展过程中，由于受到评测手段的限制，在1989年至1996年的8年赛事中，始终是以P类问题为主的，且只允许求最优解。在这些问题中，有的题目可以用贪心策略来直接求解，有的题目运用贪心策略后可以使问题得到极大的简化，使得程序对大信息量的处理提供了可能。

[例1]删数问题

试题描述 键盘输入一个高精度的正整数N，去掉其中任意S个数字后剩下的数字按左右次序组成一个新的正整数。对给定的N和S，寻找一种删数规则使得剩下得数字组成的新数最小。

试题背景 此题出自NOI94

试题分析 这是一道运用贪心策略求解的典型问题。此题所需处理的数据从表面上看是一个整数。其实，大家通过对此题得深入分析便知：本题所给出的高精度正整数在具体做题时将它看作由若干个数字所组成的一串数，这是求解本题的一个重要突破。这样便建立起了贪心策略的数学描述。.

[例2]数列极差问题

试题描述 在黑板上写了N个正整数作成的一个数列，进行如下操作：每一次擦去其中的两个数a和b，然后在数列中加入一个数a×b+1，如此下去直至黑板上剩下一个数，在所有按这种操作方式最后得到的数中，最大的max，最小的为min，则该数列的极差定义为M=max-min。

编程任务：对于给定的数列，编程计算出极差M。

试题背景 这是1997年福建队选拔赛的一道题目。

试题分析 当看到此题时，我们会发现求max与求min是两个相似的过程。若我们把求解max与min的过程分开，着重探讨求max的问题。

　　下面我们以求max为例来讨论此题用贪心策略求解的合理性。

讨论：假设经（Ｎ－3）次变换后得到３个数：a,b,max＇

（max＇≥ａ≥ｂ），其中max＇是（Ｎ－２）个数经（Ｎ－３）次ｆ变换后所得的最大值，此时有两种求值方式，设其所求值分别为Ｚ

，Ｚ，则有：Ｚ＝（ａ×ｂ＋１）×max＇＋１，Ｚ＝（ａ×max＇＋１）×ｂ+１　所以　Ｚ－Ｚ＝max＇－ｂ≥０若经（Ｎ－２）次变换后所得的３个数为：ｍ，ａ，ｂ（ｍ≥ａ≥ｂ）且ｍ不为（Ｎ－２）次变换后的最大值，即ｍ＜max＇则此时所求得的最大值为：Ｚ＝（ａ×ｂ+１）×ｍ+１　此时Ｚ－Ｚ＝（１+ａｂ）（max＇－ｍ）＞０　所以此时不为最优解。

　　所以若使第ｋ（１≤ｋ≤Ｎ－１）次变换后所得值最大，必使（ｋ－１）次变换后所得值最大（符合贪心策略的特点2），在进行第ｋ次变换时，只需取在进行（ｋ－１）次变换后所得数列中的两最小数ｐ，ｑ施加ｆ操作：ｐ←ｐ×ｑ+1，ｑ←∞即可（符合贪心策略特点1），因此此题可用贪心策略求解。讨论完毕。

　　在求ｍｉｎ时，我们只需在每次变换的数列中找到两个最大数ｐ，ｑ施加作用ｆ：ｐ←ｐ×ｑ+１，ｑ←-∞即可．原理同上。

　　这是一道两次运用贪心策略解决的一道问题，它要求选手有较高的数学推理能力。

［例３］最优乘车问题

试题描述　Ｈ城是一个旅游胜地，每年都有成千上万的人前来观光．为方便游客，巴士公司在各个旅游景点及宾馆、饭店等地都设置了巴士站，并开通了一些单向巴士线路。每条单向巴士线路从某个巴士站出发，依次途径若干个巴士站，最终到达终点巴士站。

　　阿昌最近到Ｈ城旅游，住在ＣＵＰ饭店。他很想去Ｓ公园游玩。听人说，从ＣＵＰ饭店到Ｓ公园可能有也可能没有直通巴士。如果没有，就要换乘不同线路的单向巴士，还有可能无法乘巴士到达。

　　现在用整数１，２，...，ｎ给Ｈ城的所有巴士站编号，约定ＣＵＰ饭店的巴士站编号为１，Ｓ公园巴士站的编号为Ｎ。

写一个程序，帮助阿昌寻找一个最优乘车方案，使他在从ＣＵＰ饭店到Ｓ公园的过程中换车的次数最少。

试题背景 出自ＮＯＩ９７

试题分析 此题看上去很像一道搜索问题。在搜索问题中，我们所求的使经过车站数最少的方案，而本题所求解的使换车次数最少的方案。这两种情况的解是否完全相同呢？我们来看一个实例：

图 5

　　如图5所示：共有５个车站（分别为ａ、ｂ、ｃ、ｄ、ｅ），　共有３条巴士线（线路Ａ：ａ→ｄ；线路Ｂ：ａ→ｂ→ｃ→ｅ；线路Ｃ：ｄ→ｅ）。此时要使换车次数最少，应乘坐线路Ｂ的巴士，路线为：ａ→ｂ→ｃ→ｅ，换车次数为０；要使途经车站数最少，乘坐线路应为ａ→ｄ→ｅ，换车次数为１。所以说使换车次数最少的路线和使途经车站数最少的方案不一定相同。这使不能用搜索发求解此问题的原因之一。

原因之二，来自对数学模型的分析。我们根据题中所给数据来建立一个图后会发现该图中存在大量的环，因而不适合用搜索法求解。

题目分析到这里，我们可以发现此题与NOI93的求最长路径问题有相似之处。其实，此题完全可以套用上文所提到的Dijkstra算法来求解。

以上三道题只是使用了单一的贪心策略来求解的。而从近几年的信息学奥林匹克竞赛的命题方向上看，题目更加灵活，同时测试数据较大，规定的出解时间较短。在一些问题中，我们采用贪心策略对问题化简，从而使程序具有更高的效率。

［例４］最佳浏览路线问题

试题描述　某旅游区的街道成网格状（见图），其中东西向的街道都是旅游街，南北向的街道都是林荫道。由于游客众多，旅游街被规定为单行道。游客在旅游街上只能从西向东走，在林荫道上既可以由南向北走，也可以从北向南走。

　　阿隆想到这个旅游区游玩。他的好友阿福给了他一些建议，用分值表示所有旅游街相邻两个路口之间的道路值得浏览得程度，分值从-１００到１００的整数，所有林荫道不打分。所有分值不可能全是负值。

　　例如下图是被打过分的某旅游区的街道图：

　　图6

阿隆可以从任一路口开始浏览，在任一路口结束浏览。请你写一个程序，帮助阿隆寻找一条最佳的浏览路线，使得这条路线的所有分值总和最大。

试题背景　　这道题同样出自ＮＯＩ９７，＇９７国际大学生程序设计竞赛的第二题（吉尔的又一个骑车问题）与本题是属于本质相同的题目。

试题分析 由于林荫道不打分，也就是说，无论游客在林荫道中怎么走，都不会影响得分。因题可知，若游客需经过某一列的旅游街，则他一定要经过这一列的Ｍ条旅游街中分值最大的一条，才会使他所经路线的总分值最大。这是一种贪心策略。贪心策略的目的是降维，使题目所给出的一个矩阵便为一个数列。下一步便是如何对这个数列进行处理。在这一步，很多人用动态规划法求解，这种算法的时间复杂度为Ｏ（ｎ

），当林荫道较多时，效率明显下降。其实在这一步我们同样可以采用贪心法求解。这时的时间复杂度为Ｏ（ｎ）。

§6.1.2 贪心策略在求P类较优解问题中的应用

正如其他学科奥林匹克竞赛一样，国际信息学奥赛的发展同样经历了一个逐步成熟的发展过程。回顾十余年赛事的发展，我们不妨将国际信息学奥赛的发展分为两个阶段：第一阶段是1989—1996年，这一时期奥赛题目的特点是：试题全部为P类问题，且只允许求最优解，题目的设计强调对选手基本算法的掌握。第二阶段为1997年至今。在南非举行的IOI97中，命题方向一举突破传统模式，NPC类问题在竞赛中大量出现，每道题目到具有一定的实际背景，引进了崭新的程序评测机制。在求解P类问题时允许得出较优解并得到相应的分数。这些变化无疑更好地考察了选手的综合素质。在对P类较优解问题的求解过程中，贪心策略无疑扮演着重要角色。IOI97中的障碍物探测器问题便是运用贪心策略来求得较优解的P类问题。

[例5] 障碍物探测器问题

试题描述 有一个登陆舱（POD），里面装有许多障碍物探测车（MEV），将在火星表面着陆，着陆后，探测车离开登陆舱向相距不远的先期到达的传送器（Transmitter）移动。MEV一边移动，采集岩石（ROCK）标本，岩石由第一个访问到它的MEV所采集，每块岩石只能被采集一次，但是这以后，其他MEV可以从该处通过。探测车MEV不能通过有障碍的地面。

本题限定探测车MEV只能沿着格子向南或向东从登陆处向传送器transmitter移动，允许多个探测车MEV在同一时间占据同一位置。

警告：如果某个探测车MEV在到达传送器以前不能在继续合法前进时，则车中的石块必定不可挽回地全部丢失。

任务：计算机探测车的每一步移动，使其送到传送器的岩石标本的数量尽可能多。这两项都做到会使你的得分最高。

输入：火星表面上登陆舱POD和传送器之间的位置用网格P和Q表示，登陆舱POD的位置总是在（1，1）点，传送器的位置总是在（P，Q）点。

火星上的不同表面用三中不同的数字符号来表示：

● 0代表平坦无障碍

● 1代表障碍

● 2代表石块

输入文件的第一行为探测车的个数，第二行为P的值，第三行为Q的值。接下来的Q行为一个Q×P的矩阵。

输出：表示MEV移向transmitter的行动序列。每行包含探测车号和一个数，0或1，这里0表示向南移动，1表示向东移动。

得分：分数的计算将根据收集的岩石样本（取到传送器上）的数目，MEV到达传送器和不到达传送器的数目有关

● 非法移动将导致求解无效，并记作零分，当MEV的障碍物上移动或移出网格，即视为非法。

● 得分=（收集的样品并取到传送器上的数目+MEV到达传送器上的数目-MEV没有到达传送器上的数目）与应得的最大的数目之比（%）

● 最高分为100%，最低分为0%

试题背景 IOI’97中的第一试第一题。国际信息学奥赛中出现的第一道NPC类问题。1997年美国的探测器再次到达火星。火星及太空搜索引起了人们的广泛关注，此题便是以此为素材而创作的。

试题分析 关于迷宫问题相信每一个参加信息学奥赛的选手都不会陌生。对于不同的迷宫，我们可用搜索策略或动态规划进行求解。在本题中，无论运用哪种解题策略均不能得到问题的最优解，我们的任务是合理选择一种解题策略，使我们运用该策略得到的较优解尽可能地接近最优解。我们先来看一个例子（如图7所示）。对于一个探测车而言，我们运用动态规划的方法使探测车经过岩石最多的一条路线便可得到问题的最优解（如图8所示），这时共可收集到岩石10个。

图 7 图 8

当有2个探测车时，我们让第2辆探测车在图8的基础上从地图的起点S行进至终点f（如图9所示），这时我们共收集到岩石15个。而实际上两辆探测车可收集到地图中的全部岩石（共16个），

图 9 图 10

当探测车数量为3时，我们可以收集到全部的16个岩石。

我们可让从起点出发的每一辆探测车都收集到尽可能多的岩石，这实际上是一种贪心策略。对于本题而言，贪心策略并不能保证所得结果全部为最优解，但由于每一辆探测车都收集尽可能多的岩石，而对于由计算机随机产生的测试数据而言，岩石是比较均匀地分布在地图中的，于是我们认为：

探测车收集岩石数≈探测车所游历的地图空间

让每一辆探测车收集尽可能多的岩石，也就是让探测车经过尽可能大的地图空间。所以在探测车数量逐渐增多时，所有探测车所经过的地图空间越多，收集到的岩石也就越多，此时也就越接近最优解。

此题是否存在最优解呢？其实，我们可以用网络流的算法来解决此题。但实践证明，用网络流算法去求解本题所占空间较大，编程复杂度较高且程序调试起来较为困难，因此在实际比赛中，在限定的时间内用贪心策略完成对题目的求借不失为上策。

§6.2 关于运用贪心策略求解NPC类问题的讨论

正如前面所讲的那样，在南非举行的第九届国际奥林匹克信息学竞赛中首次引入了NPC类问题，在杭州举行的NOI98中引入了NOI发展史上的第一道NPC类问题——并行计算。可以说，NPC类问题正在日益引起人们的兴趣。它要求选手根据题意自己建立适当的模型，使程序的解尽量逼近最优解。目前，信息学竞赛所涉及到的少量NPC类问题主要是运用贪心策略或随机化算法去求较优解的。但是对于同一道NPC类问题来说，运用不同的贪心选择所求得的最优解是不同的，不同的贪心选择针对不同的测试数据所得解与最优解的逼近程度也是不同的。所以有关NPC类问题的众多特性以及哪些问题运用贪心策略求得的较优解逼近于最优解仍是需要我们花费大量精力去研究的。信息学奥林匹克的精华—激励创新也许在求解NPC类问题时会得到最大程度的体现。

七、总结

　　通过对贪心策略的分析，大家可以看出：贪心策略作为一种高效算法，广泛地应用与信息学奥林匹克竞赛中。即使表面上看起来与贪心策略关系甚微的题目，运用贪心算法也可使程序的运行效率大大提高。因此，深刻理解贪心策略的数学模型、特点、理论基础、尤其是运用其基本思想解决具体问题是十分重要的。希望本文能给参赛选手以一定的启发。

【附录】

【参考书目】

１　《实用算法的分析与程序设计》

吴文虎，王健德编著，电子工业出版社，ISBN 7-5053-4402-1

２　《计算机算法导引》

卢开澄编著，清华大学出版社，ISBN 7-302-02277-1

3、《国际大学生程序设计竞赛试题解析》

王建德，柴晓路编著，复旦大学出饭社

ISBN 7-309-02141-X/T·210

【部分试题及源程序】

1、吉尔的又一个乘车问题：

Input file:jill.in

Jill likes to ride her bicycle, but since the pretty city of Greenhills where she lives has grown, Jill often uses the excellent public bus system for part of her journey. She has a folding bicycle which she carries with her when she uses the bus for the first part of her trip. She follows the bus route until she reaches her destination of she comes to a part of the city she does not like. In the latter event she will board the bus to finish her trip.

Through years of experience, Jill has rated each road on an integer scale of “niceness”. Positive niceness values indicate roads Jill likes; negative values are used for roads she does not like. Jill plans where to leave the bus and start bicycling, as well as where to stop bicycling and re-join the bus, so that the sum of niceness values of the roads she bicycles on is maximized. This means that she will sometimes cycle along a road she does not like, provided that it joins up two other parts of her journey involving roads she likes enough to compensate. It may be that no part of the route if suitable for cycling so that Jill takes the bus for its entire route. Conversely, it may be that the whole route is so nice Jill will not use the bus at all.

Since there are many different bus routes, each with several stops at which Jill could leave or enter the bus, she feels that a computer program could help her identify the best part to cycle for each bus route.

INPUT

The input file contains information on several bus routes. The first line of the file is a single integer b representing the number of route descriptions in the file. The identifier for each route (r) is the sequence number within the data files,1

≤r

≤b. Each route description begins with the number of stops on the route : an integer s, 2≤s≤20,000 on a line by itself. The number of stops is followed by s-1 lines, each line i(1≤i≤s) is an integer ni representing Jill’s assessment of the niceness of the road between the two stops i and i+1.

OUTPUT

For each route r in the input file, your program should identify the beginning bus stop i and the ending bus stop j that identify the segment of the route which yields the maximal sum of niceness m=ni+ni+1+…+nj-1.If more than one segment is maximally nice, choose the one with longest cycle ride(largest j

-i). To break ties in longest maximal segments, choose the segment that begins with the earliest stop(lowest i).For each route r in the input file, print a line in the form:

The nicest part of route r is between stops i AND j.

However, if the maximal sum is not positive, your program should print:

Route r has no nice parts.

INPUT SAMPLE

- 1

- 5

OUTPUT SAMPLE

The nicest part of route 1 is between stops 2 and 3

The nicest part of route 2 if between stops 3 and 9

Route 3 has no nice parts

2、求最长路径问题（NOI93）：

对一个不存在回路的有向图，编程求出途经结点数最多的一条路径。有向图存放在一个文本文件中，第0行为一个数字，为该图的结点总数N，其下还有N行，每行有N个非0即1的数字。若第i行第j列的数字为1，则表示结点i到结点j存在由i指向j的边，否则该数为0。

3、删数问题的源程序：

输入数据：一个高精度正整数N，所删除的数字个数S。

输出数据：去掉的数字的位置和组成的新的正整数。

Program Delete_digit;

Var n:string;{n是由键盘输入的高精度正整数}

s,a,b,c:byte;{s是所要删除的数字的个数}

data:array[1..200] of 0..9; {记录删除的数字所在位置}

begin

readln(n);

readln(s);

for a:=1 to s do

for b:=1 to length(n) do if n[b]>n[b+1] then {贪心选择}

begin

delete(n,b,1);

data[a]:=b+a-1; {记录所删除的数字的位置}

break;

end;

while n[1]='0' do delete(n,1,1); {将字符串首的若干个“0”去掉}

writeln(n);

for a:=1 to s do writeln(data[a],' ');

end.

4、最优乘车问题

输入数据：输入文件INPUT.TXT。文件的第行是一个数字M（1≤M≤100）表示开通了M条单向巴士线路，第2行是一个数字N（1<N≤500），表示共有N个车站。从第3行到第M+2行依次给出了第一条到第M条巴士线路的信息。其中第i+2行给出的是第i条巴士线路的信息，从左至右依次按行行驶顺序给出了该线路上的所有站点，相邻两个站号之间用一个空格隔开。

输出数据：输出文件是OUTPUT.TXT。文件只有一行，为最少换车次数（在0，1，…，M-1中取值），0表示不需换车即可达到。如果无法乘车达到S公园，则输出“NO”。

Program Travel;

var m:1..100; {m为开通的单向巴士线路数}

n:1..500; {n为车站总数}

result:array[1..501] of -1..100; {到某车站的最少换车数}

num:array[1..500,1..50] of 1..500; {从某车站可达的所有车站序列}

sum:array[1..500] of 0..50; {从某车站可达的车站总数}

check:array[1..500] of Boolean; {某车站是否已扩展完}

Procedure Init;

var f1:text;

a,b,c,d:byte;

data:array[1..100] of 0..100;

begin

assign(f1,'input.txt');

reset(f1);

readln(f1,m);

readln(f1,n);

result[501]:=100;

for a:=1 to m do

begin

for b:=1 to 100 do data[b]:=0;

b:=0;

repeat

inc(b);

read(f1,data[b]);

until eoln(f1);

for c:=1 to b-1 do

for d:=c+1 to b do

begin

inc(sum[data[c]]);

num[data[c],sum[data[c]]]:=data[d];

end;

Procedure Done;

var min,a,b,c,total:integer;

begin

fillchar(result,sizeof(result),-1);

result[1]:=0;

for c:=1 to sum[1] do result[num[1,c]]:=0;

b:=data[1,1];

repeat

for c:=1 to sum[b] do

if (result[num[b,c]]=-1) then result[num[b,c]]:=result[b]+1;

min:=501;

for c:=1 to n do if (result[c]<>-1) and (result[c]<result[min])

then min:=c;

b:=min;

until result[n]<>-1;

writeln(result[n]);{到达S公园的最少换车次数}

end;

begin

Init;

end.

5、最佳游览路线问题

输入数据：输入文件是INPUT.TXT。文件的第一行是两个整数M和N，之间用一个空格符隔开，M表示有多少条旅游街（1≤M≤100），N表示有多少条林荫道（1≤N≤20000）。接下里的M行依次给出了由北向南每条旅游街的分值信息。每行有N-1个整数，依次表示了自西向东旅游街每一小段的分值。同一行相邻两个数之间用一个空格隔开。

输出文件：输出文件是 OUTPUT.TXT。文件只有一行，是一个整数，表示你的程序找到的最佳浏览路线的总分值。

Program Tour;

var m,n:integer; {M为旅游街数，N为林荫道数}

data:array[1..20000] of -100..100;{data是由相邻两条林荫道所分}

procedure Init; {隔的旅游街的最大分值}

var a,b,c:integer;

f1:text;

begin

assign(f1,'input.txt');

reset(f1);

read(f1,m,n);

for a:=1 to n-1 do read(f1,data[a]); {读取每一段旅游街的分值}

for a:=2 to m do

for b:=1 to n-1 do

begin

read(f1,c);

if c>data[b] then data[b]:=c; {读取每一段旅游街的分值，并选择}

end; {到目前位置所在列的最大分值记入数组data}

close(f1);

end;

procedure Done;

var a,sum,result,c:integer;

f2:text;

begin

result:=0;

sum:=0;

a:=0;

while (a<n) do

begin

inc(a); {从数组的第一个数据开始累加，将累加所}

sum:=sum+data[a]; {得到的最大分值记入result}

if sum>result then result:=sum;

if sum<0 then sum:=0; {若当前累加值为负数，则从当前状态起从新}

end; {累加}

assign(f2,'output.txt');

rewrite(f2);

writeln(f2,result);

close(f2);

end;

begin

Init;

Done;

end.

[1] 见参考文献[6]第一章

[2] 在本论文中，我们将规模定义为在一定时间内程序可以运行完毕的情况下输入数据的最大量。

[3] Ackermann函数可用递推关系如下定义

A（m，0）=A（m-1，0） m=1，2，…

A（m，n）=A（m-1，A（m，n-1）） m=1，2，… n=1，2，…

初始条件为

A（0，n）=n+1，n=0，1，…

[4] 见参考文献[6]第二章（产生式系统的搜索策略）

[5] 由于该算法涉及除法运算，为了保证在程序执行过程的中间结果在长整型之内，此算法在求组合数时进行了优化。

【摘要】

本文提出了在组合算法设计和组合算法选择方面所应当遵循的三个原则，即通用性、可计算性和较少的信息冗余量，并初步分析了它们之间的相互关系。这三个原则是整个组合算法设计的主导思想，也是数学建模和算法优化的方向。通过对三个问题的分析，提示了组合算法的设计方法，改进方向和优化技术，是对一系列组合数学原理的实际应用，也是对组合算法设计的初步研究。

【Abstract】

The disquisition brings forward three principle in combination arithmetic designing and combination arithmetic choice. There is currency, countability and less information redundancy. And the disquisition analyses the relation of them. The three principle is the dominant ideology in combination arithmetic designing. Also it is the aspect of making mathematics modeling and optimizing arithmetic. Then the disquisition analyses three questions, prompts the devisal’s method, betterment’s way and the technique optimizing arithmetic. That is actual appliance to a catena of combination mathematics elements and it is also initial research in combination arithmetic designing.

【正文】

一、引 论

组合数学是一个古老的数学分支，也是当代数学中非常重要的数学分支。它发源于有趣的数学游戏，许多古典的组合数学问题，无论在理论数学或应用数学上都有很重要的研究价值。

今天，一方面，极为成熟的组合计数理论为物理学、化学、生物学的发展奠定了坚实的基础，另一方面，由于计算机软硬件的限制，组合计数理论的计算机实践又必然涉及到基于多项式时间内的算法优化问题。本文正是基于以上情况，对一系列组合问题的算法设计做了一些初步探索。

二、组合算法的评价依据

任何事物都有好坏之分，算法也不例外。众所周知，时间复杂度与空间复杂度是算法评价的主要依据。那么，除了这两点外，组合算法的设计还应遵循怎样的原则呢？

1．通用性

通用性即可移植性。一个算法，是只适合于一个特殊问题，还是可以适用于一类问题，这是组合算法评价的一个主要依据，有些组合数学问题，许多信息学竞赛或数学建模竞赛选手一看到题目后往往使用模拟法或构造产生式系统[1]，然后用深度优先搜索（DFS），或广度优先搜索（BFS）求解，用这些方法设计的程序往往受到时间或空间的限制，而且由于在综合数据库中信息存储的数据结构不同，其算法实现时的规模[2]也不同，这必然影响到算法的通用性问题。解决问题的办法是对原问题进行数学抽象，取其精华，去其糟粕。只有对原问题的数学模型仔细分析，抓住本质，才能建立高效的组合算法，只有这种经过数学抽象的算法，才能具有较好的通用性，能够应付较大的规模。

另外，在大规模组合算法的设计过程中，强调通用性的好处是显而易见的，它便于算法的优化和升级。在实际应用中的某些条件改变时，可以重写较少的代码。从软件工程学的角度来说，通用性是必需的。

2．可计算性

这里指的可计算性，是指能够在多项式时间内得出结果。一般来说，对于递归函数来说，由于计算机系统中的空间一定，因此对问题的规模有较严格的限制（例如在Turbo Pascal 7.0系统中，栈的最大空间只有65520字节）因此说，对于大多数的递归函数具有较差的可计算性。通过组合方法，求递归函数的非递归形式是解决这类问题有主要方法，但并不是所有的递归函数都可转化为非递归形式，双递归函数（如Ackermann函数[3]）便不能转化为非递归形式，这类函数具有较小的可计算性。

当然，对于某些递归函数，通过寻找函数本身的组合意义进而将其转化为非递归函数也是一种方法。这种方法的应用读者将在后文中见到。

3、信息冗余量

在组合数学的建模过程中，大量的信息冗余是制约组合算法效率的一个重要因素，例如在递归程序运行的过程中，实际上产生了一棵解答树[4]，同一棵子树的结点间的信息不相互关联，这样便产生了大量的信息冗余，解决的方法之一便是引入记忆机制，将已得出的信息记录下来。这种机制实际上起到了剪枝的作用，但它严格受到空间的限制，实际上是时空矛盾在算法设计中的体现。这便是我们在组合算法设计中倡导函数非递归化的原因。它可以达到零信息冗余。

当然，组合算法的通用性、可计算性与信息冗余程度在一定程度上是对立的。例如双递归函数作为一种数学模型，能够反映一类问题，具有通用性，但却具有较差的可计算性和较大的信息冗余量，而有些问题虽具有较好的可计算性和较低的信息冗余量，却具有较差的通用性。总之，算法的时间复杂度，空间复杂度，通用性，可计算性和信息冗余量应是衡量组合算法的几个主要标准。

三、组合算法的选择实例

组合算法的评价依据同时也是建立数学模型和优化算法的指导思想。那么应该如何设计高效，通用的组合算法呢？下面我们通过几个实际的组合问题来初步研究。

例1．核反应堆中有α和β两种粒子，每秒钟内一个α粒子可以反应产生3个β粒子，而一个β粒子可以反应产生1个α粒子和2个β粒子。若在t=0时刻的反应堆中只有一个α粒子，求在t时刻的反应堆中α粒子和β粒子数。

这是一个物理学中的简单问题。我们通过对两种算法的比较来说明组合算法的通用性。

模型I：本题中共涉及两个变量，设在i时刻α粒子数为n_i，β粒子数为m_i，则有：n₀=1,m₀=0,n_i=m_i_—₁，m_i=3n_i_—₁+2m_i

_—₁

本题便转化为求数列N和M的第t项，我们可用递推的方法求得n_t和m_t，此模型的空间需求较小，时间复杂度为O（n），但随着n的增大，所需时间越来越大，即：

此模型的算法如下：

算法1-1

Prog Arithmtic1_1;

输出结果

write(m[t]);

End. Arithmtic1_1

模型II：设在t时刻的α粒子数为f（t），β粒子数为g(t)，依题可知：

g(t)=3f(t -1)+2g(t -1) （1）

f(t)=g(t -1) （2）

g(0)=0,f(0)=1

下面求解这个递归函数的非递归形式

由（2）得f(t -1)=g(t-2) （3）

将（3）代入（1）得

g(t)=3g(t -2)+2g(t-1)

（t≥2）（4）

g(0)=0,g(1)=3

（4）式的特征根方程为：

x²—2x—3=0

其特征根为x₁=3,x₂= -1

所以该式的递推关系的通解为

g(t)=C₁·3^t+C₂·( -1)^t

代入初值g(0)=0,g(1)=3得

C₁+C₂=0

3C₁

—C₂=3

解此方程组得

所以该递推关系的解为

g(t)=

∴

即

算法1—2

Prog Arithmetic1_2;

Begin

read(t);

n:=trunc(exp(tln(3)));

m:=trunc(exp((t+1)ln(3)));

  if odd(t) then begin //判断( -1)^t

                   n:=n-3;

                   m:=m+3;

                 end

            else begin

                   n:=n+3;

                   m:=m-3;

                end;

n:=trunc(n/4); // 4|n

m:=trunc(m/4); // 4|m

  Write(n);

  Write(m);

End. Arithmetic1_2

在模型II中，我们运用组合数学的方法建立了递归函数并转化为非递归函数。它的优点是算法的复杂性与问题的规模无关。针对某一具体数据，问题的规模对时间的影响微乎其微。

通过以上两个模型我们可以看出，模型II抓住了问题的本质，尤其成功地运用了组合数学中关于常系数线性齐次递推关系求解的有关知识，因而使算法本身既具有通用性和可计算性，同时达到了零信息冗余。

例2．在平面直角坐标系中，有n个圆心坐标为整点的单位圆，求它们所覆盖区域的总面积。

这是一道计算几何学的问题，关于图形并的问题，较为常用的方法是离散化，但是如果借助于组合数学的有关理论，是否可以设计出更好的算法呢？我们先来看几个简单的例子。

（1）两个圆的交（交集不为ф）

设圆i的圆心坐标为（x_i,y_i），我们定义一个异型函数（dissmilaruty function）如下：

在讨论两个圆的交的问题时，设两圆为圆1与圆2，它们的交有两种情况

①

设阴影部分面积为S，则

②

设阴影部分面积为S，则

S=
=

由于两个圆的非空交集问题是圆最简单的交问题。所以我们规定

的交为α型交，的交为β型交，这个规定将在下文的讨论中用到。

2、三个圆的交（交集不为ф）

：

经过分析易证，若三个圆的交集不为空，则三个圆中任意两圆的交集一定不为空，反之亦成立。且在任意两圆相交所组成的三个交中，一定有2个α型交，1个β型交。如图所示，阴影部分面积为S，则有：

3、四个圆的交（交集不为ф）

经分析可证，若四个圆的交集不为ф。则四个圆的圆心一定围成一个边长为1的正方形，这四个圆心按照顺时针（或逆时针方向）一定形成4个α型交，四个圆的交集如图中阴影部分所示，设其阴影部分面积为S，则：

可以证明5个或5个以上互不重合的单位圆的交集必为φ。

分析至此，我们可以知道，任意多个单位圆的交集都可以通过2、3、4个圆的交而获得，那么任意多个单位圆的并集呢？由交集到并集，这使我们想起了容斥原理，于是得出：

模型有了，但是平面上的位置关系如何来表示呢？我们用带权有向图来有表示单位圆间的关系，边上的权函数定义如下：

0 A_i∩A_j=φ

C（i,j）= 1 A_i与A_j为α型交

2 Ai与Aj的β型交

于是所有单位圆之间的信息便可由一个三角矩阵表示出来。两个圆、三个圆、四个圆相交的情况可由下图表示：

i i i

1 2 2

j j k 1

(1) (2) (3) (4)

（1）图表示两圆为α型交的圆；（2）图表示两圆为β型为圆；（3）图表示3个圆相交的图，在3边中有边权为2，其余两边权为1；（4）图为四个圆相交时的图。

题目标分析至此，我们便可轻松地设计出算法。

算法2

Func dissmilaruty_function(k1,k2:integer):integer;

Begin

l:=abs(x[k1]-x[k2])+abs(y[k1]-y[k2]);

//计算异型函数的值

if l>2 then return(0)

else return(l);

End; dissmilaruty_function

Proc Arithetic2;

Begin

count1:=0; //count1为а型交的个数

count2:=0; //count2为β型交的个数

area:=n*pi; //当所有圆都不相交时的面积值

for i:=1 to n-1 do

for j:=i+1 to n do

begin

list[i,j]:=dissmilaruty_function(i,j);

if list[i,j]=1 then count1:=count1+1; //两圆为α型交

else if list[i,j]=2 then count2:=count2+1;

//两圆为β型交

end;//判断两个圆的相交情况

area:=area-count1*s1-count2*s2;

count1:=0;

for i:=1 to n-2 do

for j:=i+1 to n-1 do

for k:=j+1 to n do

begin

check:=true;

p:=list[i,j]+list[j,k]+list[i,k];

if (list[i,j]=0) or (list[j,k]=0) or (list[i,k]=0)

then check:=false;

if (p=4) and check then //三边的权值都不为0且权值之和为4

begin

count1:=count1+1; //三个圆的交不为空的个数

if list[i,j]=2 then info[i,k]:=2

else if list[j,k]=2 then info[j,k]:=2

else if list[i,k]=2 then info[i,k]:=2;

end;//info供判断四个圆的交的情况时使用

end;//判断三个圆的交的情况

area:=area+s3*count1;

count1:=0;

for i:=1 to n-2 do

for j:=i+1 to n-1 do

for k:=j+1 to n do

if (j<>k) and (info[i,j]=2) and (list[j,k]=1) and (list[i,k]=1) then count1:=count1+1; //四个圆的交的个数

area:=area-s4*count1;

End; Arithetic2

这种算法建立在对问题进行深入分析，数学抽象的基础之上的，因而无论在时间上还是在空间上都是较优的。更为重要的是，这种算法比离散化算法更精确，更具一般性，能够解决诸如图形并等一系列问题。且算法的实质是一种计数问题，具有较强的可计算性。

例3．一场激烈的足球赛开始前，售票工作正在紧张的进行中，每张球票为50元。现有2n个人排队等待购票，其中有n 个人手持50元的钞票，另外n个人手持100元的钞票，假设开始售票时售票处没有零钱。问这2n个人有多少种排队方式，使售票处不至出现找不开钱的局面？

这是一道典型的组合计数问题。从表面上看很难找出规律，下面我们基于本题建立几个模型，最终揭示问题的本质。

I．搜索模型

我们用深度优先搜索（DFS）算法来直观地模拟所有情况。算法中指定一变量k记录售票处有50元钞票的张数，初始时令k=0，若某人手持100元钞票且k=0时则回溯，否则继续递归。若第2n个人购完票即递归进行到第2n层时计数器累加1。递归结束后，计数器中的值便为排队总数。

算法3-1

Proc DFS(i:integer); //I为递归层数

Begin

for j:=0 to 1 do //j=0表示某人手持50元的钞票，j=1表示某人手持100元钞票 begin

if (j=0) then begin

k:=k+1; //k表示计数器

m:=m+1; //m表示有多少人手持50元钞票购票

if (m=n) then total:=total+1 //若已有n个人手持50元钞票购票，那么其余手持100元钞票购票的人一定能找开钱。

else dfs(i+1);

k:=k-1;

m:=m-1;

end

else begin //表示手持100元钞票时

if k>0 then

begin

k:=k-1;

dfs(i+1);

k:=k+1;

end;

endfor;

End; dfs

由于本算法的实质是模拟，因此算法实现起来时间复杂度较高，为指数级，这种算法严格限制了问题的规模，因而不是一个好的算法。

II．栈模型

通过对问题的分析我们可以得出这样的结论：在任何时刻，若第n个人手持100元的钞票买票，则在此之前，定有m个人手持50元的钞票买票，使得m≥n，我们通过分析还将得出：售票处收到的50元的钞票最终将全部找出，售票处收到的100元的钞票最终将全部留下，且一旦收到一张面值为100元的钞票，则一定找出一张面值为50元的钞票。由此我们想到了用栈来表示这一过程：若某人手持一张50元的钱币购票，相当于一个元素进栈；若某人手持一张100元的钱币购票，相当于一个元素出栈。则问题转化为：若1~n共n个元素依次进栈，问共有多少种出栈顺序。

n个元素的全排列共有n!个，那么这n!种方案是否都是可能的出栈顺序呢？答案是否定的，我们可以证明，若a₁,a₂,……a_n是可能的依次出栈顺序，则一定不存在这样的情况：使得i<j<k且a_j<a_k<a_i，证明如下：

若i<j<k，说明a_i 最先出栈，a_j次之，a_k最后出栈，下面分两种情况讨论：

（i）如果a_i>a_j，那么当a_j出栈时，如果a_k已在栈中，则a_k比a_j先入栈，由输入a序列知：a_k<a_j,所以有a_k<a_j<a_i;当出栈时，如果a_k尚未入栈，则由输入序列知a_j<a_i<a_k

（ii）如果a_i<a_j，那么当a_j出栈时，如果a_k已入栈，则由输入序列知a_k<a_j,而a_i与a_k的关系取决于a_i与a_k哪个先入栈。但无论怎样，a_i与a_k均小于a_j，当a_j出栈时，如果a_k尚未入栈，则由输入序列知a_i<a_j<a_k

因此，输出序列中不可能出现当i<j<k时，a_j<a_k<a_i

通过以上分析，我们得出栈模型的算法，算法先产生1~n共n个数的全排列，对于每种排列，若符合前面所讲的出栈规则，那么这n个排列便是一个可能的出栈序列，计数器加1，当n个元素的全排列列举结束时，计数器的值便是问题的解。

在此思想的指导下，为了与模型I的算法进行比较，我们在这里采用递归技术来产生n个元素的全排列，若在每产生一个排列后进行该排列是否为可能输出栈序列的判定，则算法的时间复杂度为O（nⁿ），与模型I的算法比较起来，我们发现模型II中递归的深度降低，栈的使用空间减小，但在构造解答树的过程中，每层扩展的结点数则大量增加，而有些结点的增加是无意义的，所以我们在实际的算法设计中可以一边生成排列一边进行可能输出序列的判定性检验，若不满足条件，则及时剪枝，因而在n较大时该算法的时间复杂度应小于O（nⁿ）

算法3-2

Func check(s:integer):boolean; //判断1～s共s个元素的出栈序列是否为可能的栈输出序列

begin

for a:=1 to s-2 do

for b:=a+1 to s-1 do

if (data[b]<data[s]) and (data[s]<data[a]) then return(false);

reture(true);

end; check

Proc stack(i:integer); //产生n个元素的全排列

begin

for j:=1 to n do

if not(j in flag) then

begin

data[i]:=j;

if check(i) then

begin

flag:=flag+[j];

if i=n then total:=total+1 //计数器加1

else stack(i+1);

flag:=flag-[j];

end;

endfor;

end; stack

但我们应该明确地看到，模型I与模型II在算法实现时解答树中的结点数目都是很多的，结点是栈所储存的信息，大量结点的出现必然影响算法可运行数据的规模，在模型III中，我们着重思考如何对问题进行数学抽象。

III递归算法：

令f(m,n)表示有m个人手持50元的钞票，n个人手持100元的钞票时共有的方案总数。我们分情况来讨论这个问题。

(1)n=0

n=0意味着排队购票的所有人手中拿的都是50元的钱币，那么这m个人的排队总数为1，即f(m,0 )=1

（2）m<n

若排队购票的(m+n)个人中有m个人手持50元的钞票，n个人手持100元的钞票，当m<n时，即使把m张50元的钞票都找出去，仍会出现找不开钱的局面，所以这时排队总数为0,即f(m,n)=0

（3）其它情况

我们思考（m+n）个人排队购票的情景，第(m+n)个人站在第（m+n-1）个人的后面，则第（m+n）个人的排队方式可由下列两种情况获得：

①第（m+n）个人手持100元的钞票，则在他之前的（m+n-1）个人中有m个人手持50元的钞票，有（n-1）个人手持100元的钞票，此种情况共有f(m,n-1)

②第（m+n）个人手持50元的钞票，则在他之前的（m+n-1）个人中有（m-1）个人手持50元的钞票，有n个人手持100元的钞票，此种情况共有f(m-1,n)

由加法原理得f(m,n)=f(m-1,n)+f(m,n-1)

于是我们得到f(m,n)的计算公式：

0 m<n

f(m,n)= 1 n=0 （*）

f(m,n-1)+f(m-1,n)

于是我们可以根据（*）式编写递归算法

算法3-3

Func f(a,b:integer):longint;

begin

if a<b then f:=0

else if b=0 then f:=1

else f:=f(a-1,b)+f(a,b-1);

end; f

IV 递推算法

递归算法是由终止条件向初始条件推导，而递推算法是由初始条件向终止条件推导。可以说，它们本质上是相同的。那么，把递归算法改为递推算法的意义何在呢？我们运用（*）式求解f(4,4)，递归程序执行时构造的解答树如下：

f(4，4)

f(3，4) f(4，3)

f(3，3) f(4，2)

f(2,3) f(3,2) f(3,2) f(4,1)

f(2,2) f(3,1) f(2,2) f(3,1)

f(1,2) f(2,1) f(1,2) f(2,1)

通过对解答树的仔细观察我们会发现，在树中诸如f（3,2）等结点大量重复计算。由此我们看出，递归算法虽具有通用性和可计算性，但产生了大量的数据冗余，这些大量的数据冗余是限制递归算法规模的主要因素，从而导致模型Ⅲ虽进行了数学抽象，但算法实践起来的效率并不高。那么应如何避免大数据冗余以至最终达到零数据冗余呢？请看如下的二维表格：

m f n

如果用矩阵的形式，则可表示为

1 0 0 0 0

2 2 0 0 0

3 5 5 0 0

4 9 14 14 0

5 14 28 42 42

我们仔细观察该矩阵可发现如下规律：

（1）该短阵为一个5阶下三角短阵

（2）a_i_，_j=a_i-_{1, j}+a_i_，_j-1

（3）a_i_，_i=a_i_，_i-1

于是我们便得到了如下算法：

算法3-4

Prog Arithmetic3_4;

Begin

read(n);

for a:=1 to n do data[a,1]:=a; //初始化赋值

for a:=2 to n do

for b:=2 to a do data[a,b]:=data[a-1,b]+data[a,b-1]; //递推

write(data[n,n]);

End. Arithmetic3_4

由此，本题的递推关系便建立起来，这个算法的时间复杂度为O(n²)，它与模型III的递归算法比较起来最大的优点在于它充分利用了已经得到的信息，从而使算法的时间复杂度大大降低，算法本身能够接受的规模也大大增加，达到了零信息冗余，可以说，这是一个较优化的算法。

V组合算法

我们下面用一种崭新的模型——二叉树来反映本题，我们依据以下原则建立一棵具有n 个结点的二叉树。

（1）若结点i是结点j的儿子结点，则i>j，若结点i是结点k 的左儿子，结点j是结点k的右儿子，则i<j。

（2）若结点i是结点j的儿子且i比j先出栈，则结点i是结点j的左儿子；若结点i比结点j后出栈，则结点i是结点j的右儿子。

由（1）可知，这棵具有几个结点的二叉树的先序遍历序列一定为1~n，由（2）可知，这棵树最左边的叶结点一定最先出栈，最后边的叶结点一定最后出栈。所以说，对于任意一棵具有几个结点的二叉树，它的前序遍历顺序便为1～n，即n个元素的入栈顺序，那么它的中序遍历顺序便是这n个元素的出栈顺序。即2n个人的排队方案总数即为具有n个结点的二叉树的个数，又因为具有n个结点的二叉树个数为

，即Catalan数，所以本题的不同排列总数为

算法3-5[5]

Prog Arithmetic3_5;

Begin

read(n);

total:=1;

a:=n+2;

b:=2;

while (a<=2*n) do

begin

total:=total*a;

while (total mod b=0) and (b<=n) do

begin

total:=total div b;

b:=b+1;

end;

a:=a+1;

end;

while b<n do

begin

total:=total div b;

inc(b);

end;

write(total);

End. Arithmetic3_5

本算法的时间复杂度为O（n），从建模方式看，组合算法的模型最抽象，也最不易理解，但这个模型却能抓住问题的本质，因而具有极大的可计算性，达到了零信息冗余。

四总结

组合算法作为当代组合数学研究的重要组成部分，在基础理论研究和社会实践中发挥着越来越重要的作用，本文着重讨论组合算法的评价依据，初步揭示了组合算法的设计和优化的基本问题。总之，只有掌握好组合算法的通用性，可计算性和信息冗余量的组合算法评价原则，才能设计出高效的组合算法。

【附录】

【参考文献】

[1] 《组合数学》卢开澄清华大学出版社（1999）

[2] 《组合数学引论》孙淑玲许胤龙中国科学技术大学出版社（1999）

[3] 《青少年国际和全国信息学（计算机）奥林匹克竞赛指导—组合数学的算法与程序设计》吴文虎王建德清华大学出版社（1997）

[4] 《离散数学》 Richard Johnsonbaugh 电子工业出版社（1999）

[5] 《算法与数据结构》傅清祥王晓东电子工业出版社（1999）

[6]《人工智能导论》林尧瑞马少平清华大学出版社（1999）

【算法比较实验】

为了更好地反映组合算法设计中的三原则对算法效率的影响，我们对“球迷购票问题”的五个模型进行了实验，其总结如下：

一、系统设置：

CPU: Intel 633 Celeron

RAM: 128MB

OS: Windows Me

算法运行环境：Turbo Pascal 7.0

二、规模确定：

由于此实验的目的是确定模型的优劣，所以测试数据所得结果控制在长整型以内。由计算得到1≤n≤17。为了更好地反映算法的效率，尤其是信息冗余对算法效率的影响，在进行n值选取时，我们选的是不均匀的。

三、时间测定算法：

Begin

t:=meml[$40:$6c];

主程序；

t:=(meml[$40:$6c]-t)/18.2;

out(t)

end.

四、实验结果

N	结果	模型1运行时间	模型2运行时间	模型3运行时间	模型4运行时间	模型5运行时间
5	42	0.0000	0.0000	0.0000	0.0000	0.0000
10	16796	0.0000	1.1538	0.0000	0.0000	0.0000
13	7429000	0.1099	>60	0.2747	0.0000	0.0000
15	9694845	1.1538	>60	3.6813	0.0000	0.0000
16	35357670	4.2308	>60	13.5165	0.0000	0.0000
17	129644790	15.3846	>60	49.5055	0.0000	0.0000

(时间单位：s)

【源程序】

[1] 算法1—1 的源程序

Program Arithmtic1_1;

Var n,m:array[0..100] of longint;

t,i:integer;

Begin

write('Please input t:');

readln(t);

n[0]:=1;

m[0]:=0;

for i:=1 to t do

begin

n[i]:=m[i-1];

m[i]:=3*n[i-1]+2*m[i-1];

end;

writeln('N=',n[t]);

writeln('M=',m[t]);

End.

[2] 算法1—2的源程序

Program Arithmetic1_2;

var t:integer;

n,m:longint;

begin

write('Please input t:');

readln(t);

n:=trunc(exp(t*ln(3)));

m:=trunc(exp((t+1)*ln(3)));

if odd(t) then begin

n:=n-3;

m:=m+3;

end

else begin

n:=n+3;

m:=m-3;

end;

n:=trunc(n/4);

m:=trunc(m/4);

writeln('N=',n);

writeln('m=',m);

end.

[3]算法2的源程序

Program Arithmetic2;

Const InFile='input.txt';

OutFile='output.txt';

pi=3.1415926535;

s1=2/3*pi-1.732/2;

s2=pi/2-1;

s3=5/12*pi-1.732/2;

Var list,info:Array[1..100,1..100] of shortint;

x,y: Array[1..100] of integer;

n: Integer;

area,s4: real;

Procedure init;

Var f:Text;

a:integer;

Begin

assign(f,InFile);

reset(f);

readln(f,n);

for a:=1 to n do

read(f,x[a],y[a]);

close(f);

s4:=4*sin(pi/12)*sin(pi/12)+pi/12-1/4;

End;

Function dissmilaruty_function(k1,k2:integer):integer;

Var l:integer;

Begin

l:=abs(x[k1]-x[k2])+abs(y[k1]-y[k2]);

if l>2 then dissmilaruty_function:=0

else dissmilaruty_function:=l;

End;

Procedure done;

var i,j,k,p,count1,count2:integer;

check: boolean;

Begin

count1:=0;

count2:=0;

area:=n*pi;

for i:=1 to n-1 do

for j:=i+1 to n do

begin

list[i,j]:=dissmilaruty_function(i,j);

if list[i,j]=1 then inc(count1)

else if list[i,j]=2 then inc(count2);

end;

area:=area-count1*s1-count2*s2;

count1:=0;

for i:=1 to n-2 do

for j:=i+1 to n-1 do

for k:=j+1 to n do

begin

check:=true;

p:=list[i,j]+list[j,k]+list[i,k];

if (list[i,j]=0) or (list[j,k]=0) or (list[i,k]=0)

then check:=false;

if (p=4) and check then

begin

inc(count1);

if list[i,j]=2 then info[i,k]:=2

else if list[j,k]=2 then info[j,k]:=2

else if list[i,k]=2 then info[i,k]:=2;

end;

area:=area+s3*count1;

count1:=0;

for i:=1 to n-2 do

for j:=i+1 to n-1 do

for k:=j+1 to n do

if (j<>k) and (info[i,j]=2) and (list[j,k]=1) and (list[i,k]=1) then

inc(count1);

area:=area-s4*count1;

End;

Procedure out;

Var f:text;

Begin

assign(f,OutFile);

rewrite(f);

writeln(f,area:0:4);

close(f);

End;

Begin

Init;

Done;

Out;

End.

[4]算法3—1的源程序

{$A+,B-,D-,E+,F-,G+,I-,L-,N-,O-,P-,Q-,R-,S-,T-,V+,X+}

{$M 65520,0,655360}

Program Arithmetic3_1;

Var n,k,m:integer;

total:longint;

Procedure DFS(i:integer);

Var j:integer;

Begin

for j:=0 to 1 do

begin

if (j=0) then begin

inc(k);

inc(m);

if (m=n) then inc(total)

else dfs(i+1);

dec(k);

dec(m);

end

else begin

if k>0 then

begin

dec(k);

dfs(i+1);

inc(k);

end;

End;

Begin

read(n);

m:=0;

k:=0;

dfs(1);

writeln(total);

End.

[5]算法3—2的源程序

{$A+,B-,D+,E+,F-,G-,I+,L+,N-,O-,P-,Q-,R-,S+,T-,V+,X+}

{$M 65520,0,655360}

program Arithmetic3_2;

var n:integer;

data:Array[1..100] of integer;

flag:set of byte;

total:longint;

function check(s:integer):boolean;

var a,b:integer;

begin

check:=false;

for a:=1 to s-2 do

for b:=a+1 to s-1 do

if (data[b]<data[s]) and (data[s]<data[a]) then exit;

check:=true;

end;

procedure stack(i:integer);

var j:integer;

begin

for j:=1 to n do

if not(j in flag) then

begin

data[i]:=j;

if check(i) then

begin

flag:=flag+[j];

if i=n then inc(total)

else stack(i+1);

flag:=flag-[j];

end;

begin

read(n);

stack(1);

writeln(total);

end.

[6]算法3—3的源程序

{$A+,B-,D+,E+,F-,G-,I+,L+,N-,O-,P-,Q-,R-,S+,T-,V+,X+}

{$M 65520,0,655360}

program Arithmetic3_3;

var n:integer;

function f(a,b:integer):longint;

begin

if a<b then f:=0

else if b=0 then f:=1

else f:=f(a-1,b)+f(a,b-1);

end;

begin

read(n);

writeln(f(n,n));

end.

[7]算法3—4的源程序

Program Arithmetic3_4;

Var data :array[1..20,1..20] of longint;

a,b,n:integer;

Begin

readln(n);

for a:=1 to n do data[a,1]:=a;

for a:=2 to n do

for b:=2 to a do data[a,b]:=data[a-1,b]+data[a,b-1];

writeln(data[n,n]);

End.

[8]算法3—5的源程序

Program Arithmetic3_5;

Var n,a,b:integer;

total:longint;

Begin

readln(n);

total:=1;

a:=n+2;

b:=2;

while (a<=2*n) do

begin

total:=total*a;

while (total mod b=0) and (b<=n) do

begin

total:=total div b;

inc(b);

end;

inc(a);

end;

while b<n do

begin

total:=total div b;

inc(b);

end;

writeln(total);

End.

贪心策略的特点与在信息学竞赛

中的应用

【关键字】贪心策略   特点   理论基础   应用

【摘要】

本文着重探讨的是贪心策略的数学模型、理论基础（“矩形胚”结构）和贪心策略的特点。（贪心选择性质和局部最优解）介绍了3种体现“贪心”思想的图形算法：Dijkstra算法、Prim算法和Kruskal算法，并着重给出了近几年来在各级各类程序设计竞赛中出现的一些题目。



【正文】

一、引论

信息，人类社会发展的重要标志。人类对信息的记载，可以追溯到原始社会。在漫长的人类社会发展过程中，伴随着科学技术的发展，人类对客观世界的认识不断加深，现实世界的信息量急剧增大。为了满足人们对大数据量信息处理的渴望，1946年世界上第一台电子数字计算机ENIAC应运而生。在此后的半个世纪中，为解决各种实际问题，计算机算法学得到了飞速的发展。线形规划、动态规划等一系列运筹学模型纷纷运用到计算机算法学中，解决了诸如经济决策等一系列现实问题。在众多的计算机解题策略中，贪心策略可以算得上是最接近人们日常思维的一种解题策略，正基于此，贪心策略在各级各类信息学竞赛、尤其在对NPC类问题的求解中发挥着越来越重要的作用。

二、贪心策略的定义

【定义1】贪心策略是指从问题的初始状态出发，通过若干次的贪心选择而得出最优值(或较优解)的一种解题方法。

其实，从“贪心策略”一词我们便可以看出，贪心策略总是做出在当前看来是最优的选择，也就是说贪心策略并不是从整体上加以考虑，它所做出的选择只是在某种意义上的局部最优解，而许多问题自身的特性决定了该题运用贪心策略可以得到最优解或较优解。

三、贪心算法的特点

  通过上文的介绍，可能有人会问：贪心算法有什么样的特点呢？我认为，适用于贪心算法解决的问题应具有以下2个特点：

1、贪心选择性质：

所谓贪心选择性质是指应用同一规则f，将原问题变为一个相似的、但规模更小的子问题、而后的每一步都是当前看似最佳的选择。这种选择依赖于已做出的选择，但不依赖于未做出的选择。从全局来看，运用贪心策略解决的问题在程序的运行过程中无回溯过程。关于贪心选择性质，读者可在后文给出的贪心策略状态空间图中得到深刻地体会。

2、局部最优解：

我们通过特点2向大家介绍了贪心策略的数学描述。由于运用贪心策略解题在每一次都取得了最优解，但能够保证局部最优解得不一定是贪心算法。如大家所熟悉得动态规划算法就可以满足局部最优解，在广度优先搜索（BFS）中的解题过程亦可以满足局部最优解。

在遇到具体问题时，许多选手往往分不清哪些题该用贪心策略求解，哪些题该用动态规划法求解。在此，我们对两种解题策略进行比较。



                     图 1

【引例】在一个N×M的方格阵中，每一格子赋予一个数（即为权）。规定每次移动时只能向上或向右。现试找出一条路径，使其从左下角至右上角所经过的权之和最大。

3

4

6

1

2

10

我们以2×3的矩阵为例。

   若按贪心策略求解，所得路径为：1→3→4→6；                                图二

若按动态规划法求解，所得路径为：1→2→10→6。

a

a

a

Tags：组合算法评价依据复杂性选择应用

责任编辑：王亚峰

上一篇：非最优化算法初探

下一篇：信息学竞赛中的思维方法

Begin Read(t); n[0]:=1; //初始化操作 m[0]:=0; for i:=1 to t do //进行t次递推 begin n[i]:=m[i-1]; m[i]:=3*n[i-1]+2*m[i-1]; end; write(n[t]); //输出结果 write(m[t]); End. Arithmtic1_1 模型II：设在t时刻的α粒子数为f（t），β粒子数为g(t)，依题可知：

Begin read(t); n:=trunc(exp(t*ln(3))); m:=trunc(exp((t+1)*ln(3))); if odd(t) then begin //判断( -1)t n:=n-3; m:=m+3; end else begin n:=n+3; m:=m-3; end; n:=trunc(n/4); // 4|n m:=trunc(m/4); // 4|m Write(n); Write(m); End. Arithmetic1_2

Begin

Read(t);

n[0]:=1; //初始化操作

m[0]:=0;

for i:=1 to t do //进行t次递推

begin

n[i]:=m[i-1];

m[i]:=3n[i-1]+2m[i-1];

end;

write(n[t]); //输出结果

write(m[t]);

End. Arithmtic1_1

模型II：设在t时刻的α粒子数为f（t），β粒子数为g(t)，依题可知：

Begin

read(t);

n:=trunc(exp(tln(3)));

m:=trunc(exp((t+1)ln(3)));

if odd(t) then begin //判断( -1)^t

n:=n-3;

m:=m+3;

end

else begin

n:=n+3;

m:=m-3;

end;

n:=trunc(n/4); // 4|n

m:=trunc(m/4); // 4|m

Write(n);

Write(m);

End. Arithmetic1_2