首页期刊论文 并行算法研究类期末论文

并行算法研究类期末论文

并行算法研究类期末论文并行计算毕业论文聚类算法研究论文

yirendian10 2023-12-12 00:46:50

共3条回答158浏览

可乐狗DOGS

1小时前发布
- 1.并行计算体系结构发展纵览.并行和分布计算技术现状及发展策略 .并行计算软件开发概述.基于ANSYS的并行计算发展及实现
241 评论
潘朵拉的音乐

11小时前发布
- 从20世纪40年代开始的现代计算机发展历程可以分为两个明显的发展时代：串行计算时代、并行计算时代。每一个计算时代都从体系结构发展开始，接着是系统软件（特别是编译器与操作系统）、应用软件，最后随着问题求解环境的发展而达到顶峰。并行计算机是由一组处理单元组成的。这组处理单元通过相互之间的通信与协作，以更快的速度共同完成一项大规模的计算任务。因此，并行计算机的两个最主要的组成部分是计算节点和节点间的通信与协作机制。并行计算机体系结构的发展也主要体现在计算节点性能的提高以及节点间通信技术的改进两方面。节点性能不断进步20世纪60年代初期，由于晶体管以及磁芯存储器的出现，处理单元变得越来越小，存储器也更加小巧和廉价。这些技术发展的结果导致了并行计算机的出现。这一时期的并行计算机多是规模不大的共享存储多处理器系统，即所谓大型主机。IBM 360是这一时期的典型代表。到了20世纪60年代末期，同一个处理器开始设置多个功能相同的功能单元，流水线技术也出现了。与单纯提高时钟频率相比，这些并行特性在处理器内部的应用大大提高了并行计算机系统的性能。伊利诺依大学和Burroughs公司此时开始实施Illiac Ⅳ计划，研制一台64颗CPU的SIMD主机系统，它涉及到硬件技术、体系结构、I/O设备、操作系统、程序设计语言直至应用程序在内的众多研究课题。不过，当一台规模大大缩小的原型系统（仅使用了16颗CPU）终于在1975年面世时，整个计算机界已经发生了巨大变化。首先是存储系统概念的革新，提出虚拟存储和缓存的思想。以IBM 360/85和IBM 360/91为例，两者是属于同一系列的两个机型，IBM 360/91的主频高于IBM 360/85，所选用的内存速度也较快，并且采用了动态调度的指令流水线。但是，IBM 360/85的整体性能却高于IBM 360/91，惟一的原因就是前者采用了缓存技术，而后者则没有。其次是半导体存储器开始代替磁芯存储器。最初，半导体存储器只是在某些机器中被用作缓存，而CDC7600则率先全面采用这种体积更小、速度更快、可以直接寻址的半导体存储器，磁芯存储器从此退出了历史舞台。与此同时，集成电路也出现了，并迅速应用到计算机中。元器件技术的这两大革命性突破，使得Illiac Ⅳ的设计者们在底层硬件以及并行体系结构方面提出的种种改进都大为逊色。处理器高速发展1976年Cray-1问世以后，向量计算机从此牢牢地控制着整个高性能计算机市场15年。Cray-1对所使用的逻辑电路进行了精心的设计，采用了我们如今称为RISC的精简指令集，还引入了向量寄存器，以完成向量运算。这一系列技术手段的使用，使Cray-1的主频达到了80MHz。微处理器随着机器的字长从4位、8位、16位一直增加到32位，其性能也随之显著提高。正是因为看到了微处理器的这种潜力，卡内基·梅隆大学开始在当时流行的DEC PDP-11小型计算机的基础上研制一台由16台PDP-11/40处理机通过交叉开关与16个共享存储器模块相连接而成的共享存储多处理器系统。从20世纪80年代开始，微处理器技术一直在高速前进。稍后又出现了非常适合于SMP方式的总线协议。而伯克利加州大学则对总线协议进行了扩展，提出了Cache一致性问题的处理方案。从此，开创出的共享存储多处理器之路越走越宽。现在，这种体系结构已经基本上统治了服务器和桌面工作站市场。通信机制稳步前进同一时期，基于消息传递机制的并行计算机也开始不断涌现。20世纪80年代中期，加州理工学院成功地将64个i8086/i8087处理器通过超立方体互连结构连结起来。此后，便先后出现了Intel iPSC系列、INMOS Transputer系列，Intel Paragon以及IBM SP的前身Vulcan等基于消息传递机制的并行计算机。20世纪80年代末到90年代初，共享存储器方式的大规模并行计算机又获得了新的发展。IBM将大量早期RISC微处理器通过蝶形互连网络连结起来。人们开始考虑如何才能在实现共享存储器缓存一致的同时，使系统具有一定的可扩展性。20世纪90年代初期，斯坦福大学提出了DASH计划，它通过维护一个保存有每一缓存块位置信息的目录结构来实现分布式共享存储器的缓存一致性。后来，IEEE在此基础上提出了缓存一致性协议的标准。20世纪90年代至今，主要的几种体系结构开始走向融合。属于数据并行类型的CM-5除大量采用商品化的微处理器以外，也允许用户层的程序传递一些简单的消息。Cray T3D是一台NUMA结构的共享存储型并行计算机，但是它也提供了全局同步机制、消息队列机制，并采取了一些减少消息传递延迟的技术。随着微处理器商品化、网络设备的发展以及MPI/PVM等并行编程标准的发布，集群架构的并行计算机出现开始。IBM SP2系列集群系统就是其中的典型代表。在这些系统中，各个节点采用的都是标准的商品化计算机，它们之间通过高速网络连接起来。有限元并行计算的发展和现状目前，在计算力学领域内，围绕着基于变分原理的有限元法和基于边界积分方程的边界元法，以及基于现在问世的各种并行计算机，逐渐形成了一个新的学科分支——有限元并行计算。它是高效能的，使得许多现在应用串行计算机和串行算法不能解决或求解不好的大型的、复杂的力学问题能得到满意的解答，故其发展速度十分惊人。在国际上已经掀起了利用并行机进行工程分析和研究的高潮。从1975到1995年的二十年间，有关有限元方法和相应的数值并行计算的文章已发表1000余篇。有限元并行计算正在向两个方向发展。一是对系统方程组实施并行求解的各种算法。二是并行分析方法，包括有限元并行算法和边界元并行算法，前者趋向成熟，而后者的研究较少。对这一方面的研究，是为了挖掘有限元计算自身潜在的并行性，是有限元并行计算的根本问题。国内并行算法的设计和有效实现强烈地依赖于并行机的硬软件环境。国内仅极少数单位拥有并行机，且机型杂乱，因此研究人员少，起步晚，而且局限于特定的硬件环境。从有限元分析方法的内容来看，发表的几十篇研究论文（报告）还未显示出较强的系统性。1）南京航空航天大学周树荃教授等在YH-1向量机上实现了刚度矩阵计算、对称带状矩阵的Cholesky分解和线性方程组的求解等并行处理。针对不规则结构工程分析问题，他们还采用了变带宽存贮方法，并实现了刚度矩阵的并行计算以及求解变带宽稀疏线性方程组的并行直接解法【20】。2）中国科学院计算中心王荩贤研究员等在基于Transputer芯片的分布式MIMD系统上，提出了有限元分析中变带宽线性方程组的并行直接解法，初步完成了一个静力分析程序【21】。3）重庆大学张汝清教授等借助于ELXSI-6400共享存贮器型MIMD系统，先后开展了范围比较广泛的并行算法研究，主要成果有：a)提出了静力分析中子结构解法的并行算法，以及动力分析中模态综合子结构法的并行算法；b)从波前法出发，发展了多波前并行算法以求解大型结构分析问题；c)从Jacobi块迭代法和加权残差法出发，导出了基于异步控制的有限元方程并行解法和有限元并行迭代的基本格式；d)利用图论中的着色理论，实现了刚度矩阵的并行计算；e)实现了基于有色线剖分的SOR并行迭代解法；f)实现了子空间迭代法、Lanczos法以及利用多项式割线迭代法和矢量迭代法求解结构固有频率和模态的并行算法；g)针对弹塑性分析，提出了一种多波前子结构并行算法；h)针对弹性接触问题，提出了一种基于参数变分原理的并行解法；i)实现了一步积分法的并行处理【22】。4）南京航空航天大学乔新教授等借助于Transputer芯片的分布式MIMD系统实现了有限元方程组的并行直接解法，并提出了基于子结构的预处理共轭梯度法的并行计算方法【23】。此外，浙江大学姚坚【24】、中国科学院西南计算中心马寅国、东北工学院张铁以及国防科技大学六系也曾对有限元分析的并行计算开展了一些研究。上述研究结果表明，国内并行计算方法的研究，在硬件上基于向量机、分布式并行机和共享存贮式并行机；在内容上，似乎面很广，但系统性和深度还很不够，软件开发距实际应用和商品化还有很大距离，对不依赖并行机具体环境的通用并行算法研究还很少，同样对旨在进行结构有限元分析的并行计算的硬件研究也很少。国外自从美国国家宇航局（NASA）的于1975年发表第一篇有限元并行计算的文章以来，有限元并行处理技术几乎与并行计算机同步发展。距不完全统计，到1992年，国外已发表了400余篇这方面的论文，其中后5年的文章篇数是前12年的总和。在研究内容上也由过去的算法研究发展到了算法、软件和硬件相结合的研究，并针对一些机型开发了一些实用的大型结构分析软件。1）有限元机器FEM【25】（Finite Element Machine）。早在70年代末，就有人发表了有关FEM的论文，1982年美国国家宇航局Langley研究中心的等撰文详细地介绍了该中心设计的供研究用的FEM。该机器由1个处理器阵列、1台作为控制器的微机和1个并行操作系统及一些模块化了的通用并行算法程序组成，用户使用系统的文本编辑器和控制器的其它特殊功能，能建立有限元计算模型并进行分析。10多年来，又有一些人在这一方面进行了不懈的努力，但FEM的发展前景仍然不太令人乐观。2）心动阵列并行机【26】。心动阵列并行机主要应用于信号和图象的并行处理，但由于其高效的矩阵计算功能，近年来有人把它应用于有限元分析，并作了一些有益的尝试。3）巨型向量机【27】。在有限元分析中越来越显示出巨大的威力，处于领先的是美国思维公司的CM-2。许多结构分析家把这个具有65536个处理器的巨型向量机应用于有限元计算，如等人采用显式方法，完成了具有32768个单元的壳的非线性有限元计算，并行效率极高，速度几乎比CRAY X-MP/14并行机高出1个数量级。4）并行机网络和工作站网络【28】。日本东京大学矢川等借助高速网络把3台CRAY Y-MP机联成网络进行有限元分析，有限元方程求解采用的是基于区域分裂技术的共轭梯度法（CGM），在求解三维弹性问题时自由度个数超过了100万，系统平均运行速度高达。另外，他们还基于一个工程工作站网络，在并行环境下进行了类似的研究，求解问题的自由度数高达20万个。--我左看右看前看后看可还是看不过来这个....那个....我越看越奇怪....不是我不明白，这世界变化快
287 评论
niuzhirong

12小时前发布
- 并行遗传算法及其应用1、遗传算法（GA）概述GA是一类基于自然选择和遗传学原理的有效搜索方法，它从一个种群开始，利用选择、交叉、变异等遗传算子对种群进行不断进化，最后得到全局最优解。生物遗传物质的主要载体是染色体，在GA中同样将问题的求解表示成“染色体Chromosome”，通常是二进制字符串表示，其本身不一定是解。首先，随机产生一定数据的初始染色体，这些随机产生的染色体组成一个种群（Population），种群中染色体的数目称为种群的大小或者种群规模。第二：用适值度函数来评价每一个染色体的优劣，即染色体对环境的适应程度，用来作为以后遗传操作的依据。第三：进行选择（Selection），选择过程的目的是为了从当前种群中选出优良的染色体，通过选择过程，产生一个新的种群。第四：对这个新的种群进行交叉操作，变异操作。交叉、变异操作的目的是挖掘种群中个体的多样性，避免有可能陷入局部解。经过上述运算产生的染色体称为后代。最后，对新的种群（即后代）重复进行选择、交叉和变异操作，经过给定次数的迭代处理以后，把最好的染色体作为优化问题的最优解。GA通常包含5个基本要素：1、参数编码：GA是采用问题参数的编码集进行工作的，而不是采用问题参数本身，通常选择二进制编码。2、初始种群设定：GA随机产生一个由N个染色体组成的初始种群（Population），也可根据一定的限制条件来产生。种群规模是指种群中所含染色体的数目。3、适值度函数的设定：适值度函数是用来区分种群中个体好坏的标准，是进行选择的唯一依据。目前主要通过目标函数映射成适值度函数。4、遗传操作设计：遗传算子是模拟生物基因遗传的操作，遗传操作的任务是对种群的个体按照它们对环境的适应的程度施加一定的算子，从而实现优胜劣汰的进化过程。遗传基本算子包括：选择算子，交叉算子，变异算子和其他高级遗传算子。5、控制参数设定：在GA的应用中，要首先给定一组控制参数：种群规模，杂交率，变异率，进化代数等。GA的优点是擅长全局搜索，一般来说，对于中小规模的应用问题，能够在许可的范围内获得满意解，对于大规模或超大规模的多变量求解任务则性能较差。另外，GA本身不要求对优化问题的性质做一些深入的数学分析，从而对那些不太熟悉数学理论和算法的使用者来说，无疑是方便的。2、遗传算法的运行机理：对GA运行机理的解释有两类: 一是传统的模式理论；二是1990 年以后发展起来的有限状态马尔可夫链模型。（1）模式理论：由Holland创建，主要包括模式定理，隐并行性原理和积木块假说三部分。模式是可行域中某些特定位取固定值的所有编码的集合。模式理论认为遗传算法实质上是模式的运算，编码的字母表越短，算法处理一代种群时隐含处理的模式就越多。当算法采用二进制编码时，效率最高，处理规模为N的一代种群时，可同时处理O(N3)个模式。遗传算法这种以计算少量编码适应度而处理大量模式的性质称为隐并行性。模式理论还指出，目标函数通常满足积木块假说，即阶数高，长度长，平均适应度高的模式可以由阶数低，长度短，平均适应度高的模式(积木块)在遗传算子的作用下，接合而生成。而不满足积木块假说的优化问题被称为问题(deceptive problem)。模式理论为遗传算法构造了一条通过在种群中不断积累、拼接积木块以达到全局最优解的寻优之路。但近十多年的研究，特别是实数编码遗传算法的广泛应用表明，上述理论与事实不符。（2）有限状态马尔可夫链模型：由于模式理论的种种缺陷，研究者开始尝试利用有限状态马尔可夫链模型研究遗传算法的运行过程。对于遗传算法可以解决的优化问题，问题的可行域都是由有限个点组成的，即便是参数可以连续取值的问题，实际上搜索空间也是以要求精度为单位的离散空间，因此遗传算法的实际运行过程可以用有限状态马尔可夫链的状态转移过程建模和描述。对于有 m 个可行解的目标函数和种群规模为N的遗传算法，N 个个体共有种组合，相应的马尔可夫模型也有个状态。实际优化问题的可行解数量 m 和种群规模 N 都十分可观，马尔可夫模型的状态数几乎为天文数字，因此利用精确的马尔可夫模型计算种群的状态分布是不可能的。为了换取模型的可执行性，必须对实际模型采取近似简化，保持算法的实际形态，通过对目标函数建模，简化目标函数结构实现模型的可执行性。遗传算法优化的过程，可以看作算法在循环过程中不断对可行域进行随机抽样，利用前面抽样的结果对目标点的概率分布进行估计，然后根据估计出的分布推算下一次的抽样点。马尔可夫模型认为遗传算法是通过对搜索空间不同区域的抽样，来估计不同区域的适应度，进而估计最优解存在于不同区域的概率，以调整算法对不同区域的抽样密度和搜索力度，进而不断提高对最优解估计的准确程度。可见，以邻域结构为依据划分等价类的马尔可夫模型更符合实际，对问题的抽象更能体现优化问题的本质。3、并行遗传算法（PGA）虽然在许多领域成功地应用遗传算法，通常能在合理的时间内找到满意解，但随着求解问题的复杂性及难度的增加，提高GA的运行速度便显得尤为突出，采用并行遗传算法（PGA）是提高搜索效率的方法之一。由于GA从种群出发，所以具有天然的并行处理特性，非常适合于在大规模并行计算机上实现，而大规模并行计算机的日益普及，为PGA奠定了物质基础。特别是GA中各个体适值计算可独立进行而彼此间无需任何通信，所以并行效率很高。实现PGA，不仅要把串行GA等价地变换成一种并行方案，更重要的是要将GA的结构修改成易于并行化实现的形式，形成并行种群模型。并行种群模型对传统GA的修改涉及到两个方面：一是要把串行GA的单一种群分成多个子种群，分而治之；二是要控制、管理子种群之间的信息交换。不同的分治方法产生不同的PGA结构。这种结构上的差异导致了不同的PGA模型：全局并行模型、粗粒度模型、细粒度模型和混合模型。3、1全局PGA模型该模型又称主从PGA模型，它是串行GA的一种直接并行化方案，在计算机上以master-slave编程模式实现。它只有一个种群，所有个体的适应度都根据整个种群的适应度计算，个体之间可以任意匹配，每个个体都有机会和其他个体杂交而竞争，因而在种群上所作的选择和匹配是全局的。对于这个模型有多种实现方法：第一种方法是仅仅对适值度函数计算进行并行处理；第二种方法是对遗传算子进行并行处理。全局模型易于实现，如果计算时间主要用在评价上，这是一种非常有效的并行化方法。它最大的优点是简单，保留了串行GA 的搜索行为，因而可直接应用GA 的理论来预测一个具体问题能否映射到并行GA上求解。对于适应度估值操作比其他遗传算子计算量大的多时，它是很有效的，并且不需要专门的计算机系统结构。3、2粗粒度PGA模型该模型又称分布式、MIMD、岛模式遗传算法模型，它是对经典GAs 结构的扩展。它将种群划分为多个子种群(又称区域)，每个区域独自运行一个GA。此时，区域选择取代了全局选择，配偶取自同一区域，子代与同一区域中的亲本竞争。除了基本的遗传算子外，粗粒度模型引入了“迁移”算子，负责管理区域之间的个体交换。在粗粒度模型的研究中，要解决的重要问题是参数选择，包括：迁移拓扑、迁移率、迁移周期等。在种群划分成子种群(区域)后，要为种群指定某种迁移拓扑。迁移拓扑确定了区域之间个体的迁移路径，迁移拓扑与特定的并行机结构有着内在的对应关系，大多采用类似于给定并行处理机的互连拓扑。如果在顺序计算机上实现粗粒度模型，则可以考虑采用任意结构。拓扑结构是影响PGA 性能的重要方面，也是迁移成本的主要因素。区域之间的个体交换由两个参数控制：迁移率和迁移周期。迁移基本上可以采用与匹配选择和生存选择相同的策略，迁移率常以绝对数或以子种群大小的百分比形式给出，典型的迁移率是子种群数目的10%到20%之间。迁移周期决定了个体迁移的时间间隔，一般是隔几代(时期) 迁移一次，也可以在一代之后迁移。通常，迁移率越高，则迁移周期就越长。有的采用同步迁移方式，有的采用异步迁移方式。迁移选择负责选出迁移个体，通常选择一个或几个最优个体，有的采用适应度比例或者排列比例选择来选择迁移个体，也有采用随机选取和替换的。在大多数情况下,是把最差或者有限数目的最差个体替换掉.与迁移选择类似，可采用适应度比例或者排列比例选择，确定被替换的个体，以便对区域内部的较好个体产生选择压力。基于国内的现状，分布式PGA为国内PGA研究的主要方向。分布式PGA作为PGA的一种形式，一般实行粗粒度及全局级并行，各子种群间的相互关系较弱，主要靠一些几乎串行GA来加速搜索过程。采用分布式PGA求解问题的一般步骤为：（1）将一个大种群划分为一些小的子种群，子种群的数目与硬件环境有关；（2）对这些子种群独立的进行串行GA操作，经过一定周期后，从每个种群中选择一部分个体迁移到另外的子种群。对于个体迁移存在多种方法，第一种方法，在执行迁移操作时，每次从子种群中随机选择一部分染色体发送出去，接收的染色体数应该与发出的染色体相同。第二种方法，在执行迁移操作时，首先在每个子种群内只使用选择而不使用其它遗传算子繁殖一些后代，这些后代的数目与迁移数相同。然后再将这些后代的原子种群合并成一个大子种群并均匀随即地从该子种群中选择个体进行迁移。这样，待迁移后子种群的规模便又恢复到正常状态。而当子种群接收到从其他子种群迁移来的个体时则均匀随即地替换掉子种群内的个体。第三种方法，将其中一个子种群设置为中心子种群，其他子种群与中心子种群通信。中心子种群始终保持着整个种群中当前的最优个体，其他子种群通过“引进”中心子种群中的最优个体来引导其加快收敛速度，改善个体特征。3、3 细粒度PGA模型该模型又称领域模型或SIMD PGA模型，对传统GA作了修改。虽然细粒度模型也只有一个种群在进化，但在种群平面网格细胞上，将种群划分成了多个非常小的子种群(理想情况是每个处理单元上只有一个个体)，子种群之间具有极强的通信能力，便于优良解传播到整个种群。全局选择被领域选择取代，个体适应度的计算由局部领域中的个体决定，重组操作中的配偶出自同一领域，且子代同其同一领域的亲本竞争空间，即选择和重组只在网格中相邻个体之间进行。细粒度模型要解决的主要问题是领域结构和选择策略。领域结构既决定了种群中个体的空间位置，也确定了个体在种群中传播的路径。领域结构主要受特定并行计算机的内存结构和通信结构影响。领域拓扑确定一个个体的邻居，构成该个体的局部领域。通常，只有一个拓扑的直接领域才属于其局部领域，若把某个固定步数内所能到达的所有个体也包含在内，则可以扩大领域半径。在确定选择策略时，要考虑到选择压力的变化，而选择压力与领域结构有关。与全局匹配选择类似，局部匹配选择可以采用局部适应度比例、排列比例选择，以及随机行走选择。局部生存选择确定局部邻域中被替换的个体，如果子代自动替换邻域中心的那个个体，那么可以直接使用代替换作为局部生存策略。3、4 混合PGA模型该模型又称为多层并行PGA模型，它结合不同PGA模型的特性，不仅染色体竞争求取最优解，而且在GA结构上也引入了竞争以提供更好的环境便于进化。通常，混合PGA以层次结构组合，上层多采用粗粒度模型，下层既可采用粗粒度模型也可采用细粒度模型。或者，种群可以按照粗粒度PGA模型分裂，迁移操作可以采用细粒度PGA模型。3、5 四种模型的比较就现有的研究结果来看，很难分出各模型的高低。在评价并行模型的差异时，有时还得深入到实现细节上，如问题的差异、种群大小、或者不同的局部搜索方法等。但有一个结论是肯定的：不采用全局并行模型，而采用粗粒度模型或者细粒度模型通常能获得更好的性能。粗粒度模型与细粒度模型孰优孰劣，尚是一个未知数。目前，以粗粒度模型最为流行，因为一是其实现较容易，只需在串行GA中增加迁移子例程，在并行计算机的节点上各自运行一个副本，并定期交换几个个体即可；二是在没有并行计算机时，也可在网络或单机系统上模拟实现。虽然并行GA能有效地求解许多困难的问题，也能在不同类型的并行计算机上有效地实现，但仍有一些基本的问题需要解决。种群大小可能既影响大多数GA的性能，也决定GA找到解所需时间的主要因素。在PGA中，另一个重要问题是如何降低通信开销，包括迁移率的确定，使得区域的行为象单个种群一样；确定通信拓扑，既能充分地组合优良解，又不导致过多的通信开销；能否找到一个最优的区域数等。另外，对不同的应用问题，混合模型难以设定基本GA的参数，其节点的结构是动态变化的，它比粗粒度和细粒度模型更具有一般性，算法更为复杂，实现代价更高。4、并行遗传算法的评价模型：并行遗传算法的性能主要体现在收敛速度和精度两个方面，它们除了与迁移策略有关，还与一些参数选取的合理性密切相关，如遗传代数、种群数目、种群规模、迁移率和迁移间隔。利用Amdahl定律评价并行遗传算法，即绝对加速比(speedup) = Ts/Tp，其中，Ts为串行遗传算法(单个处理器)的执行时间；Tp为并行遗传算法的执行时间。Amdahl定律适用于负载固定的情况，对于并行遗传算法而言，就是适用于总种群规模不变的情况。所以，Amdahl定律适用于主从式和细粒度模型，在适应度评价计算量较大时，主从式模型可以得到接近线性的加速比。由于细粒度模型的应用较少，适用的SIMD并行机的可扩展性也不突出，所以很少有人评价细粒度模型的加速比。利用Amdahl定律评价粗粒度模型时，需保持总的种群规模，即子种群数量和子种群规模成反比。这种情况下粗粒度模型的加速比接近线性，这是由于粗粒度模型的通信开销和同步开销都不大。5、实例：带约束并行多机调度5、1 问题描述最小化完工时间的带约束并行多机调度问题可描述如下：有 n 个相关的工件，m 台机器，每个工件都有确定的加工时间，且均可由 m 台机器中的任一台完成加工任务。要找一个最小调度，即确定每台机器上加工的工件号顺序，使加工完所有工件所需时间最短。算法关键在于：(1) 如何表示工件之间的关系。可以把 n 个相关工件表示成一个后继图，如上图所示。图中节点间的有向边表示工件之间的后继或编序关系。因此，Ti →Tj 表示工件 Tj 在完成之后才能启动工件Ti。显然对于 n 个相关工件，我们可以根据工件间的约束关系所表示成的后继图产生一符合约束条件的工件序列( a0，a1，…，ai，…，an-1) (0 ≤ai 硕士学位论文, 、王冠. 并行遗传算法及其在组合优化问题上的分布式应用, 武汉理工大学硕士学位论文, 、吴昊, 程锦松. 用并行遗传算法解决带约束并行多机调度问题. 微机发展, 2001.
187 评论

相关问题

热门问题