第23卷第1期
2005年03月
文章编号:0258.1825(2005)01—0079.05
空气动力学学报ACTAAERODYNAMICASINICA
V01.23.No.1
Mar..2005
非结构网格多区域动态加密及分布式并行计算
朱
君,赵
宁
(南京航空航天大学,南京210016)
摘要:针对分布式并行系统,提出一种二维非结构网格多区域动态并行策略,可在计算过程中对各计算区域的网格进行局部白适应网格加密,可在不过多消耗计算机资源的情况下,快速,有效地实现多台同构计算机上的计算网格的动态负载平衡。并针对二维Euler方程,利用已有的高精度MmB有限体积格式,应用提出的并行计算策略,进行了多个数值试验,得到令人满意的效果。
关键词:非结构网格;自适应网格加密;动态负载平衡;并行计算中图分类号:0241;V211.3
文献标识码:A
O
引言
则,由这些三角形的边直接生成新点,让新点与符合要求的三角形的边的两点相连构成三角形。这样生成的三角形网格具有较好的几何性质。
在大规模并行计算过程中,如何有效地实现各计算机上计算的动态负载平衡,计算区域的拓扑结构简单,一直是一个重要的研究课题,文献[1,4,5]的作者们作出了重要贡献。我们参考了文献[7—9],主要在文献[1,2]的基础上生成了高质量的三角形网格。为解决计算区域的连通几何分区以供多台计算机并行计算的课题,提出了背景网格与前景网格的逻辑概念,通过它们之间的映射关系可以较好地解决各计算区域的边界在加密减密后三角形不吻合,产生边界信息传递有误的问题,使得网格的加密减密不但可在区域内部进行,还可在区域边界进行。加密减密后的网格单元可在不同的计算机之间进行快速的调整,达到计算负载平衡的目的。本文继承和发展了网格区域内部,区域边界,以及跨区域的网格加密减密技术,较好地处理了其上物理量的改变,较好地解决了边界信息的正确交换问题。因此具有一定的实际应用价值。
2并行计算策略
本文所研究的是分布式的并行计算系统,如Pc集群。这实际上也是目前计算流体力学问题并行计算研究的重要系统结构之一。该系统的主要特点是:成本低、大规模、分布式存储等等。
为了下文阐述的方便,首先给出几个定义:前景网格:为背景网格的子集合,是各计算机上实际计算时使用的网格,各前景网格之间互不相交,所有前景网格的并集为背景网格。
实际三角形:前景网格中的元素,又称为计算控制体。
边界网格:为前景网格的子集,其内三角形的相邻三角形不完全都包含在本前景网格之内。
虚拟网格:前景网格的外缘长出的一层或多层三角形的集合,在计算过程中用于通讯。
虚拟三角形:虚拟网格中的元素。
网格加密:为提高对计算区域局部强间断的分辨率,在出现强间断的区域以密度作为探测器,设立一门阈值,只要相邻的三角形形心处的密度值之差的绝对值超过该值则将此两个三角形作标记作为需加密的三角形单元,在一定规则下将三角形一分为二或一分为四L3l,见图I。
1二维非结构网格的生成
在文献[1,2]的基础之上,作者提出一种二维非结构网格的生成算法,用来生成背景网格。该算法具有以下优越性:在Delaunay生成算法的框架下结合了阵面推进算法的优越性;抛弃了由波阵面中的边来生成新点,让新点与该边的两个点相连构成三角形的思路;从覆盖整个计算区域的三角形着手,给出判断准
・收稿日期:2003.12—16;修订日期:2004.03—26.
资助基金:国家自然科学基金(10072028)、航空科学基金(01A52003)幂11南京航空航天大学青年科研基矗t(y0424—081)资助作者简介:朱君(1977.),男,江苏省溧阳市人,博士生。研究方向:计算数学.
万方数据
80
空气动力学学报
第23卷
图1图1三角形加峦,减密的两种模式
Fig.1
Triangles’twotype
modeof
encrption
网格减密:在非定常问题的计算过程中,激波和接触间断总是随着时间的发展而不断发生形状和位置以及强弱的变化,这时就需要在新的前景网格区域对三角形进行加密,而原来已加密的前景网格区域因为强间断已不在其内,为降低计算量且不影响对强间断的分辨的前提下还是以密度作为探测器,保持原门阈值不变,只要相邻的三角形形心处的密度值之差的绝对值小于该门阈值则将此两个相邻三角形作标记作为需减密的三角形单元。在一定规则下将这些三角形二合为一或四合为一(见图1)。
我们着重讨论以下问题:区域内部和区域之间的三角形加密,加密后各同构计算机上必会产生负载不平衡的现象,需要进行各计算机上前景网格之间三角形的动态调整以达到各前景网格内包含的三角形个数基本相同,使得各计算机上计算量基本相当;在激波和接触间断总是随着时间而发展的情况下,原先加密的某些前景网格区域需要对其内三角形进行减密。减密后又会出现各前景网格三角形个数相差悬殊的局面,使得各计算机上的计算量不平衡,这样又需要根据一定的策略,进行各前景网格内三角形的动态调整,达到各前景网格内包含的三角形个数基本相同,使得各计算机上的计算量基本相当。
总而言之,我们面临的问题有四个:(1)如何在一个前景网格区域内根据需要进行三角形的加密;(2)如何在一个已加密过的前景网格区域内进行三角形的减密;(3)如何在加密或减密后调整各计算机上前景网格内的三角形,使其个数达到基本相同;(4)如何在实际三角形与虚拟三角形之间建立起一一映射关系,使其在计算中能够正确交换数据。
在一个前景网格区域内根据需要进行三角形的加密的具体方法详见文献[3];如何在加密或减密后
调整各计算机上前景网格内三角形使其个数达到基
本相同的方法已在相关文献中详细阐述,这里不再赘述。
下面我们着重解决怎样在一个已加密过的前景网格区域内根据需要进行三角形减密的问题。首先根据计算的具体需要在前景网格的特定区域进行三
万方数据
角形的加密,因为前景网格与背景网格之间已建立起一个一一映射的关系,故在背景网格相应的位置设立一指针信息,记录下其相对应的前景网格处三角形加密的信息(如原三角形分为几个小三角形,小三角形
的单元号,小三角形之间的相邻关系,小三角形与该前景网格上其它未加密区域三角形的相邻关系,小三角形与该前景网格上其它加密区域小三角形的相邻关系等),相应地在前景网格上加密后的小三角形也必须记录下所对应的前景网格上原三角形对应的背景网格上三角形的对应位置。在面积加权的原则下将前景网格需加密的三角形形心处的物理量的值赋到加密后的小三角形的形心处。经过一定的时间步后,如已加密的前景网格区域内三角形需减密,通过该三角形与背景网格上三角形之间的对应关系找到指针,得到其与其它前景网格三角形之间的相邻关系,找出它与哪些小三角形是由同一个大三角形分裂出来的,之后将这些小三角形形心处的物理量的值根据面积加权赋到原来大三角形的形心处。修改背景网格上相应的指针值,删除前景网格上需减密的小三角形的逻辑结构。然后通过改变前景网格的边界网格与背景网格之间的映射关系,与边界网格相邻的本前景网格的虚拟网格与背景网格之间的映射关系,和与边界网格对应的其它前景网格的虚拟网格与背景网格之间的映射关系,通过以上三种映射关系的改变,做到调整前景网格中实际三角形个数的效果,达到各计算机上实际计算时负载平衡的目的。
使用本方法可较好地解决计算区域网格加密减密,边界通讯以及计算的负载平衡问题;需要着重指出的是:前景网格与背景网格只是我们为了本文阐述思想的方便而给出的逻辑概念,而在实际编程时并不需要泾渭分明地建立两套网格,只要在网格单元的属性上设定不同的值,或建立一套指针数组加以区分即可。这样不但可以降低计算机的工作量又可以降低硬件资源的耗用。
下面我们来具体构造一个MmB格式:如图2所示,将三角形O作为计算的控制体,在该控制体上的有限体积格式为:
型粤≠盟+士f
厶‘
i*氘:0(1)
I/xo
J△。
3计算格式
其中u:“(t)是u在第n+1时间层上三角形。上的平均值,/7,时间层上的量“气其右上标在文中以后均
第1期朱君等:非结构网格多区域动态加密及分布式并行计算
略去,3A。为三角形0的三条边,n=(rL。,n,)为三角形。边的单位外法线向量,而F=(f,g),I△。l为三角形0的面积,则式(9)中一条边的通量积分可近似化为:
r一
一
-
啼I
F*nds—I
nF(UN(f))*n
z
(2)
J
f
其中InI为三角形中第Z条边的长度,z=1,2,3,N(1)=i,Ⅳ(2)=J,Ⅳ(3)=k,(见图2)。
y
O
图2带有整体与局部坐标系的三角形网格
Fig.2
Triangles
in
globalandlocalcoordinates
i(u舢))*二一吉(i(州z))+i(‰))*二一
虿1
Q(。Ⅳ(1)+{)(HⅣ(f)一u。)+i1(Q(口Ⅳ(1)+{)一
哥岫胁÷)*d砌,+圭
(3)
其中
dN(1)+{=min
mod(u‘一Ⅱ。,%一u。,
/2,鼍一u。,uⅣ(f)口一H。,u,v(j)6一U。)
(4)
口ⅣcQ(戈)。i(I髫lQc戈,={。I髫l:I+戈。:;/。2£,,;,+;=2+e2;/(2£),
{寨,*二l’
:::三:c5,
I茗I≤e(5)
uⅣ(1)2
uo
(6)
min
mod(菇,Y,z,/Z,移)=
rsign(戈)min(I茗J,IYI,l彳I,l“l,l移I),
{
菇,Y,孑,u,移同号L
0
茗,Y,:,u,移异号
(7)
格式MmB性质的理论证明可参考文献[12,13]。
4数值试验
算例1(台阶问题)本算例水平来流马赫数为3,
万方数据
密度为1,压强为1,计算区域为[0,3]X[0,1]/[0.6,
3]“0,0.2],上下边界均满足反射边界条件,左边界
为超音速来流边界条件,右边界为超音速出流边界条件。见图3至图5。本格式在计算时未在台阶的尖角处做任何数值上的修正,也未在尖角附近局部加密三角形,得到较为满意的图形(边界上三角形边长取为1/50,不同时刻各前景网格的分区范围由图中不同颜色的区域表示)。为判断该并行策略的效率,就本算例给出了一张并行效率表,见表1(表中第一列为用于计算的CPU的个数;第二列为计算区域中三角形的个数;第三,四列分别为串行时间,并行时间,其中48:1l表示为48分11秒;第五列为算例的加速比;第六列为算例的效率)。
图3台阶问题,t=0.27,网格图
Fig.3Rampproblem,I=0.27,mesh
图4台阶问题。t=4.0。网格图
Fig.4
Rampproblem,l=4.0,mesh
1
0.5
Oo
2
图5台阶问题,t=4.0,马赫数
Fig.5
Ramp
problem。I=4.0,Machnumber
算例2(双马赫反射问题[3])本算例是描述一强激波入射在与平面成300角的斜坡上后发生的变化,来流是马赫数为10的强激波.为使试验问题尽可能简单,这里使入射激波倾斜,计算区域为[0,3]×[0,
1],始于戈=1/6,激波与茗轴成角60。。初始数据为
82
空气动力学学报第23卷
M
c戈,y,。,={篡yY乏?/7,:三:!U;其中左右状态值
LⅡ尼
<
L茗,
,
n£,‰以及激波高度分别为:H£=(8,57.1697,一33.0012,563.544)7,/2,R=(1.4,0,0,2.5)r,h(石,t)=
√3(戈一÷)一20t。边界条件处理为:左右边界分别
取为左右状态值,下边界,当髫>1/6时为反射边界,而并≤1/6时,设为左状态值,上边界当石>g(t)时,取右状态值,并≤g(t)时,取左状态值,其中g(t)=
÷+等(1+20t)。本文给出了t=0.2时刻在区域
[0,3]×[0,1]上的等值线。见图6至图8(边界上三角形网格边长取为1/50,不同时刻各前景网格的分区范围由图中不同颜色的区域表示)。为判断该并行策略的效率,就本算例给出了一张并行效率表,见表2。从计算结果可以看出,这儿发展的并行计算方法具有比较好的并行加速效果。
表1
台阶问题动态并行策略的并行效率
Table1
The
algorithm’Sparallelefficiency
ofthe
rampproblem
图6双马赫反射问题,f=2.4e一2。网格图
Fig.6
DoubleMachreflection
problem,t=2.4e一2,mesh
图7双马赫反射问题。t=O.20,网格图
Fig.7
DoubleMach
reflection
problem,t=0.20,mesh
万方数据
图8双马赫反射问题。l=0.20,密度图Fig.8
Double
Machreflection
problem,t=0.20。density
表2双马赫问题动态并行策略的并行效率
Table2
The
algorithm’Sparallelefficiencyofthe
double
Mach
reflection
problem
结论
本文提出的算法可以很好地解决多个计算机上的自适应网格加密问题.它不但在理论上而且能够在实际计算中真正解决区域内部,区域边界,跨区域的网格自适应网格加密问题,再结合静态负载平衡算[1]LOHNER
R,CAMBEROSJandMERRIAMM.Parallel
un-
struetured酣dgeneration[R].A认A-91・1582-cp.[2]
WEATHERILLNP.Delaunaytriangtdafionincomputational
fluid
dynamics(J].Computers
Math.铆比.,1992,24
(5/6):129—150.
王春武.高精度ENO格式的构造及并行计算研究[D].[博士学位论文],南京航空航天大学,2000年.
S
W,BARTHTJ.Efficientmassivelyparallel
Eulersolverfortwo-dimensional
unstructured画ds[J].MAA
Jounm/,April1992,30(4):947.952.OKUSANYA
T,PERAIRE
J.3Dparallelunstrueturodmesh
generation【Aj.Submitted
to
theJoint
ASME/ASCE/SEC
SummerMeeting,specialsymposiumon
trendsinunstructured
mesh
generation[C],January
1997.
K
W.A咖d
generationandflowsolutionmethod
fortheElderequationson
unstructured鲥ds[J].J.Comp.
Phys.,1994,110:23—38.
ML.An
efficientadvancingfrontalgorithmfor
de-
5
法,可以极为迅速地实现各计算机上的计算网格的动态负载平衡,达到我们预期的计算目标。参考文献:
[3]
[4]HAMMOND
[5]
[6]ANDERSON
[7]MERRIAM
第1期
lR].AIAA
朱君等:非结构网格多区域动态加密及分布式并行计算
83
launaytriangulation0792.
paper,January
1991,91—【10J
ROEP
L.ApproximateRiemannsolvers,parameter
vectors
anddifference
schemes[J].J.Comp.Phys.,1981,43
[8]PIRZADEHS.Recentprogressinunstructuredgadgeneration(2):357.372.
[R].AIAA[9]
paper,January1992,92—0445.
[11JwUHM,YANGSL.MmB—a
resolutionschemes
new
classof
in
accurate
hi。gh
WASTONDF.Computingthen—dimensionaldelaunaytessala—
tionwithapplication
to
forconservation1awstwodimensions
voronoi
polytopes【Jj.TheComputer
【RJ.PreprintSC89—6,Konrad—Zuse—ZentromfurInformation
stechnikBerlin,July1989.
Journal,198l,124(2):167—172.
Mesh’Sdynamicencrptioninmulti—fieldsandparallelcomputationwithdistributiontypearchitecture
ZHUJun,ZHAONing
(Nanjing
University
of
Aeronauticsand
Astronautics,Nanjing210016,China)
Abstract:Inthispaper,anewdynamicloadbalancealgorithmispresentedforPCclusterparallelsystem
turedmeshsintwodimensions.Withbalance
on
a
on
unstmc—
non—oscillatoryMmBschemesdeveloped,this
algorithm
can
efficientlykeepload
theparallelsystem.Thenumericalresultsshowthatthenewparallelalgorithmissatisfied.
Keywords:unstructuredmesh;adaptivemeshrefinement;loadbalance;parallelcomputing
‘M“鼙盔山Mb6“2““2d■盈‘N自dMa6Md6Nbdh26“日6a盘d“d盆6k目窿““2“d2“d2“^2“N≈‘N≈‘M≈‘N日‘M“盆继““≈詹6M“2‘M^26M“2““2山M≈●Mb瞌6Ni压“^2“N≈6埘“26“b&h26““2函M≈‘N≈窳““2‘h盆‘“h2‘汹
(上接第78页)
[6]李凤蔚,鄂秦,李杰等.复杂外形网格生成技术[J].空
气动力学学报,1998,16(1):89—96.[7]KIMW
T,HUHKY,LEEJ
ofintakeignition
andcompressionflowin
a
four-valvepent—roofspark
en舀ne
andvalidationwithLDVdata[J].Proc.Instn.
Mech.Engrs.,PartD:JournalofAutomobileEngineering,
W,eta1.NumeficMsimlllation
2000,214(4):361—372.
Three—dimensionaltransientnumericalsimulationofengineintakeflow
LUOMa.jil,HUANGZhe.n1,CHENGuo.hua2,JIANGYan—kun2
(1.ShanghaiJiaotongUniversity,蹋∞曲面200030,China;2.Huazhong
University
of
Science
andTechnology,Wuhan430074,China)
Abstract:Tomeetmoreandmorestringentemissionrequirementsandimprovetheeconomicalperformance,organiz-ingreasonablegasmotioninvehicleengine’Scylinderisveryimportant.However,gasmotioninthecylinderismainlyaf-fectedbytheintakeflowprocess.Inthispaper,three-dimensionaltransientnumericalsimulationisstudiedfortheintakeflowprocessinthevehicle
enginebyusingthearbitraryLagrangian・・Eulerianmethodand
a
a
new
proposed
dynamic
gridgen-・
erationmethod.Turbulenceeffectisrepresentedby
revisedk-e
model.The
calculatedresultsrevealthethree・dimensional
transientflowcharacteristicsof
takesystem.
engine
intakeprocess,whichgiveimportantinformationfortheoptimaldesignofenginein-
Keywords:engine;intakeflow;numericalsimulation;dynamicgadgeneration
万方数据
第23卷第1期
2005年03月
文章编号:0258.1825(2005)01—0079.05
空气动力学学报ACTAAERODYNAMICASINICA
V01.23.No.1
Mar..2005
非结构网格多区域动态加密及分布式并行计算
朱
君,赵
宁
(南京航空航天大学,南京210016)
摘要:针对分布式并行系统,提出一种二维非结构网格多区域动态并行策略,可在计算过程中对各计算区域的网格进行局部白适应网格加密,可在不过多消耗计算机资源的情况下,快速,有效地实现多台同构计算机上的计算网格的动态负载平衡。并针对二维Euler方程,利用已有的高精度MmB有限体积格式,应用提出的并行计算策略,进行了多个数值试验,得到令人满意的效果。
关键词:非结构网格;自适应网格加密;动态负载平衡;并行计算中图分类号:0241;V211.3
文献标识码:A
O
引言
则,由这些三角形的边直接生成新点,让新点与符合要求的三角形的边的两点相连构成三角形。这样生成的三角形网格具有较好的几何性质。
在大规模并行计算过程中,如何有效地实现各计算机上计算的动态负载平衡,计算区域的拓扑结构简单,一直是一个重要的研究课题,文献[1,4,5]的作者们作出了重要贡献。我们参考了文献[7—9],主要在文献[1,2]的基础上生成了高质量的三角形网格。为解决计算区域的连通几何分区以供多台计算机并行计算的课题,提出了背景网格与前景网格的逻辑概念,通过它们之间的映射关系可以较好地解决各计算区域的边界在加密减密后三角形不吻合,产生边界信息传递有误的问题,使得网格的加密减密不但可在区域内部进行,还可在区域边界进行。加密减密后的网格单元可在不同的计算机之间进行快速的调整,达到计算负载平衡的目的。本文继承和发展了网格区域内部,区域边界,以及跨区域的网格加密减密技术,较好地处理了其上物理量的改变,较好地解决了边界信息的正确交换问题。因此具有一定的实际应用价值。
2并行计算策略
本文所研究的是分布式的并行计算系统,如Pc集群。这实际上也是目前计算流体力学问题并行计算研究的重要系统结构之一。该系统的主要特点是:成本低、大规模、分布式存储等等。
为了下文阐述的方便,首先给出几个定义:前景网格:为背景网格的子集合,是各计算机上实际计算时使用的网格,各前景网格之间互不相交,所有前景网格的并集为背景网格。
实际三角形:前景网格中的元素,又称为计算控制体。
边界网格:为前景网格的子集,其内三角形的相邻三角形不完全都包含在本前景网格之内。
虚拟网格:前景网格的外缘长出的一层或多层三角形的集合,在计算过程中用于通讯。
虚拟三角形:虚拟网格中的元素。
网格加密:为提高对计算区域局部强间断的分辨率,在出现强间断的区域以密度作为探测器,设立一门阈值,只要相邻的三角形形心处的密度值之差的绝对值超过该值则将此两个三角形作标记作为需加密的三角形单元,在一定规则下将三角形一分为二或一分为四L3l,见图I。
1二维非结构网格的生成
在文献[1,2]的基础之上,作者提出一种二维非结构网格的生成算法,用来生成背景网格。该算法具有以下优越性:在Delaunay生成算法的框架下结合了阵面推进算法的优越性;抛弃了由波阵面中的边来生成新点,让新点与该边的两个点相连构成三角形的思路;从覆盖整个计算区域的三角形着手,给出判断准
・收稿日期:2003.12—16;修订日期:2004.03—26.
资助基金:国家自然科学基金(10072028)、航空科学基金(01A52003)幂11南京航空航天大学青年科研基矗t(y0424—081)资助作者简介:朱君(1977.),男,江苏省溧阳市人,博士生。研究方向:计算数学.
万方数据
80
空气动力学学报
第23卷
图1图1三角形加峦,减密的两种模式
Fig.1
Triangles’twotype
modeof
encrption
网格减密:在非定常问题的计算过程中,激波和接触间断总是随着时间的发展而不断发生形状和位置以及强弱的变化,这时就需要在新的前景网格区域对三角形进行加密,而原来已加密的前景网格区域因为强间断已不在其内,为降低计算量且不影响对强间断的分辨的前提下还是以密度作为探测器,保持原门阈值不变,只要相邻的三角形形心处的密度值之差的绝对值小于该门阈值则将此两个相邻三角形作标记作为需减密的三角形单元。在一定规则下将这些三角形二合为一或四合为一(见图1)。
我们着重讨论以下问题:区域内部和区域之间的三角形加密,加密后各同构计算机上必会产生负载不平衡的现象,需要进行各计算机上前景网格之间三角形的动态调整以达到各前景网格内包含的三角形个数基本相同,使得各计算机上计算量基本相当;在激波和接触间断总是随着时间而发展的情况下,原先加密的某些前景网格区域需要对其内三角形进行减密。减密后又会出现各前景网格三角形个数相差悬殊的局面,使得各计算机上的计算量不平衡,这样又需要根据一定的策略,进行各前景网格内三角形的动态调整,达到各前景网格内包含的三角形个数基本相同,使得各计算机上的计算量基本相当。
总而言之,我们面临的问题有四个:(1)如何在一个前景网格区域内根据需要进行三角形的加密;(2)如何在一个已加密过的前景网格区域内进行三角形的减密;(3)如何在加密或减密后调整各计算机上前景网格内的三角形,使其个数达到基本相同;(4)如何在实际三角形与虚拟三角形之间建立起一一映射关系,使其在计算中能够正确交换数据。
在一个前景网格区域内根据需要进行三角形的加密的具体方法详见文献[3];如何在加密或减密后
调整各计算机上前景网格内三角形使其个数达到基
本相同的方法已在相关文献中详细阐述,这里不再赘述。
下面我们着重解决怎样在一个已加密过的前景网格区域内根据需要进行三角形减密的问题。首先根据计算的具体需要在前景网格的特定区域进行三
万方数据
角形的加密,因为前景网格与背景网格之间已建立起一个一一映射的关系,故在背景网格相应的位置设立一指针信息,记录下其相对应的前景网格处三角形加密的信息(如原三角形分为几个小三角形,小三角形
的单元号,小三角形之间的相邻关系,小三角形与该前景网格上其它未加密区域三角形的相邻关系,小三角形与该前景网格上其它加密区域小三角形的相邻关系等),相应地在前景网格上加密后的小三角形也必须记录下所对应的前景网格上原三角形对应的背景网格上三角形的对应位置。在面积加权的原则下将前景网格需加密的三角形形心处的物理量的值赋到加密后的小三角形的形心处。经过一定的时间步后,如已加密的前景网格区域内三角形需减密,通过该三角形与背景网格上三角形之间的对应关系找到指针,得到其与其它前景网格三角形之间的相邻关系,找出它与哪些小三角形是由同一个大三角形分裂出来的,之后将这些小三角形形心处的物理量的值根据面积加权赋到原来大三角形的形心处。修改背景网格上相应的指针值,删除前景网格上需减密的小三角形的逻辑结构。然后通过改变前景网格的边界网格与背景网格之间的映射关系,与边界网格相邻的本前景网格的虚拟网格与背景网格之间的映射关系,和与边界网格对应的其它前景网格的虚拟网格与背景网格之间的映射关系,通过以上三种映射关系的改变,做到调整前景网格中实际三角形个数的效果,达到各计算机上实际计算时负载平衡的目的。
使用本方法可较好地解决计算区域网格加密减密,边界通讯以及计算的负载平衡问题;需要着重指出的是:前景网格与背景网格只是我们为了本文阐述思想的方便而给出的逻辑概念,而在实际编程时并不需要泾渭分明地建立两套网格,只要在网格单元的属性上设定不同的值,或建立一套指针数组加以区分即可。这样不但可以降低计算机的工作量又可以降低硬件资源的耗用。
下面我们来具体构造一个MmB格式:如图2所示,将三角形O作为计算的控制体,在该控制体上的有限体积格式为:
型粤≠盟+士f
厶‘
i*氘:0(1)
I/xo
J△。
3计算格式
其中u:“(t)是u在第n+1时间层上三角形。上的平均值,/7,时间层上的量“气其右上标在文中以后均
第1期朱君等:非结构网格多区域动态加密及分布式并行计算
略去,3A。为三角形0的三条边,n=(rL。,n,)为三角形。边的单位外法线向量,而F=(f,g),I△。l为三角形0的面积,则式(9)中一条边的通量积分可近似化为:
r一
一
-
啼I
F*nds—I
nF(UN(f))*n
z
(2)
J
f
其中InI为三角形中第Z条边的长度,z=1,2,3,N(1)=i,Ⅳ(2)=J,Ⅳ(3)=k,(见图2)。
y
O
图2带有整体与局部坐标系的三角形网格
Fig.2
Triangles
in
globalandlocalcoordinates
i(u舢))*二一吉(i(州z))+i(‰))*二一
虿1
Q(。Ⅳ(1)+{)(HⅣ(f)一u。)+i1(Q(口Ⅳ(1)+{)一
哥岫胁÷)*d砌,+圭
(3)
其中
dN(1)+{=min
mod(u‘一Ⅱ。,%一u。,
/2,鼍一u。,uⅣ(f)口一H。,u,v(j)6一U。)
(4)
口ⅣcQ(戈)。i(I髫lQc戈,={。I髫l:I+戈。:;/。2£,,;,+;=2+e2;/(2£),
{寨,*二l’
:::三:c5,
I茗I≤e(5)
uⅣ(1)2
uo
(6)
min
mod(菇,Y,z,/Z,移)=
rsign(戈)min(I茗J,IYI,l彳I,l“l,l移I),
{
菇,Y,孑,u,移同号L
0
茗,Y,:,u,移异号
(7)
格式MmB性质的理论证明可参考文献[12,13]。
4数值试验
算例1(台阶问题)本算例水平来流马赫数为3,
万方数据
密度为1,压强为1,计算区域为[0,3]X[0,1]/[0.6,
3]“0,0.2],上下边界均满足反射边界条件,左边界
为超音速来流边界条件,右边界为超音速出流边界条件。见图3至图5。本格式在计算时未在台阶的尖角处做任何数值上的修正,也未在尖角附近局部加密三角形,得到较为满意的图形(边界上三角形边长取为1/50,不同时刻各前景网格的分区范围由图中不同颜色的区域表示)。为判断该并行策略的效率,就本算例给出了一张并行效率表,见表1(表中第一列为用于计算的CPU的个数;第二列为计算区域中三角形的个数;第三,四列分别为串行时间,并行时间,其中48:1l表示为48分11秒;第五列为算例的加速比;第六列为算例的效率)。
图3台阶问题,t=0.27,网格图
Fig.3Rampproblem,I=0.27,mesh
图4台阶问题。t=4.0。网格图
Fig.4
Rampproblem,l=4.0,mesh
1
0.5
Oo
2
图5台阶问题,t=4.0,马赫数
Fig.5
Ramp
problem。I=4.0,Machnumber
算例2(双马赫反射问题[3])本算例是描述一强激波入射在与平面成300角的斜坡上后发生的变化,来流是马赫数为10的强激波.为使试验问题尽可能简单,这里使入射激波倾斜,计算区域为[0,3]×[0,
1],始于戈=1/6,激波与茗轴成角60。。初始数据为
82
空气动力学学报第23卷
M
c戈,y,。,={篡yY乏?/7,:三:!U;其中左右状态值
LⅡ尼
<
L茗,
,
n£,‰以及激波高度分别为:H£=(8,57.1697,一33.0012,563.544)7,/2,R=(1.4,0,0,2.5)r,h(石,t)=
√3(戈一÷)一20t。边界条件处理为:左右边界分别
取为左右状态值,下边界,当髫>1/6时为反射边界,而并≤1/6时,设为左状态值,上边界当石>g(t)时,取右状态值,并≤g(t)时,取左状态值,其中g(t)=
÷+等(1+20t)。本文给出了t=0.2时刻在区域
[0,3]×[0,1]上的等值线。见图6至图8(边界上三角形网格边长取为1/50,不同时刻各前景网格的分区范围由图中不同颜色的区域表示)。为判断该并行策略的效率,就本算例给出了一张并行效率表,见表2。从计算结果可以看出,这儿发展的并行计算方法具有比较好的并行加速效果。
表1
台阶问题动态并行策略的并行效率
Table1
The
algorithm’Sparallelefficiency
ofthe
rampproblem
图6双马赫反射问题,f=2.4e一2。网格图
Fig.6
DoubleMachreflection
problem,t=2.4e一2,mesh
图7双马赫反射问题。t=O.20,网格图
Fig.7
DoubleMach
reflection
problem,t=0.20,mesh
万方数据
图8双马赫反射问题。l=0.20,密度图Fig.8
Double
Machreflection
problem,t=0.20。density
表2双马赫问题动态并行策略的并行效率
Table2
The
algorithm’Sparallelefficiencyofthe
double
Mach
reflection
problem
结论
本文提出的算法可以很好地解决多个计算机上的自适应网格加密问题.它不但在理论上而且能够在实际计算中真正解决区域内部,区域边界,跨区域的网格自适应网格加密问题,再结合静态负载平衡算[1]LOHNER
R,CAMBEROSJandMERRIAMM.Parallel
un-
struetured酣dgeneration[R].A认A-91・1582-cp.[2]
WEATHERILLNP.Delaunaytriangtdafionincomputational
fluid
dynamics(J].Computers
Math.铆比.,1992,24
(5/6):129—150.
王春武.高精度ENO格式的构造及并行计算研究[D].[博士学位论文],南京航空航天大学,2000年.
S
W,BARTHTJ.Efficientmassivelyparallel
Eulersolverfortwo-dimensional
unstructured画ds[J].MAA
Jounm/,April1992,30(4):947.952.OKUSANYA
T,PERAIRE
J.3Dparallelunstrueturodmesh
generation【Aj.Submitted
to
theJoint
ASME/ASCE/SEC
SummerMeeting,specialsymposiumon
trendsinunstructured
mesh
generation[C],January
1997.
K
W.A咖d
generationandflowsolutionmethod
fortheElderequationson
unstructured鲥ds[J].J.Comp.
Phys.,1994,110:23—38.
ML.An
efficientadvancingfrontalgorithmfor
de-
5
法,可以极为迅速地实现各计算机上的计算网格的动态负载平衡,达到我们预期的计算目标。参考文献:
[3]
[4]HAMMOND
[5]
[6]ANDERSON
[7]MERRIAM
第1期
lR].AIAA
朱君等:非结构网格多区域动态加密及分布式并行计算
83
launaytriangulation0792.
paper,January
1991,91—【10J
ROEP
L.ApproximateRiemannsolvers,parameter
vectors
anddifference
schemes[J].J.Comp.Phys.,1981,43
[8]PIRZADEHS.Recentprogressinunstructuredgadgeneration(2):357.372.
[R].AIAA[9]
paper,January1992,92—0445.
[11JwUHM,YANGSL.MmB—a
resolutionschemes
new
classof
in
accurate
hi。gh
WASTONDF.Computingthen—dimensionaldelaunaytessala—
tionwithapplication
to
forconservation1awstwodimensions
voronoi
polytopes【Jj.TheComputer
【RJ.PreprintSC89—6,Konrad—Zuse—ZentromfurInformation
stechnikBerlin,July1989.
Journal,198l,124(2):167—172.
Mesh’Sdynamicencrptioninmulti—fieldsandparallelcomputationwithdistributiontypearchitecture
ZHUJun,ZHAONing
(Nanjing
University
of
Aeronauticsand
Astronautics,Nanjing210016,China)
Abstract:Inthispaper,anewdynamicloadbalancealgorithmispresentedforPCclusterparallelsystem
turedmeshsintwodimensions.Withbalance
on
a
on
unstmc—
non—oscillatoryMmBschemesdeveloped,this
algorithm
can
efficientlykeepload
theparallelsystem.Thenumericalresultsshowthatthenewparallelalgorithmissatisfied.
Keywords:unstructuredmesh;adaptivemeshrefinement;loadbalance;parallelcomputing
‘M“鼙盔山Mb6“2““2d■盈‘N自dMa6Md6Nbdh26“日6a盘d“d盆6k目窿““2“d2“d2“^2“N≈‘N≈‘M≈‘N日‘M“盆继““≈詹6M“2‘M^26M“2““2山M≈●Mb瞌6Ni压“^2“N≈6埘“26“b&h26““2函M≈‘N≈窳““2‘h盆‘“h2‘汹
(上接第78页)
[6]李凤蔚,鄂秦,李杰等.复杂外形网格生成技术[J].空
气动力学学报,1998,16(1):89—96.[7]KIMW
T,HUHKY,LEEJ
ofintakeignition
andcompressionflowin
a
four-valvepent—roofspark
en舀ne
andvalidationwithLDVdata[J].Proc.Instn.
Mech.Engrs.,PartD:JournalofAutomobileEngineering,
W,eta1.NumeficMsimlllation
2000,214(4):361—372.
Three—dimensionaltransientnumericalsimulationofengineintakeflow
LUOMa.jil,HUANGZhe.n1,CHENGuo.hua2,JIANGYan—kun2
(1.ShanghaiJiaotongUniversity,蹋∞曲面200030,China;2.Huazhong
University
of
Science
andTechnology,Wuhan430074,China)
Abstract:Tomeetmoreandmorestringentemissionrequirementsandimprovetheeconomicalperformance,organiz-ingreasonablegasmotioninvehicleengine’Scylinderisveryimportant.However,gasmotioninthecylinderismainlyaf-fectedbytheintakeflowprocess.Inthispaper,three-dimensionaltransientnumericalsimulationisstudiedfortheintakeflowprocessinthevehicle
enginebyusingthearbitraryLagrangian・・Eulerianmethodand
a
a
new
proposed
dynamic
gridgen-・
erationmethod.Turbulenceeffectisrepresentedby
revisedk-e
model.The
calculatedresultsrevealthethree・dimensional
transientflowcharacteristicsof
takesystem.
engine
intakeprocess,whichgiveimportantinformationfortheoptimaldesignofenginein-
Keywords:engine;intakeflow;numericalsimulation;dynamicgadgeneration
万方数据