在有限元计算中,对于网格数量巨大且复杂的问题需要迭代数量大,这个时候,电脑的配置好坏将是制约运算速度的关键点,通常使用的工作站、刀片机集群、甚至超算,什么情况下采取不同的计算机配置呢?一起来看看涉及的相关计算:
1.并行计算(Parallel Computing)
并行计算的主要目的是快速解决大型且复杂的计算问题。并行计算可以划分成时间并行和空间并行。时间并行即流水线技术,空间并行使用多个处理器执行并发计算,当前研究的主要是空间的并行问题。以程序和算法设计人员的角度看,并行计算又可分为数据并行和任务并行。数据并行把大的任务化解成若干个相同的子任务,处理起来比任务并行简单。空间上的并行导致两类并行机的产生,按照 Michael Flynn(费林分类法)的说法分为单指令流多数据流(SIMD)和多指令流多数据流(MIMD),而常用的串行机也称为单指令流单数据流(SISD)。MIMD 类的机器又可分为常见的五类:并行向量处理机(PVP)、对称多处理机(SMP)、大规模并行处理机(MPP)、工作站机群(COW)、分布式共享存储处理机(DSM)。
2.分布式计算(Distributed Computing)
分布式计算,把需要进行大量计算的工程数据分区成小块,由多台计算机分别计算,在上传运算结果后,将结果统一合并得出数据结论。目前常见的分布式计算项目通常使用世界各地上千万志愿者计算机的闲置计算能力,通过互联网进行数据传输。
3.并行计算与分布式计算的区别
并行计算的任务包之间相互影响,要求每个的计算结果要绝对正确,而且在时间上要尽量做到同步。而分布式的任务包互相之间有独立性,上一个任务包的结果未返回或者是结果处理错误,对下一个任务包的处理几乎没有什么影响。因此,分布式的实时性要求不高,而且允许存在计算错误(因为每个计算任务给好几个参与者计算,上传结果到服务器后要比较结果,然后对结果差异大的进行验证。
4.集群计算(Cluster Computing)
计算机集群将一组松散集成的计算机软件或硬件连接起来高度紧密地协作完成计算工作。在某种意义上,他们可以被看作是一台计算机。集群系统中的单个计算机通常称为节点,通常通过局域网连接。根据组成集群系统的计算机之间体系结构是否相同,集群可分为同构与异构两种。集群计算机按功能和结构可以分为:(1)高可用性集群(High-availability (HA) clusters)一般是指当集群中有某个节点失效的情况下,其上的任务会自动转移到其他正常的节点上。某节点进行离线维护再上线,也并不影响整个集群的运行。(2)负载均衡集群(Loadbalancing clusters),又称服务器群(Server Farm),一般通过一个或者多个前端负载均衡器,将工作负载分发到后端的一组服务器上。一般会同时具有高可用性与负载均衡的特点。(3)高性能计算集群(High-performance (HPC)clusters)主要用于科学计算,适合完成并行运算,在计算中各计算节点之间会发生大量数据通讯。
5.网格计算(Grid Computing)
组合与共享资源并确保系统安全,利用大量异构计算机的未用资源(CPU 周期和磁盘存储),将其作为嵌入在分布式电信基础设施中的一个虚拟的计算机集群,为解决大规模的计算问题提供一个模型。
6.集群计算与网格计算的区别
网格与传统集群的主要差别是网格是连接一组相关并不信任的计算机,它的运作更像一个计算公共设施而不是一个独立的计算机。网格本质上就是动态的,集群包含的处理器和资源的数量通常都是静态的。在网格上,资源则可以动态出现或从网格中删除。集群互连技术可以产生非常低的网络延时,而网格由于动态特性,可以提供很好的高可扩展性。很多网格都在自己管理的资源中采用了集群。
7.云计算(Cloud Computing)
云计算除了计算概念,还有运营服务等概念,应用分布式存储和分布式缓存、虚拟化等技术。主要面向社交网络、企业 IT 建设和信息化等领域,以数据密集型、I/O 密集型应用为主。它是分布式计算、并行计算和网格计算的发展,或者说是这些概念的商业实现。
8.超算 (HPC)
超级计算机,主要面向科学计算、工程模拟等领域,大多属于计算密集型的应用。
9.超算与云计算的区别
超级计算机就好比是 F1,而云就好比是公共汽车。F1 可以非常快地把一个人带到目的地,而公共汽车擅长同时为多个乘客服务。云使用虚拟化技术提高 CPU 和 IO 利用率,而超级计算机生来就是为了跑满 CPU 的,使用虚拟化技术反而拖后腿。
不同的计算量需要不同的电脑配置,这取决于许多因素,如经济实力、人员技术水平、项目问题解决的频次等。当选定电脑计算后,具体影响计算的硬件因素如下:
1、CPU:决定网格计算速度;
关于 CPU 和内存的要求:
首先 CPU 和内存频率越高,计算速度就会越快。如确保 CPU 所有的核心 100%进行运算,所进行运算的数据容量一定不要超过可使用的空闲内存容量,否则整个计算过程要被内存空间不足,从虚拟内存、硬盘中频繁数据调用读取,造成 cpu 时间延迟等待.
关于网络计算规模对应 CPU 核数:
从现有规格 Xeon E3、Xeon 5600 处理器规格来讲,通常小规模(300 万网格以内)推荐 4 核图形工作站,中大规模(600 万网格以内)推荐 8 核图形工作站,超大规模(1000 万网格)推荐 12 核图形工作站。
2、内存:决定的网络计算规模;
核与内存容量的比例:
每个核与内存数据计算量大概在 1:4~8 比较合理 ,例如 4 核对应内存 16GB~32GB,8 核对应 32GB~64GB,12 核对应 48GB~96GB,当然内存越大越好,XASUN 独有的内存虚拟硬盘软件可以帮助你大幅缩短数据交换时间。
网格规模与内存容量合理分配:
如果设置 ABAQUS 使用的内存上限超过实际的物理内存,调用的数据就会从虚拟内存、硬盘来读去,CPU 的等待时间大大变长,造成计算速度整体下降。所以务必保证控制好数据占用内存容量上限,必须是计算机物理内存实际能空闲提供给 ABAQUS 使用的内存。
3、硬盘:决定隐式计算中间数据回写性;
硬盘的性能:
在计算过程中,如果内存容量不够, 数据文件是放在硬盘上的, 如果内存足够大的话, 这个文件则会由 ABAQUS 进行任务调度放入内存以提高速度, 即设定内存使用量的百分比. 这个不是指所需的内存量, 而是作为一个控制磁盘剩余空间的参数.
内存容量毕竟有限,如果模型特别大的话,两类文件加起来得几十个 GB,肯定得往硬盘里写数据。所以提升效率最经济的方法就是把硬盘读写的速度提上去,就得通过 RAID 方式提升硬盘的读写性能,详细推荐参考下面配置方案中得硬盘使用。
4、显卡:决定计算结果的图形生成可视化模型规模和性能;
计算中的操作软环境注意:
一般计算所用的操作系统,基本都是 window 和 linux 64 位,但是基于 Linux 环境的计算时间普遍比 Windows 环境要短的多,另外安装过程也有很多注意事项,只有对整个运行过程非常了解,设置合理,对计算速度提升非常大的。