ty -jour a2 -Köstler,Harald au -Bernabé,Gregorio au -Acacio,Manuel E. PY -2018 DA -2018/2018/08/23 TI-在低点SDC群集SP -2037272 VL--2037272 VL--2037272 VL--2037272 VL--2018 AB-许多高度平行的算法通常会生成大量包含有效元素和无效元素的数据,以及对流压实问题的高性能解决方案在这种情况下显示出极为重要的。尽管平行流压实已经在基于GPU的平台中进行了广泛的研究,最近在Intel Xeon Phi平台中,尚无研究考虑使用低成本计算集群的平行化,即使是通用单板计算设备由于每$和瓦特的高性能,因此在科学界越来越受欢迎。在这项工作中,我们考虑了由四个ODROID C2单板计算机(SDC)组成的极低成本集群的情况,表明流动压实也可以从这种平台中获得受益 - 最重要的加速。为此,我们使用MPI得出了两个并行实现的流压实问题。然后,我们将它们评估考虑不同的过程和/或SDC以及不同的输入尺寸。通常,我们看到,除非流中的元素数量太小,否则在八个符合群集的四个SDC中分布八个MPI过程时,将获得最佳结果。为了为获得的结果增加值,我们还考虑在非常高性能但渴望渴望的18核Intel Xeon E5-2695 V4多核算处理器上执行两个并行实现,以获取Odroid C2当考虑到所需的执行时间和所需的能量时,SDC群集构成了更有效的替代方案。 Finally, we also implement and evaluate a parallel version of the stream split problem to store also the invalid elements after the valid ones. Our implementation shows good scalability on the Odroid C2 SDC cluster and more compensated computation/communication ratio when compared to the stream compaction problem. SN - 1058-9244 UR - https://doi.org/10.1155/2018/2037272 DO - 10.1155/2018/2037272 JF - Scientific Programming PB - Hindawi KW - ER -