научный сотрудник, Институт проблем проектирования в микроэлектронике Российской академии наук, 124365, РФ, Москва, Зеленоград, ул. Советская, дом 3
Исследование задачи молекулярной динамики на эмуляторе потоковой параллельной вычислительной системы
АННОТАЦИЯ
Задачи молекулярной динамики требуют больших вычислительных ресурсов, а для эффективного использования этих ресурсов нужно создавать программы с высокой степенью масштабируемости. Многие программы, исполняемые на высокопроизводительных кластерах, используют «простой» параллелизм и плохо масштабируются – максимально до сотен ядер, а при большем количестве ядер производительность падает.
Авторами был разработан полностью асинхронный эффективный алгоритм задачи молекулярной динамики, опирающийся только на локальные взаимодействия между вычислительными ядрами, ответственными за соседние области. Этот алгоритм был реализован в потоковой модели вычислений с динамически формируемым контекстом. В статье описаны основные особенности этой модели вычислений и архитектуры вычислительной системы, её реализующей.
В статье описываются также основные подходы к определению возможностей и анализу эффективности применения параллельной потоковой вычислительной системы для задач молекулярной динамики. Эксперименты на эмуляторе системы показали улучшение соотношения между числом атомов задачи, приходящихся на одно вычислительное ядро системы, и количеством ядер системы, что позволяет распараллеливать задачу молекулярной динамики без потери производительности на значительно большее число ядер по сравнению с кластерными системами.
ABSTRACT
The task of molecular dynamics requires large computing resources, and for the efficient use of these resources it is necessary to create programs with a high degree of scalability.
Many programs (executed on high-performance clusters) use “simple” parallelism and have a bad scaling – up to a maximum of hundreds of cores, but the performance degrades with a large amount of cores.
The authors have developed a fully asynchronous efficient algorithm for the task of molecular dynamics, based only on the local interactions between cores, which are responsible for neighboring areas. This algorithm has been implemented in the dataflow computing model with dynamically formed context. The article describes the main features of this computing model and the architecture of the computing system, which implements it.
The article also describes the main approaches to identify opportunities and to analyze the efficiency of application of the parallel dataflow computing system for molecular dynamics. The experiments on the emulator of system show the improvement in the ratio between the number of atoms of the task, for a single core of the system, and the total number of cores. It allows to parallelize the task of molecular dynamics without loss of performance on a much larger amount of cores in comparison with cluster systems.
Список литературы:
References: