научный сотрудник, Институт проблем проектирования в микроэлектронике Российской академии наук, 124365, РФ, Москва, Зеленоград, ул. Советская, дом 3
Исследование задачи молекулярной динамики на эмуляторе потоковой параллельной вычислительной системы
АННОТАЦИЯ
Задачи молекулярной динамики требуют больших вычислительных ресурсов, а для эффективного использования этих ресурсов нужно создавать программы с высокой степенью масштабируемости. Многие программы, исполняемые на высокопроизводительных кластерах, используют «простой» параллелизм и плохо масштабируются – максимально до сотен ядер, а при большем количестве ядер производительность падает.
Авторами был разработан полностью асинхронный эффективный алгоритм задачи молекулярной динамики, опирающийся только на локальные взаимодействия между вычислительными ядрами, ответственными за соседние области. Этот алгоритм был реализован в потоковой модели вычислений с динамически формируемым контекстом. В статье описаны основные особенности этой модели вычислений и архитектуры вычислительной системы, её реализующей.
В статье описываются также основные подходы к определению возможностей и анализу эффективности применения параллельной потоковой вычислительной системы для задач молекулярной динамики. Эксперименты на эмуляторе системы показали улучшение соотношения между числом атомов задачи, приходящихся на одно вычислительное ядро системы, и количеством ядер системы, что позволяет распараллеливать задачу молекулярной динамики без потери производительности на значительно большее число ядер по сравнению с кластерными системами.
ABSTRACT
The task of molecular dynamics requires large computing resources, and for the efficient use of these resources it is necessary to create programs with a high degree of scalability.
Many programs (executed on high-performance clusters) use “simple” parallelism and have a bad scaling – up to a maximum of hundreds of cores, but the performance degrades with a large amount of cores.
The authors have developed a fully asynchronous efficient algorithm for the task of molecular dynamics, based only on the local interactions between cores, which are responsible for neighboring areas. This algorithm has been implemented in the dataflow computing model with dynamically formed context. The article describes the main features of this computing model and the architecture of the computing system, which implements it.
The article also describes the main approaches to identify opportunities and to analyze the efficiency of application of the parallel dataflow computing system for molecular dynamics. The experiments on the emulator of system show the improvement in the ratio between the number of atoms of the task, for a single core of the system, and the total number of cores. It allows to parallelize the task of molecular dynamics without loss of performance on a much larger amount of cores in comparison with cluster systems.
Список литературы:
1. Воеводин Вл.В., Жуматий С.А., Соболев С.И. и др. Практика суперкомпьютера «Ломоносов» // Открытые системы. – М.: Издательский дом «Открытые системы», 2012. – № 7. – С. 36–39.
2. Змеев Д.Н., Левченко Н.Н., Окунев А.С. Управление вычислениями в системе ввода данных параллельной потоковой вычислительной системы «Буран» // Материалы 3-й Всероссийской научно-технической конференции «Суперкомпьютерные технологии» (СКТ-2014). – 2014. – Т. 1 – С. 48–51.
3. Змеев Д.Н., Окунев А.С., Левченко Н.Н. и др. Реализация параллельной модели вычислений с управлением потоком данных на кластерных супер-компьютерах // Научный сервис в сети Интернет: все грани параллелизма: Труды Международной суперкомпьютерной конференции (23–28 сентября 2013 г., г. Новороссийск). – М.: Изд-во МГУ, 2013. – С. 375–377.
4. Климов А.В., Змеев Д.Н., Левченко Н.Н. и др. Способы регулирования вычислений в параллельной потоковой вычислительной системе // Проблемы разработки перспективных микро- и наноэлектронных систем – 2014. Сборник трудов / под общ. ред. академика РАН А.Л. Стемпковского. – М.: ИППМ РАН, 2014. – Часть IV. – С. 79–82.
5. Климов А.В., Левченко Н.Н., Окунев А.С. и др. Автоматическое распараллеливание для гибридной системы с потоковым ускорителем // Информационные технологии и вычислительные системы. – 2011. – № 2. – С. 3–11.
6. Климов А.В., Левченко Н.Н., Окунев А.С. и др. Суперкомпьютеры, иерархия памяти и потоковая модель вычислений // Программные системы: теория и приложения: электрон. научн. журн. – 2014. – T. 5. – № 1(19). – С. 15–36 / [Электронный ресурс]. – Режим доступа: URL: http://psta.psiras.ru/read/psta2014_1_15-36.pdf (дата обращения: 01.11.2015).
7. Куксин А.Ю., Ланкин А.В., Морозов И.В. и др. ЗАЧЕМ и КАКИЕ нужны суперкомпьютеры эксафлопсного класса? Предсказательное моделирование свойств и многомасштабных процессов в материаловедении // Программные системы: теория и приложения: электрон. научн. журн. – 2014. – T. 5. – № 1(19). – С. 191–244 / [Электронный ресурс]. – Режим доступа: URL: http://psta.psiras.ru/read/psta2014_1_191-244.pdf (дата обращения: 01.11.2015).
8. Стемпковский А.Л., Климов А.В., Левченко Н.Н. и др. Методы адаптации параллельной потоковой вычислительной системы под задачи отдельных классов // Информационные технологии и вычислительные системы. – 2009. – № 3. – С. 12–21.
9. Стемпковский А.Л., Левченко Н.Н., Окунев А.С. и др. Параллельная потоковая вычислительная система – дальнейшее развитие архитектуры и структурной организации вычислительной системы с автоматическим распределением ресурсов // Информационные технологии. – 2008. – № 10. – С. 2–7.
10. Bowers K.J., Chow E., Xu X. еt al. Scalable Algorithms for Molecular Dynamics Simulations on Commodity Clusters // Proceedings of the ACM/IEEE Conference on Supercomputing (SC06). – NY: IEEE, 2006. – Article No. 84.
11. Laxmikant K., Robert S., Milind B. et al. NAMD2: Greater Scalability for Parallel Molecular Dynamics // Journal of Computational Physics. – 1999. – Vol. 151. – P. 283–312.
12. Mederski J., Mikulski L., Bala P. Asynchronous Parallel Molecular Dynamics Simulations // Lecture Notes in Computer Science. – 2008. – Vol. 4967. –P. 439–446.
References:
1. Voevodin Vl.V., Zhumatij S.A., Sobolev S.I., Antonov A.S., Bryzgalov P.A., Nikitenko D.A., Stefanov K.S., Voevodin Vad.V. Practice of supercomputer “Lomonosov”. Otkrytye sistemy [Open Systems]. Moscow, Izdatel'skii dom “Otkrytye sistemy” Publ., 2012, no. 7, pp. 36–39. (In Russian).
2. Zmeev D.N., Levchenko N.N., Okunev A.S. Management of computations in the system of data input of the parallel dataflow computing system “Buran”. Materialy 3-j Vserossijskoj nauchno-tehnicheskoj konferencii “Superkomp'juternye tehnologii” (SKT-2014). [Proceedings of the Third All-Russia Scientific and Technical Conference “Supercomputer technologies” (SCT-2014)]. 2014, vol. 1, pp. 48–51. (In Russian).
3. Zmeev D.N., Okunev A.S., Levchenko N.N., Klimov A.V. The implementation of parallel computing model with control of dataflow on clustered supercomputers. Nauchnyj servis v seti Internet: vse grani parallelizma: Trudy Mezhdunarodnoj superkomp'juternoj konferencii [Scientific service in the Internet: all facets of parallelism: Proceedings of the International Supercomputer Conference]. Moscow, MGU Publ., 2013, pp. 375–377. (In Russian).
4. Klimov A.V., Zmeev D.N., Levchenko N.N., Okunev A.S. Methods of regulation of computation in parallel dataflow computating system. Problemy razrabotki perspektivnyh mikro- i nanojelektronnyh sistem [Problems of Advanced Micro- and Nanoelectronic Systems development. Proceedings]. Moscow, IPPM RAN Publ., 2014, part IV, pp. 79–82. (In Russian).
5. Klimov A.V., Levchenko N.N., Okunev A.S., Stempkovskiy A.L. Automatic parallelization for hybrid system with dataflow accelerator. Zhurnal “Informacionnye tehnologii i vychislitel'nye sistemy” [Journal of Information Technologies and Computing Systems]. 2011, no. 2, pp. 3–11. (In Russian).
6. Klimov A.V., Levchenko N.N., Okunev A.S., Stempkovskij A.L. Supercomputers, memory hierarchy and the dataflow computing system. Programmnye sistemy: teoriia i prilozheniia [Program systems: theory and applications], 2014, vol. 5, no. 1(19), pp. 15–36. Available at: http://psta.psiras.ru/read/psta2014_1_15-36.pdf (Accessed 1 November 2015).
7. Kuksin A.Ju., Lankin A.V., Morozov I.V., Norman G.Je., Orehov N.D., Pisarev V.V., Smirnov G.S., Starikov S.V., Stegajlov V.V., Timofeev A.V. Predictive modeling and simulation of properties and multi-scale processes in materials science. Tasks for Exaflops-era supercomputers. Programmnye sistemy: teoriia i prilozheniia [Program systems: theory and applications]. 2014, vol. 5, no. 1, pp. 191–244. Available at: http://psta.psiras.ru/read/psta2014_1_191-244.pdf (Accessed 1 November 2015).
8. Stempkovskiy A.L., Klimov A.V., Levchenko N.N., Okunev A.S. Methods of Parallel Dataflow Computing System Adaptation for Problems of Individual Classes. Informacionnye tehnologii i vychislitel'nye sistemy [Information Technologies and Computing Systems]. 2009, vol. 3, pp. 12–21. (In Russian).
9. Stempkovskij A.L., Levchenko N.N., Okunev A.S., Cvetkov V.V. Parallel dataflow computing system: further development of architecture and structural organization of the computing system with automatic distribution of resources. Informacionnye tehnologii [Information technologies]. 2008, no. 10, pp. 2–7. (In Russian).
10. Bowers K.J., Chow E., Xu X. еt al. Scalable Algorithms for Molecular Dynamics Simulations on Commodity Clusters. Proceedings of the ACM/IEEE Conference on Supercomputing (SC06). NY: IEEE, 2006. Article No. 84.
11. Laxmikant K., Robert S., Milind B. et al. NAMD2: Greater Scalability for Parallel Molecular Dynamics. Journal of Computational Physics. 1999, Vol. 151. P. 283–312.
12. Mederski J., Mikulski L., Bala P. Asynchronous Parallel Molecular Dynamics Simulations. Lecture Notes in Computer Science Volume 4967. 2008. P. 439–446.