Доклад посвящен использованию технологий CUDA и MPI для совместной работы суперкомпьютеров. Обсуждаются принципы работы MPI, включая его роль в обмене данными между узлами кластера, а также особенности взаимодействия с архитектурой GPU через CUDA. Приводятся примеры кода и объясняется, как CUDA-aware MPI упрощает и ускоряет процесс передачи данных.