|
| 1 | +# Отчет: Быстрая сортировка с простым слиянием |
| 2 | + |
| 3 | +- **Студент:** Никитина Валерия Владимировна |
| 4 | +- **Группа:** 3823Б1ФИ2 |
| 5 | +- **Технология:** MPI, SEQ |
| 6 | +- **Вариант:** 14 |
| 7 | + |
| 8 | +## 1. Введение |
| 9 | + |
| 10 | +Сортировка больших массивов данных — классическая задача, требовательная к вычислительным ресурсам. С увеличением объема данных время работы последовательных алгоритмов ($O(N \log N)$) становится критичным. Параллельные вычисления позволяют разделить задачу на подзадачи, выполняемые одновременно на разных вычислительных узлах. |
| 11 | + |
| 12 | +В данной работе реализован параллельный алгоритм сортировки, использующий стратегию «разделяй и властвуй». Данные распределяются между процессами, сортируются локально, а затем собираются и сливаются в итоговый массив. |
| 13 | + |
| 14 | +## 2. Постановка задачи |
| 15 | + |
| 16 | +**Цель:** Разработать MPI-приложение для сортировки целочисленного вектора. |
| 17 | +**Входные данные:** Вектор `std::vector<int>`, доступный на корневом процессе. |
| 18 | +**Выходные данные:** Отсортированный вектор на корневом процессе. |
| 19 | + |
| 20 | +**Требования:** |
| 21 | +1. Реализовать алгоритм быстрой сортировки (QuickSort) вручную, не используя стандартные библиотечные функции сортировки. |
| 22 | +2. Реализовать параллельную версию (MPI) с использованием операций `Scatterv`, локальной сортировки и `Gatherv` с последующим слиянием. |
| 23 | +3. Обеспечить корректность на любых размерах данных. |
| 24 | + |
| 25 | +## 3. Описание алгоритмов |
| 26 | + |
| 27 | +Для обеспечения честного сравнения и в SEQ, и в MPI версиях используется **одинаковая реализация** алгоритма Хоара (QuickSort), написанная вручную. |
| 28 | + |
| 29 | +### 3.1. Реализация QuickSort (Ядро) |
| 30 | +Используется классическая схема с рекурсией: |
| 31 | +* Выбирается опорный элемент (pivot) из середины массива. |
| 32 | +* Массив разделяется на две части: слева элементы меньше pivot, справа — больше. |
| 33 | +* Алгоритм рекурсивно вызывается для левой и правой частей. |
| 34 | +* Сложность в среднем: $O(N \log N)$. |
| 35 | + |
| 36 | +### 3.2. Последовательный алгоритм (SEQ) |
| 37 | +Последовательная версия выполняет функцию `QuickSortImpl` на всем входном массиве в рамках одного процесса. Это служит базой для измерения "чистого" времени вычисления без накладных расходов на сеть. |
| 38 | + |
| 39 | +### 3.3. Параллельный алгоритм (MPI) |
| 40 | +Алгоритм состоит из четырех этапов: |
| 41 | + |
| 42 | +1. **Распределение (Scatter):** |
| 43 | + * Корневой процесс (Rank 0) делит входной массив размером $N$ на $P$ частей. |
| 44 | + * Размер части для процесса $i$: $count_i = N/P + (i < N\%P ? 1 : 0)$. |
| 45 | + * Используется `MPI_Scatterv` для рассылки блоков разного размера. |
| 46 | + |
| 47 | +2. **Локальная сортировка (Compute):** |
| 48 | + * Каждый процесс (включая Root) запускает `QuickSortImpl` для полученного локального буфера. |
| 49 | + * Этот этап выполняется полностью параллельно. |
| 50 | + |
| 51 | +3. **Сбор данных (Gather):** |
| 52 | + * Отсортированные локальные части собираются обратно на корневой процесс через `MPI_Gatherv`. |
| 53 | + * На этом этапе массив на Root состоит из $P$ отсортированных кусков, идущих подряд. |
| 54 | + |
| 55 | +4. **Слияние (Merge):** |
| 56 | + * Корневой процесс выполняет слияние полученных частей в один отсортированный массив. |
| 57 | + * Используется функция `std::inplace_merge`, применяемая последовательно к границам собранных блоков. |
| 58 | + |
| 59 | +## 4. Экспериментальная часть |
| 60 | + |
| 61 | +### 4.1. Условия эксперимента |
| 62 | +* **Платформа:** Docker-контейнер на локальной машине (4 физических ядра). |
| 63 | +* **Компилятор:** GCC 14.2.0. |
| 64 | +* **Данные:** Вектор размером **1,000,000** элементов (`int`), случайное заполнение. |
| 65 | + |
| 66 | +### 4.2. Результаты измерений |
| 67 | +Замеры времени выполнения (среднее по 5 запускам): |
| 68 | + |
| 69 | +| Число процессов (P) | Время выполнения (сек) | Ускорение ($S$) | Эффективность ($E$) | |
| 70 | +| :---: | :---: | :---: | :---: | |
| 71 | +| **SEQ (1)** | **0.082** | 1.00 | 100% | |
| 72 | +| **MPI (1)** | 0.085 | 0.96 | 96% | |
| 73 | +| **MPI (2)** | 0.051 | 1.60 | 80% | |
| 74 | +| **MPI (3)** | 0.046 | 1.78 | 59% | |
| 75 | +| **MPI (4)** | 0.048 | 1.70 | 42% | |
| 76 | +| **MPI (8)** | 0.065 | 1.26 | 15% | |
| 77 | + |
| 78 | +### 4.3. Анализ производительности |
| 79 | +1. **SEQ vs MPI(1):** Время практически идентично, небольшое замедление MPI(1) обусловлено инициализацией буферов и лишним копированием памяти при `Scatter/Gather` внутри одного процесса. |
| 80 | +2. **Масштабируемость:** |
| 81 | + * На 2 и 3 процессах наблюдается хорошее ускорение (до 1.78x). Параллельная сортировка частей перекрывает затраты на коммуникацию. |
| 82 | + * На 4 и более процессах рост производительности останавливается. Это связано с тем, что этап **Слияния (Merge)** выполняется последовательно на одном узле. Чем больше процессов, тем больше частей нужно слить, и сложность этого этапа начинает доминировать над выигрышем от сортировки. |
| 83 | + * Также влияет ограничение физических ядер (тесты запускались на 4 ядрах), что при $P > 4$ вызывает конкуренцию за процессорное время. |
| 84 | + |
| 85 | +## 5. Выводы |
| 86 | + |
| 87 | +В ходе работы была реализована параллельная версия алгоритма QuickSort. |
| 88 | + |
| 89 | +1. **Корректность:** Реализована собственная функция сортировки, которая успешно интегрирована как в SEQ, так и в MPI версии. Тесты подтверждают правильность работы на любых входных данных. |
| 90 | +2. **Эффективность:** Алгоритм показал прирост производительности на малом числе процессов. |
| 91 | +3. **Архитектура:** Использование схемы `Scatter -> Local Sort -> Gather -> Merge` является эффективным решением для распределенной памяти, однако фаза последовательного слияния является узким местом (bottleneck), ограничивающим бесконечное масштабирование. |
| 92 | + |
| 93 | +## 6. Список литературы |
| 94 | +1. MPI Forum. MPI: A Message-Passing Interface Standard. |
| 95 | +2. Кормен Т., Лейзерсон Ч., Ривест Р., Штайн К. Алгоритмы: построение и анализ. |
| 96 | +3. Документация C++ Reference (std::sort, std::inplace_merge). |
0 commit comments