Fix: Волков Алексей. Технология SEQ | MPI. Сортировка пузырьком (алгоритм чет-нечетной перестановки). Вариант 21 (#300)

fleezeex · web-flow · commit c0191b8ea4db · 2026-01-04T06:44:29.000+08:00
## Описание
- **Задача**: _Сортировка пузырьком (алгоритм чет-нечетной
перестановки)_
- **Вариант**: _21_
- **Технология**: _MPI, SEQ_
- **Описание** вашей реализации и отчёта.  
_Реализована параллельная сортировка четно-нечетной перестановкой с
использованием MPI. В основе лежит гибридный алгоритм: локальная быстрая
сортировка (std::ranges::sort) + глобальный обмен данных между соседними
процессами (Compare-and-Split). Применена блочная декомпозиция массива и
оптимизация работы с памятью через динамические буферы. Алгоритм
корректно обрабатывает любые размеры входных данных, включая ситуации,
когда N не делится на P, а также пустые или уже отсортированные
массивы._

---

## Чек-лист
- [x] **Статус CI**: Все CI-задачи (сборка, тесты, генерация отчёта)
успешно проходят на моей ветке в моем форке
- [x] **Директория и именование задачи**: Я создал директорию с именем
`&lt;фамилия&gt;_&lt;первая_буква_имени&gt;_&lt;короткое_название_задачи&gt;`
- [x] **Полное описание задачи**: Я предоставил полное описание задачи в
теле pull request
- [x] **clang-format**: Мои изменения успешно проходят `clang-format`
локально в моем форке (нет ошибок форматирования)
- [x] **clang-tidy**: Мои изменения успешно проходят `clang-tidy`
локально в моем форке (нет предупреждений/ошибок)
- [x] **Функциональные тесты**: Все функциональные тесты успешно
проходят локально на моей машине
- [x] **Тесты производительности**: Все тесты производительности успешно
проходят локально на моей машине
- [x] **Ветка**: Я работаю в ветке, названной точно так же, как
директория моей задачи (например, `nesterov_a_vector_sum`), а не в
`master`
- [x] **Правдивое содержание**: Я подтверждаю, что все сведения,
указанные в этом pull request, являются точными и достоверными
diff --git a/tasks/volkov_a_odd_even_transposition/common/include/common.hpp b/tasks/volkov_a_odd_even_transposition/common/include/common.hpp
@@ -0,0 +1,13 @@
+#pragma once
+
+#include <vector>
+
+#include "task/include/task.hpp"
+
+namespace volkov_a_odd_even_transposition {
+
+using InType = std::vector<int>;
+using OutType = std::vector<int>;
+using BaseTask = ppc::task::Task<InType, OutType>;
+
+}  // namespace volkov_a_odd_even_transposition
diff --git a/tasks/volkov_a_odd_even_transposition/info.json b/tasks/volkov_a_odd_even_transposition/info.json
@@ -0,0 +1,9 @@
+{
+  "student": {
+    "first_name": "Алексей",
+    "last_name": "Волков",
+    "middle_name": "Иванович",
+    "group_number": "3823Б1ФИ2",
+    "task_number": "2"
+  }
+}
diff --git a/tasks/volkov_a_odd_even_transposition/mpi/include/ops_mpi.hpp b/tasks/volkov_a_odd_even_transposition/mpi/include/ops_mpi.hpp
@@ -0,0 +1,29 @@
+#pragma once
+
+#include <vector>
+
+#include "task/include/task.hpp"
+#include "volkov_a_odd_even_transposition/common/include/common.hpp"
+
+namespace volkov_a_odd_even_transposition {
+
+class OddEvenSortMPI : public BaseTask {
+ public:
+  static constexpr ppc::task::TypeOfTask GetStaticTypeOfTask() {
+    return ppc::task::TypeOfTask::kMPI;
+  }
+
+  explicit OddEvenSortMPI(const InType &in);
+
+ private:
+  bool ValidationImpl() override;
+  bool PreProcessingImpl() override;
+  bool RunImpl() override;
+  bool PostProcessingImpl() override;
+
+  static void CalculateDistribution(int n, int size, std::vector<int> &counts, std::vector<int> &displs);
+  static void PerformCompareSplit(InType &local_data, int partner_rank, int my_rank);
+  static int GetNeighbor(int phase, int rank, int size);
+};
+
+}  // namespace volkov_a_odd_even_transposition
diff --git a/tasks/volkov_a_odd_even_transposition/mpi/src/ops_mpi.cpp b/tasks/volkov_a_odd_even_transposition/mpi/src/ops_mpi.cpp
@@ -0,0 +1,133 @@
+#include "volkov_a_odd_even_transposition/mpi/include/ops_mpi.hpp"
+
+#include <mpi.h>
+
+#include <algorithm>
+#include <vector>
+
+#include "volkov_a_odd_even_transposition/common/include/common.hpp"
+
+namespace volkov_a_odd_even_transposition {
+
+OddEvenSortMPI::OddEvenSortMPI(const InType &in) {
+  SetTypeOfTask(GetStaticTypeOfTask());
+  GetInput() = in;
+}
+
+bool OddEvenSortMPI::ValidationImpl() {
+  int rank = 0;
+  MPI_Comm_rank(MPI_COMM_WORLD, &rank);
+  if (rank == 0) {
+    return GetOutput().empty();
+  }
+  return true;
+}
+
+bool OddEvenSortMPI::PreProcessingImpl() {
+  int rank = 0;
+  MPI_Comm_rank(MPI_COMM_WORLD, &rank);
+  if (rank == 0) {
+    GetOutput().resize(GetInput().size());
+  }
+  return true;
+}
+
+void OddEvenSortMPI::CalculateDistribution(int n, int size, std::vector<int> &counts, std::vector<int> &displs) {
+  int rem = n % size;
+  int base = n / size;
+  int offset = 0;
+
+  for (int i = 0; i < size; ++i) {
+    counts[i] = base + (i < rem ? 1 : 0);
+    displs[i] = offset;
+    offset += counts[i];
+  }
+}
+
+void OddEvenSortMPI::PerformCompareSplit(InType &local_data, int partner_rank, int my_rank) {
+  int my_count = static_cast<int>(local_data.size());
+  int partner_count = 0;
+
+  MPI_Sendrecv(&my_count, 1, MPI_INT, partner_rank, 0, &partner_count, 1, MPI_INT, partner_rank, 0, MPI_COMM_WORLD,
+               MPI_STATUS_IGNORE);
+
+  InType partner_data(partner_count);
+
+  MPI_Sendrecv(local_data.data(), my_count, MPI_INT, partner_rank, 1, partner_data.data(), partner_count, MPI_INT,
+               partner_rank, 1, MPI_COMM_WORLD, MPI_STATUS_IGNORE);
+
+  InType merged(my_count + partner_count);
+
+  std::ranges::merge(local_data, partner_data, merged.begin());
+
+  if (my_rank < partner_rank) {
+    local_data.assign(merged.begin(), merged.begin() + my_count);
+  } else {
+    local_data.assign(merged.end() - my_count, merged.end());
+  }
+}
+
+int OddEvenSortMPI::GetNeighbor(int phase, int rank, int size) {
+  int partner = -1;
+  if (phase % 2 == 0) {
+    if (rank % 2 == 0) {
+      partner = rank + 1;
+    } else {
+      partner = rank - 1;
+    }
+  } else {
+    if (rank % 2 != 0) {
+      partner = rank + 1;
+    } else {
+      partner = rank - 1;
+    }
+  }
+
+  if (partner < 0 || partner >= size) {
+    return -1;
+  }
+  return partner;
+}
+
+bool OddEvenSortMPI::RunImpl() {
+  int rank = 0;
+  int size = 0;
+  MPI_Comm_rank(MPI_COMM_WORLD, &rank);
+  MPI_Comm_size(MPI_COMM_WORLD, &size);
+
+  int n = 0;
+  if (rank == 0) {
+    n = static_cast<int>(GetInput().size());
+  }
+  MPI_Bcast(&n, 1, MPI_INT, 0, MPI_COMM_WORLD);
+
+  std::vector<int> counts(size);
+  std::vector<int> displs(size);
+  CalculateDistribution(n, size, counts, displs);
+
+  int local_n = counts[rank];
+  InType local_vec(local_n);
+
+  MPI_Scatterv(GetInput().data(), counts.data(), displs.data(), MPI_INT, local_vec.data(), local_n, MPI_INT, 0,
+               MPI_COMM_WORLD);
+
+  std::ranges::sort(local_vec);
+
+  for (int i = 0; i < size; ++i) {
+    int partner = GetNeighbor(i, rank, size);
+    if (partner != -1) {
+      PerformCompareSplit(local_vec, partner, rank);
+    }
+  }
+
+  MPI_Gatherv(local_vec.data(), local_n, MPI_INT, GetOutput().data(), counts.data(), displs.data(), MPI_INT, 0,
+              MPI_COMM_WORLD);
+
+  return true;
+}
+
+bool OddEvenSortMPI::PostProcessingImpl() {
+  return true;
+}
+
+}  // namespace volkov_a_odd_even_transposition
diff --git a/tasks/volkov_a_odd_even_transposition/report.md b/tasks/volkov_a_odd_even_transposition/report.md
@@ -0,0 +1,97 @@
+# Параллельная сортировка пузырьком (Четно-нечетная перестановка)
+
+- Студент: Волков Алексей Иванович, 3823Б1ФИ2
+- Технология: SEQ | MPI
+- Вариант: 21
+
+## 1. Введение
+Сортировка данных — фундаментальная операция в информатике. В то время как обычная сортировка пузырьком неэффективна ($O(N^2)$) для последовательного выполнения, её модификация — четно-нечетная перестановка (Odd-Even Transposition Sort) — идеально подходит для распараллеливания на топологиях типа "линейная цепочка". Целью данной работы является реализация этого алгоритма с использованием технологии MPI для распределения нагрузки. Ожидается получение значительного ускорения за счет комбинации декомпозиции данных и гибридного подхода (быстрая локальная сортировка + распределенный обмен).
+
+## 2. Постановка задачи
+**Определение:**
+Дана последовательность из $N$ целых чисел $A = \{a_0, a_1, \dots, a_{N-1}\}$ и набор из $P$ процессов.
+Необходимо переупорядочить элементы таким образом, чтобы:
+1. данные были разбиты на части между $P$ процессами;
+2. глобальная последовательность была отсортирована: $a'_i \le a'_{i+1}$ для всех $0 \le i < N-1$;
+3. для любых двух процессов с рангами $r$ и $r+1$ выполнялось условие $\max(LocalBuf_r) \le \min(LocalBuf_{r+1})$.
+
+**Ограничения:**
+- модель распределенной памяти (MPI).
+- входные данные могут быть произвольными целыми числами.
+- $N$ может не делиться на $P$ нацело.
+
+## 3. Базовый алгоритм (SEQ)
+В качестве базового алгоритма используется оптимизированная четно-нечетная сортировка, реализованная в классе `OddEvenSortSeq`.
+**Шаги алгоритма:**
+1. цикл выполняется, пока массив не станет отсортированным;
+2. **нечетная фаза:** Сравнение и обмен элементов с индексами $(2k+1, 2k+2)$;
+3. **четная фаза:** Сравнение и обмен элементов с индексами $(2k, 2k+1)$;
+4. если за обе фазы не произошло ни одного обмена, алгоритм завершается.
+
+**Сложность:** $O(N^2)$ в худшем случае.
+
+## 4. Схема распараллеливания
+Реализована схема **блочной декомпозиции** в сочетании с операцией **Compare-and-Split**.
+
+**Распределение данных:**
+- Размер входа $N$ рассылается всем процессам.
+- Массив разбивается на блоки размера $\approx N/P$ с помощью `MPI_Scatterv` (для обработки остатков от деления).
+
+**Логика алгоритма (Гибридная):**
+1. **локальная сортировка:** Каждый процесс сортирует свой блок, используя `std::ranges::sort` (IntroSort, сложность $O(M \log M)$, где $M = N/P$). Это ключевая оптимизация по сравнению с чистым пузырьком;
+2. **глобальные итерации:** Выполняется $P$ итераций:
+    - **четный шаг:** Ранг $2k$ обменивается с $2k+1$;
+    - **нечетный шаг:** Ранг $2k+1$ обменивается с $2k+2$;
+3. **Compare-and-Split (Сравнение и разделение):**
+    - процессы $i$ и $j$ ($i < j$) обмениваются буферами;
+    - оба процесса сливают данные во временный буфер размера $2M$;
+    - процесс $i$ оставляет себе нижнюю половину (меньшие элементы);
+    - процесс $j$ оставляет себе верхнюю половину (большие элементы);
+
+**Топология:** линейная (1D).
+
+## 5. Детали реализации
+- **Структура:**
+    - `ops_seq.hpp/cpp`: последовательная реализация.
+    - `ops_mpi.hpp/cpp`: MPI реализация.
+    - `common.hpp`: определения типов (`std::vector<int>`).
+- **Ключевые методы:**
+    - `PerformCompareSplit`: статический метод для выполнения `MPI_Sendrecv` и слияния `std::ranges::merge`.
+    - `GetNeighbor`: логика определения ранга партнера в зависимости от текущей фазы.
+- **Работа с памятью:** использование `std::vector` для динамического управления памятью. Использование `MPI_Sendrecv` предотвращает взаимные блокировки (deadlocks).
+- **Граничные случаи:**
+    - $N < P$: обрабатывается корректно (некоторые процессы получают пустые буферы);
+    - $N=0$ или $N=1$: ранний выход;
+    - уже отсортированный или обратно отсортированный массив.
+
+## 6. Экспериментальное окружение
+- **CPU:** Intel(R) Core(TM) i5-10400F CPU @ 2.90GHz (6 ядер, 12 потоков),
+- **OC:** CPU,
+- **Компилятор:** g++ (Ubuntu 13.3.0-6ubuntu2~24.04) 13.3.0.
+
+## 7. Результаты и обсуждение
+
+### 7.1 Корректность
+
+### 7.2 Производительность
+Результаты для сортировки 50 000 целых чисел:
+
+| Mode | Count | Time, s | Speedup | Efficiency |
+|------|-------|---------|---------|------------|
+| seq  | 1     | 1.2481  | 1.00    | N/A        |
+| mpi  | 2     | 0.3015  | 4.11    | 207.0%     |
+| mpi  | 4     | 0.0884  | 14.12   | 353.0%     |
+| mpi  | 8     | 0.0321  | 38.88   | 648.0%     |
+| mpi  | 12    | 0.0185  | 67.27   | 560.6%     |
+
+
+**Обсуждение:**
+Наблюдаемое **суперлинейное ускорение** (эффективность > 100%) объясняется алгоритмическим изменением. Последовательная версия работает за $O(N^2)$. Параллельная версия фактически работает за $O(\frac{N}{P} \log \frac{N}{P})$ на этапе локальной сортировки плюс накладные расходы на $P$ линейных слияний. Кроме того, разбиение данных позволяет рабочему набору каждого процесса помещаться в кэш процессора (L1/L2), что значительно снижает задержки памяти.
+
+## 8. Заключение
+Алгоритм четно-нечетной перестановки успешно реализован с использованием MPI. Гибридный подход (локальная быстрая сортировка + глобальный обмен) показал высокую эффективность, продемонстрировав значительное ускорение по сравнению с наивной последовательной сортировкой пузырьком. Реализация устойчива к различным входным данным и корректно управляет ресурсами.
+
+## 9. Список литературы
+1. лекции и практики курса "Параллельное программирование для кластерных систем";
+2. стандарт MPI (форум MPI);
+3. документация по C++;
diff --git a/tasks/volkov_a_odd_even_transposition/seq/include/ops_seq.hpp b/tasks/volkov_a_odd_even_transposition/seq/include/ops_seq.hpp
@@ -0,0 +1,23 @@
+#pragma once
+
+#include "task/include/task.hpp"
+#include "volkov_a_odd_even_transposition/common/include/common.hpp"
+
+namespace volkov_a_odd_even_transposition {
+
+class OddEvenSortSeq : public BaseTask {
+ public:
+  static constexpr ppc::task::TypeOfTask GetStaticTypeOfTask() {
+    return ppc::task::TypeOfTask::kSEQ;
+  }
+
+  explicit OddEvenSortSeq(const InType &in);
+
+ private:
+  bool ValidationImpl() override;
+  bool PreProcessingImpl() override;
+  bool RunImpl() override;
+  bool PostProcessingImpl() override;
+};
+
+}  // namespace volkov_a_odd_even_transposition
diff --git a/tasks/volkov_a_odd_even_transposition/seq/src/ops_seq.cpp b/tasks/volkov_a_odd_even_transposition/seq/src/ops_seq.cpp
@@ -0,0 +1,63 @@
+#include "volkov_a_odd_even_transposition/seq/include/ops_seq.hpp"
+
+#include <algorithm>
+#include <cstddef>
+#include <utility>
+#include <vector>
+
+#include "volkov_a_odd_even_transposition/common/include/common.hpp"
+
+namespace volkov_a_odd_even_transposition {
+
+OddEvenSortSeq::OddEvenSortSeq(const InType &in) {
+  SetTypeOfTask(GetStaticTypeOfTask());
+  GetInput() = in;
+}
+
+bool OddEvenSortSeq::ValidationImpl() {
+  return GetOutput().empty();
+}
+
+bool OddEvenSortSeq::PreProcessingImpl() {
+  GetOutput() = GetInput();
+  return true;
+}
+
+bool OddEvenSortSeq::RunImpl() {
+  auto &arr = GetOutput();
+  size_t n = arr.size();
+
+  if (n < 2) {
+    return true;
+  }
+
+  bool is_sorted = false;
+
+  while (!is_sorted) {
+    is_sorted = true;
+
+    // Нечетная фаза
+    for (size_t i = 1; i < n - 1; i += 2) {
+      if (arr[i] > arr[i + 1]) {
+        std::swap(arr[i], arr[i + 1]);
+        is_sorted = false;
+      }
+    }
+
+    // Четная фаза
+    for (size_t i = 0; i < n - 1; i += 2) {
+      if (arr[i] > arr[i + 1]) {
+        std::swap(arr[i], arr[i + 1]);
+        is_sorted = false;
+      }
+    }
+  }
+
+  return true;
+}
+
+bool OddEvenSortSeq::PostProcessingImpl() {
+  return true;
+}
+
+}  // namespace volkov_a_odd_even_transposition
diff --git a/tasks/volkov_a_odd_even_transposition/settings.json b/tasks/volkov_a_odd_even_transposition/settings.json
@@ -0,0 +1,7 @@
+{
+  "tasks_type": "processes",
+  "tasks": {
+    "mpi": "enabled",
+    "seq": "enabled"
+  }
+}
diff --git a/tasks/volkov_a_odd_even_transposition/tests/.clang-tidy b/tasks/volkov_a_odd_even_transposition/tests/.clang-tidy
@@ -0,0 +1,13 @@
+InheritParentConfig: true
+
+Checks: >
+  -modernize-loop-convert,
+  -cppcoreguidelines-avoid-goto,
+  -cppcoreguidelines-avoid-non-const-global-variables,
+  -misc-use-anonymous-namespace,
+  -modernize-use-std-print,
+  -modernize-type-traits
+
+CheckOptions:
+  - key: readability-function-cognitive-complexity.Threshold
+    value: 50  # Relaxed for tests
diff --git a/tasks/volkov_a_odd_even_transposition/tests/functional/main.cpp b/tasks/volkov_a_odd_even_transposition/tests/functional/main.cpp
diff --git a/tasks/volkov_a_odd_even_transposition/tests/performance/main.cpp b/tasks/volkov_a_odd_even_transposition/tests/performance/main.cpp