learning-process
diff --git a/‎tasks/kutuzov_i_simpson_integration/common/include/common.hpp‎
Lines changed: 59 additions & 0 deletions b/‎tasks/kutuzov_i_simpson_integration/common/include/common.hpp‎
Lines changed: 59 additions & 0 deletions
diff --git a/‎tasks/kutuzov_i_simpson_integration/info.json‎
Lines changed: 9 additions & 0 deletions b/‎tasks/kutuzov_i_simpson_integration/info.json‎
Lines changed: 9 additions & 0 deletions
diff --git a/‎tasks/kutuzov_i_simpson_integration/mpi/include/ops_mpi.hpp‎
Lines changed: 24 additions & 0 deletions b/‎tasks/kutuzov_i_simpson_integration/mpi/include/ops_mpi.hpp‎
Lines changed: 24 additions & 0 deletions
diff --git a/‎tasks/kutuzov_i_simpson_integration/mpi/src/ops_mpi.cpp‎
Lines changed: 122 additions & 0 deletions b/‎tasks/kutuzov_i_simpson_integration/mpi/src/ops_mpi.cpp‎
Lines changed: 122 additions & 0 deletions
diff --git a/‎tasks/kutuzov_i_simpson_integration/report.md‎
Lines changed: 90 additions & 0 deletions b/‎tasks/kutuzov_i_simpson_integration/report.md‎
Lines changed: 90 additions & 0 deletions
diff --git a/‎tasks/kutuzov_i_simpson_integration/seq/include/ops_seq.hpp‎
Lines changed: 24 additions & 0 deletions b/‎tasks/kutuzov_i_simpson_integration/seq/include/ops_seq.hpp‎
Lines changed: 24 additions & 0 deletions
@@ -0,0 +1,59 @@
+#pragma once
+
+#include <cmath>
+#include <tuple>
+#include <utility>
+
+#include "task/include/task.hpp"
+
+namespace kutuzov_i_simpson_integration {
+
+// n, x_min-x_max, y_min-y_max, function_id
+using InType = std::tuple<int, std::pair<double, double>, std::pair<double, double>, int>;
+using OutType = double;
+// n, x_min-x_max, y_min-y_max, function_id
+using TestType = std::tuple<int, std::pair<double, double>, std::pair<double, double>, int>;
+using BaseTask = ppc::task::Task<InType, OutType>;
+
+inline double FunctionPolynomial(double x, double y) {
+  return pow(x, 3) + (0.5 * pow(x, 2)) + (3.0 * pow(y, 6)) + (15.0 * y) + 37.0;
+}
+
+inline double FunctionTrigonometric(double x, double y) {
+  return pow(sin(x), 5) + (1.3 * cos(0.7 * x) * sin(1.4 * y)) - atan((15.0 * x) + (7.0 * y));
+}
+
+inline double FunctionExponents(double x, double y) {
+  return (1.7 * exp(3.7 * x)) + (exp(3.0 * x * y) * log(pow(x + y, 2) + 1.0)) -
+         log(pow((17.0 * x) - (8.0 * y), 4) + 0.1);
+}
+
+inline double FunctionComplex(double x, double y) {
+  double sum = 0.0;
+  for (int i = 1; i <= 200; i++) {
+    double add = (sin((0.3 * pow(x * i, 4) * pow(y, 2)) + (0.5 * cos(y / i) * pow(x, 7)) + (1.8 * pow(y, 5))));
+    if (i % 2 == 0) {
+      sum += add;
+    } else {
+      sum -= add;
+    }
+  }
+  return sum;
+}
+
+inline double CallFunction(int function_id, double x, double y) {
+  switch (function_id) {
+    case 1:
+      return FunctionPolynomial(x, y);
+    case 2:
+      return FunctionTrigonometric(x, y);
+    case 3:
+      return FunctionExponents(x, y);
+    case 4:
+      return FunctionComplex(x, y);
+    default:
+      return 1.0;
+  }
+}
+
+}  // namespace kutuzov_i_simpson_integration
@@ -0,0 +1,9 @@
+{
+  "student": {
+    "first_name": "Иван",
+    "last_name": "Кутузов",
+    "middle_name": "Арсеньевич",
+    "group_number": "3823Б1ФИ3",
+    "task_number": "3"
+  }
+}
@@ -0,0 +1,24 @@
+#pragma once
+
+#include "kutuzov_i_simpson_integration/common/include/common.hpp"
+#include "task/include/task.hpp"
+
+namespace kutuzov_i_simpson_integration {
+
+class KutuzovISimpsonIntegrationMPI : public BaseTask {
+ public:
+  static constexpr ppc::task::TypeOfTask GetStaticTypeOfTask() {
+    return ppc::task::TypeOfTask::kMPI;
+  }
+  explicit KutuzovISimpsonIntegrationMPI(const InType &in);
+
+ private:
+  bool ValidationImpl() override;
+  bool PreProcessingImpl() override;
+  bool RunImpl() override;
+  bool PostProcessingImpl() override;
+
+  static double GetWeight(int i, int n);
+};
+
+}  // namespace kutuzov_i_simpson_integration
@@ -0,0 +1,122 @@
+#include "kutuzov_i_simpson_integration/mpi/include/ops_mpi.hpp"
+
+#include <mpi.h>
+
+#include <algorithm>
+#include <tuple>
+#include <vector>
+
+#include "kutuzov_i_simpson_integration/common/include/common.hpp"
+
+namespace kutuzov_i_simpson_integration {
+
+KutuzovISimpsonIntegrationMPI::KutuzovISimpsonIntegrationMPI(const InType &in) {
+  SetTypeOfTask(GetStaticTypeOfTask());
+  GetInput() = in;
+  GetOutput() = {};
+}
+
+bool KutuzovISimpsonIntegrationMPI::ValidationImpl() {
+  int n = std::get<0>(GetInput());
+  double x_min = std::get<0>(std::get<1>(GetInput()));
+  double x_max = std::get<1>(std::get<1>(GetInput()));
+  double y_min = std::get<0>(std::get<2>(GetInput()));
+  double y_max = std::get<1>(std::get<2>(GetInput()));
+  int function_id = std::get<3>(GetInput());
+
+  if (x_min >= x_max) {
+    return false;
+  }
+  if (y_min >= y_max) {
+    return false;
+  }
+  if (n <= 0 || n % 2 != 0) {
+    return false;
+  }
+  if (function_id <= 0 || function_id > 4) {
+    return false;
+  }
+  return true;
+}
+
+bool KutuzovISimpsonIntegrationMPI::PreProcessingImpl() {
+  GetOutput() = 0.0;
+  return true;
+}
+
+bool KutuzovISimpsonIntegrationMPI::RunImpl() {
+  int rank = 0;
+  int process_count = 0;
+  MPI_Comm_rank(MPI_COMM_WORLD, &rank);
+  MPI_Comm_size(MPI_COMM_WORLD, &process_count);
+
+  int n = 0;
+  double x_min = 0.0;
+  double x_max = 0.0;
+  double y_min = 0.0;
+  double y_max = 0.0;
+  int function_id = 0;
+
+  // To reduce the number of MPI_Bcast calls we can send similar data in bulk
+  std::vector<double> data_package(4, 0.0);
+  if (rank == 0) {
+    n = std::get<0>(GetInput());
+    x_min = std::get<1>(GetInput()).first;
+    x_max = std::get<1>(GetInput()).second;
+    y_min = std::get<2>(GetInput()).first;
+    y_max = std::get<2>(GetInput()).second;
+    function_id = std::get<3>(GetInput());
+
+    data_package = {x_min, x_max, y_min, y_max};
+  }
+  MPI_Bcast(&n, 1, MPI_INT, 0, MPI_COMM_WORLD);
+  MPI_Bcast(&function_id, 1, MPI_INT, 0, MPI_COMM_WORLD);
+  MPI_Bcast(data_package.data(), 4, MPI_DOUBLE, 0, MPI_COMM_WORLD);
+  x_min = data_package[0];
+  x_max = data_package[1];
+  y_min = data_package[2];
+  y_max = data_package[3];
+
+  int task_per_process = (n + 1) / process_count;
+  int tail = (n + 1) - (task_per_process * process_count);
+  int task_start = (task_per_process * rank) + std::min(rank, tail);
+  int task_end = task_start + task_per_process + (rank < tail ? 1 : 0);
+
+  double step_x = (x_max - x_min) / n;
+  double step_y = (y_max - y_min) / n;
+
+  double local_sum = 0.0;
+  for (int i = task_start; i < task_end; i++) {
+    double x = x_min + (step_x * i);
+
+    for (int j = 0; j <= n; j++) {
+      double y = y_min + (step_y * j);
+      double a = GetWeight(i, n) * GetWeight(j, n) * CallFunction(function_id, x, y);
+      local_sum += a;
+    }
+  }
+
+  double sum = 0.0;
+  MPI_Reduce(&local_sum, &sum, 1, MPI_DOUBLE, MPI_SUM, 0, MPI_COMM_WORLD);
+  sum *= step_x * step_y / 9;
+  MPI_Bcast(&sum, 1, MPI_DOUBLE, 0, MPI_COMM_WORLD);
+  GetOutput() = sum;
+
+  return true;
+}
+
+bool KutuzovISimpsonIntegrationMPI::PostProcessingImpl() {
+  return true;
+}
+
+double KutuzovISimpsonIntegrationMPI::GetWeight(int i, int n) {
+  if (i == 0 || i == n) {
+    return 1.0;
+  }
+  if (i % 2 == 1) {
+    return 4.0;
+  }
+  return 2.0;
+}
+
+}  // namespace kutuzov_i_simpson_integration
@@ -0,0 +1,90 @@
+# Вычисление многомерных интегралов с использованием многошаговой схемы (метод Симпсона).
+
+- Student: Кутузов Иван Арсеньевич, group 3823Б1ФИ3
+- Technology: SEQ | MPI 
+- Variant: 9
+
+## 1. Introduction
+
+Мотивация: Двумерные численные интегралы широко применяются в физических и инженерных задачах. Даже для двумерного случая при высокой точности вычисления могут быть вычислительно затратными, поэтому использование параллельных методов позволяет существенно сократить время расчёта.
+
+Проблема: Последовательные алгоритмы численного интегрирования для двумерных интегралов плохо масштабируются при увеличении числа разбиений сетки. Требуется эффективная параллельная реализация многошаговой схемы.
+
+Ожидаемый результат: Получение корректного и быстрого параллельного алгоритма вычисления двумерного интеграла с ускорением относительно последовательной версии.
+
+## 2. Problem Statement
+
+$$
+I = \int_{a}^{b} \int_{c}^{d} f(x, y) , dx , dy.
+$$
+
+Функция $f(x, y)$ считается непрерывной на области интегрирования. Для численного решения используется многошаговая схема с равномерной сеткой по осям $x$ и $y$.
+
+Входные данные:
+* $n$ - число ячеек сетки по одной оси (общая сетка $n \times n$ ячеек);
+* $x_{min} - x_{max}$ - начало и конец области интегрирования по оси $x$;
+* $y_{min} - y_{max}$ - начало и конец области интегрирования по оси $y$;
+* Функция $f(x)$;
+
+В качестве функции подаётся `function_id`, определяющий какую из 4-х заготовленных функций использовать.
+
+Результатом является приближённое значение определённого интеграла $I$.
+
+
+## 3. Baseline Algorithm (Sequential)
+SEQ реализация использует двойной цикл по координатам сетки. В каждой точке вычисляется значение функции, которое добавляется к общей сумме с учётом весов численной схемы. Итоговая сумма умножается на $\dfrac{\Delta x \cdot \Delta y}{9}$, где $\Delta x$ и $\Delta y$ - размеры ячейки сетки по соответствующим осям.
+
+## 4. Parallelization Scheme
+MPI реализация выполняется в 3 основных этапа:
+1. **Рассылка данных:** входные данные рассылаются с процесса с рангом 0 на остальные процессы при помощь `MPI_Bcast`.
+2. **Параллельное решение:** параллелизм применяется к внешнему циклу обхода сетки. Каждый процесс вычисляет начало и конец своего участка индексов по следующему принципу: каждому из $n$ процессов раздаются равные интервалы индексов. Остаток $r$, $r < n$ раздаётся первым $r$ процессам поровну (то есть по одному доп. индексу). Реализация выполнена так, что индексы, выданные на обработку одному процессу, идут подряд. Затем процессы выполняют свою часть вычислений аналогично последовательному алгоритму, суммируя результат в `local_sum` - локальную сумму.
+3. **Сбор результатов:** при помощи вызова `MPI_Reduce` значения из `local_sum` со всех процессов суммируются в переменной `sum` на процессе с рангом 0. Затем результат домножается на $\dfrac{\Delta x \cdot \Delta y}{9}$ и рассылается на остальные процессы для прохождения проверок корректности.
+
+## 5. Experimental Setup
+* Hardware/OS: 12th gen Intel(R) Core(TM) i5-12500H, 12 ядер, 32 GB RAM, Windows 11 x64, laptop;
+* Toolchain: compiler, version, build type (Release/RelWithDebInfo)
+    * Cmake 3.28.3
+    * Компилятор: g++ (Ubuntu 13.3.0-6ubuntu2~24.04) 13.3.0
+    * Использовался Docker-контейнер.
+    * Режим сборки: Release.
+
+## 6. Results and Discussion
+### 6.1 Correctness
+Корректность проверена при помощи модульного тестирования, реализованного с использованием библиотеки GoogleTest с значением $n$, на различных размерах области интегрирования и на различных функциях.
+
+### 6.2 Performance
+
+Измерение производительности происводилоось на задаче подсчёта интеграла функции
+```c++
+double f(double x, double y) {
+  double sum = 0.0;
+  for (int i = 1; i <= 200; i++) {
+    double add = (sin(0.3 * pow(x * i, 4) * pow(y, 2) + 0.5 * cos(y / i) * pow(x, 7) + 1.8 * pow(y, 5)));
+    if (i % 2 == 0) {
+      sum += add;
+    } else {
+      sum -= add;
+    }
+  }
+  return sum;
+}
+```
+на области интегрирования $x_{min} = y_{min} = -10, \ \ \ x_{max} = y_{max} = 10$, при $n = 5$.
+
+| Mode | Process count | Time, s | Speedup  | Efficiency |
+| -    | -             | -       | -        | -          |
+| seq  | 1             | 8.948   | 1.000    | N/A        |
+| mpi  | 2             | 4.521   | 1.979    | 98.9%      |
+| mpi  | 3             | 3.099   | 2.887    | 96.2%      |
+| mpi  | 4             | 2.355   | 3.799    | 94.9%      |
+| mpi  | 5             | 2.213   | 4.043    | 80.8%      |
+| mpi  | 6             | 1.949   | 4.591    | 76.5%      |
+
+С ростом числа процессов от одного до четырёх наблюдается ускорение близкое к идеальному. При большем увеличении числа процессов накладные расходы на рассылку и сбор данных перевешивают, и эффективность параллелизма снижается.
+
+
+## 7. Conclusions
+В работе рассмотрено вычисление двумерного интеграла с использованием многошаговой численной схемы. Параллельный алгоритм позволяет значительно сократить время вычислений при сохранении корректности результатов.
+
+## 8. References
+* "Параллельное программирование для кластерных систем" ННГУ им. Лобачевского, ИИТММ.
@@ -0,0 +1,24 @@
+#pragma once
+
+#include "kutuzov_i_simpson_integration/common/include/common.hpp"
+#include "task/include/task.hpp"
+
+namespace kutuzov_i_simpson_integration {
+
+class KutuzovISimpsonIntegrationSEQ : public BaseTask {
+ public:
+  static constexpr ppc::task::TypeOfTask GetStaticTypeOfTask() {
+    return ppc::task::TypeOfTask::kSEQ;
+  }
+  explicit KutuzovISimpsonIntegrationSEQ(const InType &in);
+
+ private:
+  bool ValidationImpl() override;
+  bool PreProcessingImpl() override;
+  bool RunImpl() override;
+  bool PostProcessingImpl() override;
+
+  static double GetWeight(int i, int n);
+};
+
+}  // namespace kutuzov_i_simpson_integration