Гасенин Леонид. Технология SEQ-MPI. Проверка лексикографической упорядоченности двух строк. Вариант 26. by Leontin16 · Pull Request #47 · learning-process/ppc-2025-processes-informatics

Leontin16 · 2025-11-17T18:42:30Z

Описание

Задача: Проверка лексикографической упорядоченности двух строк.
Вариант: 26.
Технология: SEQ-MPI
Описание:
Реализовано лексикографическое сравнение двух строк в последовательном (SEQ) и параллельном (MPI) форматах.

Последовательная версия (SEQ) (ops_seq.cpp) является эталонной: она выполняет посимвольное сравнение, прерываясь при первом различии, и использует сравнение длин для обработки случаев, когда одна строка является префиксом другой.

Параллельная версия (MPI) (ops_mpi.cpp) использует декомпозицию данных:

Общий диапазон сравнения (максимальная длина строк) делится на блоки по числу MPI-процессов
Каждый процесс ищет первое различие только в своем блоке, возвращая его позицию (local_diff_pos) и результат (local_result)
Для определения глобально первой позиции различия и сбора результата используется двухэтапный паттерн редукции (MPI_Allreduce): сначала с операцией MPI_MIN для нахождения минимальной позиции, затем с операцией MPI_SUM для сбора результата от "победившего" процесса
Корректно обрабатываются граничные случаи: пустые строки, строки разной длины, и строки с различием в середине или конце

Проведено сравнение производительности, которое, как указано в отчете, дает ускорение до 3 раз для больших входных данных. Алгоритм корректно обрабатывает все входные данные и полностью совпадает с последовательной реализацией.

Чек-лист

Статус CI: Все CI-задачи (сборка, тесты, генерация отчёта) успешно проходят на моей ветке в моем форке
Директория и именование задачи: Я создал директорию с именем <фамилия>_<первая_буква_имени>_<короткое_название_задачи>
Полное описание задачи: Я предоставил полное описание задачи в теле pull request
clang-format: Мои изменения успешно проходят clang-format локально в моем форке (нет ошибок форматирования)
clang-tidy: Мои изменения успешно проходят clang-tidy локально в моем форке (нет предупреждений/ошибок)
Функциональные тесты: Все функциональные тесты успешно проходят локально на моей машине
Тесты производительности: Все тесты производительности успешно проходят локально на моей машине
Ветка: Я работаю в ветке, названной точно так же, как директория моей задачи (например, nesterov_a_vector_sum), а не в master
Правдивое содержание: Я подтверждаю, что все сведения, указанные в этом pull request, являются точными и достоверными

codecov-commenter · 2025-11-17T19:08:48Z

Codecov Report

✅ All modified and coverable lines are covered by tests.
✅ Project coverage is 94.85%. Comparing base (92b24d3) to head (7fff3c2).
⚠️ Report is 1 commits behind head on master.

Additional details and impacted files

@@            Coverage Diff             @@
##           master      #47      +/-   ##
==========================================
+ Coverage   94.03%   94.85%   +0.82%     
==========================================
  Files          15       17       +2     
  Lines         486      564      +78     
  Branches      181      218      +37     
==========================================
+ Hits          457      535      +78     
  Partials       29       29

☔ View full report in Codecov by Sentry.
📢 Have feedback on the report? Share it here.

🚀 New features to boost your workflow:

❄️ Test Analytics: Detect flaky tests, report on failures, and find test suite problems.

Leontin16 · 2025-11-18T09:02:04Z

gonna get some rest rn

allnes · 2025-11-24T00:43:30Z

+  GetInput() = in;
+  GetOutput() = 0;
+}
+


ValidationImpl ограничивает длину строк 10 000 000, тогда как performance-тест генерирует по 100 000 000 символов. Валидация вернет false и задача не запустится, перф-тест заведомо упадет. Нужно либо поднять лимит в валидации до используемых размеров, либо уменьшить входы в тесте/описании, чтобы ограничения и тестовые данные совпадали.

Leontin16 · 2025-11-24T06:37:41Z

roger that, i'll fix it as soon as possible

Leontin16 · 2025-11-24T12:00:29Z

done

Leontin16 · 2025-11-24T17:12:20Z

well now everythin is definitely ready

aobolensk · 2025-11-24T18:14:31Z

+  return true;
+}
+
+bool GaseninLLexDifMPI::RunImpl() {


The string is not being sent from rank 0 to other ranks

so ive checked the code and believe the current implementation in GaseninLLexDifMPI::RunImpl() correctly handles passed strings, including empty strings.
first of all, all processes get the actual string lengths (lengths[0] and lengths[1]) via MPI_Bcast of the lengths array.
after that all processes except rank 0 call str.resize(length). if the resulting length is zero, the local string is immediately set to empty and correctly initialized.
after all of that the basic MPI_Bcast for data strings (str.data()) only proceeds if the length is > 0. If the length is 0, no data transfer is necessary and the string is already synchronized (empty) due to a previous call to resize(0).
thus for an empty string (length = 0), no data transfer is required, since its state (being empty) is already synchronized.
if im wrong, please explain my mistake in more detail because I have no idea what's wrong there.

Sure, but are you sure that the whole string is required on each process?

ok. gonna fix that.

aobolensk · 2025-11-24T18:14:42Z

+      lengths[1] = long_str2.length();
+    }
+
+    MPI_Bcast(lengths.data(), 2, MPI_UINT64_T, 0, MPI_COMM_WORLD);  // NOLINT


Please, remove NOLINT

…доченности двух строк. Вариант 26. (learning-process#47) ## Описание - **Задача**: Проверка лексикографической упорядоченности двух строк. - **Вариант**: 26. - **Технология**: SEQ-MPI - **Описание**: Реализовано лексикографическое сравнение двух строк в последовательном (SEQ) и параллельном (MPI) форматах. **Последовательная версия (SEQ)** (`ops_seq.cpp`) является эталонной: она выполняет посимвольное сравнение, прерываясь при первом различии, и использует сравнение длин для обработки случаев, когда одна строка является префиксом другой. **Параллельная версия (MPI)** (`ops_mpi.cpp`) использует **декомпозицию данных**: * Общий диапазон сравнения (максимальная длина строк) делится на блоки по числу MPI-процессов * Каждый процесс ищет **первое различие** только в своем блоке, возвращая его позицию (`local_diff_pos`) и результат (`local_result`) * Для определения **глобально первой** позиции различия и сбора результата используется двухэтапный паттерн **редукции** (`MPI_Allreduce`): сначала с операцией `MPI_MIN` для нахождения минимальной позиции, затем с операцией `MPI_SUM` для сбора результата от "победившего" процесса * Корректно обрабатываются граничные случаи: пустые строки, строки разной длины, и строки с различием в середине или конце **Проведено сравнение производительности, которое, как указано в отчете, дает **ускорение до 3 раз** для больших входных данных. Алгоритм корректно обрабатывает все входные данные и полностью совпадает с последовательной реализацией.** ## Чек-лист  - [x] **Статус CI**: Все CI-задачи (сборка, тесты, генерация отчёта) успешно проходят на моей ветке в моем форке - [x] **Директория и именование задачи**: Я создал директорию с именем `<фамилия>_<первая_буква_имени>_<короткое_название_задачи>` - [x] **Полное описание задачи**: Я предоставил полное описание задачи в теле pull request - [x] **clang-format**: Мои изменения успешно проходят `clang-format` локально в моем форке (нет ошибок форматирования) - [x] **clang-tidy**: Мои изменения успешно проходят `clang-tidy` локально в моем форке (нет предупреждений/ошибок) - [x] **Функциональные тесты**: Все функциональные тесты успешно проходят локально на моей машине - [x] **Тесты производительности**: Все тесты производительности успешно проходят локально на моей машине - [x] **Ветка**: Я работаю в ветке, названной точно так же, как директория моей задачи (например, `nesterov_a_vector_sum`), а не в `master` - [x] **Правдивое содержание**: Я подтверждаю, что все сведения, указанные в этом pull request, являются точными и достоверными

Leontin16 added 2 commits November 17, 2025 19:59

frst att

9487985

scnd att

2506f5a

Leontin16 requested review from allnes and aobolensk as code owners November 17, 2025 18:42

github-actions Bot added the task label Nov 17, 2025

Leontin16 added 4 commits November 17, 2025 22:28

fix seq n performance

2de5e9c

superfix seq n performance

02e91ea

fix performance only

c159116

fix nolint

e3ba7d1

allnes reviewed Nov 24, 2025

View reviewed changes

Comment thread tasks/gasenin_l_lex_dif/mpi/src/ops_mpi.cpp Outdated

allnes reviewed Nov 24, 2025

View reviewed changes

Comment thread tasks/gasenin_l_lex_dif/seq/src/ops_seq.cpp

allnes reviewed Nov 24, 2025

View reviewed changes

Comment thread tasks/gasenin_l_lex_dif/seq/include/ops_seq.hpp Outdated

Leontin16 added 5 commits November 24, 2025 11:05

general fix

0ec7b39

nah bro

76f3e27

hype mpi fix

44668b5

uint64 mpi fix

9a62b97

hype uint64 mpi fix

df5aa93

Leontin16 added 2 commits November 24, 2025 16:35

report update

6fda44c

wut

ca2bcd8

aobolensk reviewed Nov 24, 2025

View reviewed changes

Leontin16 added 4 commits November 24, 2025 21:59

rmv nolint

8cc8e7b

clang-tidy fix

c6d7044

matutinal clang-tidy fix

d3fadc2

another clang-tidy fix

cbf7bfc

Leontin16 added 3 commits November 25, 2025 11:44

u cant be serious man

44526fa

it should work tho

4a21777

fix report

2e425a3

Leontin16 requested review from allnes and aobolensk December 2, 2025 08:06

Leontin16 added 4 commits December 5, 2025 09:13

im tired boss

4eae095

mpi fix

8cfbaca

another annoying mpi(clang-tidy) fix

a4aeff1

edited the report and removed useless comments

7fff3c2

aobolensk approved these changes Dec 10, 2025

View reviewed changes

allnes approved these changes Dec 10, 2025

View reviewed changes

allnes added Approved (Arseniy) Approved (Alexander) labels Dec 10, 2025

allnes merged commit 269892d into learning-process:master Dec 10, 2025
41 checks passed

Conversation

Leontin16 commented Nov 17, 2025 • edited Loading Uh oh! There was an error while loading. Please reload this page.

Uh oh!

Описание

Чек-лист

Uh oh!

codecov-commenter commented Nov 17, 2025 • edited Loading Uh oh! There was an error while loading. Please reload this page.

Uh oh!

Codecov Report

Uh oh!

Leontin16 commented Nov 18, 2025

Uh oh!

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Uh oh!

Uh oh!

Leontin16 commented Nov 24, 2025

Uh oh!

Leontin16 commented Nov 24, 2025 • edited Loading Uh oh! There was an error while loading. Please reload this page.

Uh oh!

Uh oh!

Leontin16 commented Nov 24, 2025

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

4 participants

Leontin16 commented Nov 17, 2025 •

edited

Loading

codecov-commenter commented Nov 17, 2025 •

edited

Loading

Leontin16 commented Nov 24, 2025 •

edited

Loading