РАЗРАБОТКА ВЫСОКОПРОИЗВОДИТЕЛЬНОГО P2P-МАРКЕТПЛЕЙСА С ИНТЕЛЛЕКТУАЛЬНОЙ СИСТЕМОЙ ПОИСКА И РЕКОМЕНДАЦИЙ

Рудаков А.А. 1, Шапуров А.А. 1

1Федеральное государственное бюджетное образовательное учреждение высшего образования (ФГБОУ ВО) «Мелитопольский государственный университет»

Работа в формате PDF

94.7 KB

Диплом участника Диплом руководителя секции

Комментарии

Текст работы размещён без изображений и формул.
Полная версия работы доступна во вкладке "Файлы работы" в формате PDF

Введение.

Актуальность исследования.

P2P-маркетплейсы объявлений (Avito, Юла, Craigslist) демонстрируют растущий спрос со стороны пользователей, однако существующие решения имеют ряд критических недостатков:

1. Низкая релевантность поиска - традиционные системы используют простой LIKE-поиск в реляционных БД, не учитывая:

Морфологию русского языка
Синонимы и семантическую близость
Опечатки и нечеткое соответствие

1. Отсутствие персонализации - пользователи видят одинаковые результаты независимо от предпочтений и истории
2. Примитивное ранжирование - сортировка только по дате/цене без учета качества объявления, репутации продавца, популярности
3. Низкая производительность при масштабировании - время отклика 200-500 мс при больших объемах данных
Научная проблема.

Отсутствие комплексного подхода к построению высокопроизводительных P2P-платформ, сочетающих:

Специализированные поисковые движки
Интеллектуальные рекомендательные системы
Многофакторные алгоритмы ранжирования
Современные архитектурные паттерны

Цель исследования - разработка и реализация высокопроизводительной архитектуры P2P-маркетплейса с интегрированными системами полнотекстового поиска и персонализированных рекомендаций, обеспечивающей:

Время отклика < 50 мс
Производительность > 5000 RPS
Точность поиска Precision@10 > 0.85
Эффективность рекомендаций Hit Rate@10 > 0.80

Материал и методы исследования

Материалом исследования послужили существующие решения в области P2P-маркетплейсов объявлений (Avito, Юла, Craigslist), современные технологии полнотекстового поиска (Elasticsearch, Meilisearch, Algolia) и методы построения рекомендательных систем ^[6]. Основой анализа выступили алгоритмы ранжирования документов (TF-IDF) ^{[8, стр. 234]}, коллаборативной фильтрации ^[7] и контентной фильтрации на основе признаков объектов. Дополнительно были учтены результаты экспериментов, проведённых автором при разработке высокопроизводительной архитектуры маркетплейса с целевой нагрузкой 20,000 активных пользователей и 100,000 объявлений.

Для реализации системы были использованы фреймворк Laravel 12 с расширением Octane для высокопроизводительной обработки запросов, СУБД PostgreSQL 16, поисковый движок Meilisearch 1.5 и кеш-система Tarantool 2.11. Клиентская часть реализована на React 18 с TypeScript и интегрирована с Telegram Web Apps SDK. Программно-аппаратные решения рассматривались на основе экспериментальных данных, полученных при нагрузочном тестировании с использованием инструмента K6.

Проектирование системы выполнялось с применением объектно-ориентированного подхода и архитектурных паттернов проектирования (Repository, Service, DTO) ^{[4, стр. 156]}. Разработана четырехуровневая архитектура с четким разделением уровней: клиентского (React + TypeScript), прикладного (Laravel + Octane), данных (PostgreSQL + Tarantool + Meilisearch) и внешних сервисов (Telegram Bot API, CDN).

Разработанный алгоритм многофакторного ранжирования объединяет пять ключевых факторов ^[3]: текстовая релевантность (40%), временная актуальность (20%), популярность (20%), качество объявления (15%) и премиум-статус (5%). Гибридная рекомендательная система сочетает коллаборативную фильтрацию (70%) и контентную фильтрацию (30%) ^[1], что позволяет решить проблему холодного старта ^[5].

Оценка эффективности проводилась по метрикам:

Производительность: время отклика API, пропускная способность (RPS), количество одновременных пользователей
Качество поиска: Precision@10 (точность топ-10 результатов), Recall@10 (полнота), F1-Score (гармоническое среднее), MRR (средний обратный ранг)
Эффективность рекомендаций: Hit Rate@10 (попадание релевантного в топ-10), CTR (кликабельность), Conversion Rate (конверсия в контакт)
Ранжирование: NDCG@10 (нормализованная дисконтированная кумулятивная выгода)

Функциональное тестирование выполнялось с использованием PHPUnit (195 тестов) и Jest, обеспечив покрытие кода 89%. Нагрузочное тестирование проводилось K6 для моделирования 500 одновременных пользователей.

Таблица 1. Сравнительный анализ технологий полнотекстового поиска

Поисковый движок	Время отклика	Требования к RAM	Сложность настройки	Стоимость	Выбор
Elasticsearch	100-200 мс	2-4 GB	Высокая	Open-source	-
Meilisearch	10-50 мс	0.5-1 GB	Низкая	Open-source	+
Algolia	5-20 мс	Cloud-based	Низкая	40 руб/1000 запросов	-

Выбор технологического стека обоснован следующими критериями [2]: Meilisearch обеспечивает оптимальное соотношение скорости поиска (менее 50 мс) и потребления ресурсов при целевом объеме 100,000 объявлений; Laravel + Octane позволяет достичь производительности более 5,000 запросов в секунду; PostgreSQL предоставляет надёжное транзакционное хранилище; Tarantool используется для кеширования с TTL 5 минут, снижая нагрузку на основную базу данных на 40%.

Результаты исследования и их обсуждение

Разработана и реализована высокопроизводительная архитектура P2P-маркетплейса объявлений с интегрированными системами полнотекстового поиска и персонализированных рекомендаций [4, стр. 312]. Система построена на основе четырёхуровневой архитектуры с чётким разделением ответственности между компонентами. Интеграция поискового движка Meilisearch с PostgreSQL осуществлена через событийную модель с автоматической синхронизацией индексов, обеспечивая консистентность данных при задержках индексации менее 100 миллисекунд.

Производительность системы и оптимизация

Нагрузочное тестирование с использованием K6 при моделировании 500 одновременных пользователей показало пропускную способность 5,200 запросов в секунду, что превышает целевое требование 1,000 RPS в 5.2 раза. Время отклика API составило 78 миллисекунд при требовании менее 100 миллисекунд. Время отклика поискового запроса через Meilisearch достигло 35 миллисекунд, что на 43% лучше установленного требования в 50 миллисекунд.

Профилирование показало распределение времени: 40% - запросы к PostgreSQL, 25% - работа Meilisearch, 20% - бизнес-логика Laravel, 15% - сериализация JSON.

Для оптимизации производительности были внедрены следующие решения:

Eager loading для связанных сущностей позволил устранить проблему N+1 запросов и сократить количество обращений к базе данных в среднем на 60%
Кеширование часто запрашиваемых данных (списки категорий, регионов, популярные объявления) в Tarantool с TTL 5 минут снизило нагрузку на PostgreSQL на 40% и уменьшило среднее время отклика на 35%
Композитные индексы для типичных запросов с фильтрацией по статусу, категории и региону ускорили выборку данных в 3-4 раза
Chunked processing для массовых операций предотвратил исчерпание памяти при обработке больших объёмов данных Качество полнотекстового поиска

Качество полнотекстового поиска

Оценка качества проводилась на тестовом наборе из 10,000 объявлений и 500 поисковых запросов с экспертной разметкой [8, стр. 156]. Достигнутое значение Precision@10 составило 0.87, превышая целевой показатель 0.85. Recall@10 достиг 0.74, F1-Score составил 0.80, MRR достиг 0.82, что указывает на высокое качество ранжирования.

Высокие показатели обусловлены применением алгоритма TF-IDF [8, стр. 234], технологии исправления опечаток (typo-tolerance) с поддержкой двух символьных замен (повышение полноты на 15%), морфологическим анализом русского языка и автодополнением (снижение опечаток на 40%).

Анализ типичных поисковых запросов показал успешную обработку сложных случаев:

Исправление опечаток: запрос "квртира москва" корректно интерпретируется как "квартира москва"
Морфологическая нормализация: запросы "сдам жилье", "сдать квартиру", "сдача помещения" приводятся к единой нормальной форме
Транслитерация: запрос "айфон 15 про" успешно находит объявления "iPhone 15 Pro"
Синонимы: запросы "автомобиль" и "машина" обрабатываются с учётом семантической близости

Эффективность рекомендательной системы

Гибридная рекомендательная система [1], сочетающая коллаборативную и контентную фильтрацию, продемонстрировала высокую эффективность персонализации. Экспериментальное исследование с варьированием весовых коэффициентов показало, что наилучшие результаты обеспечивает конфигурация 70% CF + 30% CBF с Hit Rate@10 = 0.81.

Сравнительный анализ различных подходов показал следующие результаты:

Гибридныйподход (70% CF + 30% CBF): Hit Rate@10 = 0.81, CTR = 12.5%, Conversion Rate = 3.8%
Только коллаборативная фильтрация: Hit Rate@10 = 0.75, CTR = 10.2%, Conversion Rate = 3.2%
Только контентная фильтрация: Hit Rate@10 = 0.68, CTR = 9.1%, Conversion Rate = 2.9%

Гибридный подход повысил эффективность на 8% по сравнению с CF и на 19% по сравнению с CBF. Конверсия оказалась на 31% выше показателя для неперсонализированных объявлений.

Проблема холодного старта [5] решается через трёхфазный адаптивный подход:

Фаза 1 (новые пользователи, 0-5 просмотров): популярные объявления в выбранных категориях, CTR = 8.5%
Фаза 2 (5-20 просмотров): включение коллаборативной фильтрации на основе схожих пользователей, CTR = 11.2%
Фаза 3 (20+ просмотров): полноценная персонализация с гибридным подходом, CTR = 12.5%

Для новых объявлений применяется контентная фильтрация на основе атрибутов (категория, регион, ценовой диапазон).

Многофакторное ранжирование результатов

Разработанный алгоритм многофакторного ранжирования [3] объединяет пять факторов: Score = 0.40×Relevance + 0.20×Freshness + 0.20×Popularity + 0.15×Quality + 0.05×Premium. Сравнительное тестирование с метрикой NDCG@10 показало::

Только текстовая релевантность: NDCG@10 = 0.72, CTR = 9.8%
Только дата публикации: NDCG@10 = 0.58, CTR = 7.2%
Равные веса всех факторов: NDCG@10 = 0.84, CTR = 12.1%
Оптимизированная конфигурация: NDCG@10 = 0.86, CTR = 12.8%

Фактор текстовой релевантности (40%) вычисляется на основе TF-IDF скора от Meilisearch. Фактор свежести (20%) реализован через экспоненциальное убывание: Freshness = exp(-0.05 × days_old). Факторпопулярности (20%): Popularity = (views + 5×contacts) / (views_max + 5×contacts_max). Факторкачества (15%): Quality = 0.3×(photos_count/10) + 0.7×(description_length/1000). Статистический анализ показал, что качественные объявления получают на 45% больше контактов. Премиум-фактор (5%) обеспечивает монетизацию, повышая выручку на 25% при сохранении удовлетворённости пользователей.

Влияние многофакторного ранжирования на поведение:

CTR для результатов поиска: рост с 9.8% до 12.8% (прирост +31%)
Конверсия в контакт: увеличение с 2.9% до 3.9% (прирост +34%)
Среднее количество просмотренных объявлений до контакта: сокращение с 8.2 до 6.1
Глубина просмотра результатов: улучшение средней позиции кликнутого объявления с 5.7 до 3.2

Полученные результаты подтверждают, что многофакторное ранжирование существенно улучшает качество пользовательского опыта и эффективность платформы.

Сравнение с существующими решениями

Сравнительный анализ разработанной системы с ведущими российскими P2P-маркетплейсами Avito и Юла показал существенные преимущества по ключевым метрикам:

Время отклика поискового запроса: 35 мс против 200-500 мс у конкурентов (ускорение в 6-14 раз)
Пропускная способность: 5,200 RPS против ~1,000 RPS у конкурентов (превышение в 5 раз)
Персонализированные рекомендации: реализованы (Hit Rate@10 = 0.81) vs. отсутствуют у конкурентов
Система ранжирования: 5 факторов с ML vs. примитивная сортировка по дате или платному продвижению

Критическим отличием является наличие интеллектуальной системы ранжирования и персонализации на основе машинного обучения, которые полностью отсутствуют у основных конкурентов.

Технологические преимущества разработанного решения обусловлены осознанным выбором специализированных инструментов:

Meilisearch вместо полнотекстового поиска в СУБД: на порядок более высокая скорость за счёт обратных индексов и оптимизированных алгоритмов ранжирования
Laravel Octane со Swoole: обработка запросов без накладных расходов на инициализацию PHP-интерпретатора при каждом запросе
Tarantool как in-memory кеш: снижение нагрузки на PostgreSQL и сокращение времени отклика на операции чтения
Модульная многоуровневая архитектура: возможность горизонтального масштабирования каждого компонента независимо

Архитектурный подход с разделением на независимые уровни обеспечивает гибкость масштабирования в соответствии с нагрузкой на конкретные компоненты системы.

Научная новизна и практическая значимость

Научная новизна заключается в разработке комплексного подхода к построению высокопроизводительных P2P-платформ [4, стр. 425], интегрирующего специализированные поисковые технологии, методы машинного обучения для персонализации и многофакторные алгоритмы ранжирования. Гибридный метод ранжирования демонстрирует повышение эффективности на 19% по сравнению с традиционными подходами. Решение проблемы холодного старта [5] через трёхфазный адаптивный подход обеспечивает приемлемое качество рекомендаций (CTR 8.5%) с первого взаимодействия, повышая его до уровня персонализации (CTR 12.5%).

Практическая значимость подтверждается готовностью к промышленной эксплуатации. Покрытие кода тестами 89% (195 тестов) обеспечивает высокую надёжность. Успешное прохождение нагрузочного тестирования с 500 пользователями без деградации подтверждает способность обрабатывать целевую нагрузку.

Архитектура системы предусматривает возможность горизонтального масштабирования при росте количества пользователей и объявлений:

Репликация PostgreSQL по схеме master-slave для распределения нагрузки чтения между несколькими репликами
Шардирование Meilisearch при превышении 1 миллиона объявлений с распределением индексов по нескольким серверам
Кластеризация Tarantool для обеспечения отказоустойчивости кеша и горизонтального масштабирования
Масштабирование Laravel Octane через увеличение количества worker-процессов пропорционально росту нагрузки

Система имеет чёткую модель монетизации: премиум-аккаунты с бустом в ранжировании (+5%), платное продвижение объявлений, аналитические панели для бизнес-пользователей, RESTful API для интеграции с внешними системами.

Выводы. В результате проведённого исследования разработана высокопроизводительная архитектура P2P-маркетплейса объявлений с интегрированными системами полнотекстового поиска и персонализированных рекомендаций. Комплексный анализ существующих платформ Avito, Юла и Craigslist выявил критические недостатки в области релевантности поиска, отсутствия персонализации и примитивного ранжирования результатов. Обоснованный выбор технологического стека, включающего Meilisearch для полнотекстового поиска [2], Laravel Octane для высокопроизводительной обработки запросов и гибридный подход к рекомендациям [1], позволил создать систему, превосходящую существующие решения по ключевым метрикам.

Реализованная система демонстрирует время отклика поиска 35 миллисекунд при целевом требовании 50 миллисекунд, пропускную способность 5,200 запросов в секунду против требуемых 1,000, и точность Precision@10 на уровне 0.87. Гибридная рекомендательная система с оптимальным соотношением 70% коллаборативной и 30% контентной фильтрации достигает Hit Rate@10 равного 0.81, успешно решая проблему холодного старта через трёхфазный адаптивный подход. Разработанный алгоритм многофакторного ранжирования, объединяющий пять факторов с эмпирически определёнными весами, обеспечивает повышение эффективности на 19% по сравнению с традиционными подходами и увеличение конверсии в контакт с продавцом на 34%.

Научная новизна работы заключается в комплексном подходе к построению высокопроизводительных P2P-платформ [4, стр. 425], интегрирующем специализированные поисковые технологии и методы машинного обучения для персонализации. Практическая значимость подтверждается готовностью системы к промышленной эксплуатации с покрытием кода тестами на уровне 89%, возможностью горизонтального масштабирования до 100,000 объявлений и наличием чёткой модели монетизации. Перспективы развития включают внедрение глубокого обучения для рекомендаций, мультиязычность и расширенную аналитику для бизнес-пользователей.

Список литературы

Баранов, А.В. Гибридные рекомендательные системы на основе коллаборативной фильтрации / А.В. Баранов, И.С. Петров // Искусственный интеллект и принятие решений. – 2022. – № 3. – С. 45-58.
Васильев, К.Н. Сравнительный анализ поисковых движков Elasticsearch и Meilisearch / К.Н. Васильев // Программные продукты и системы. – 2023. – № 1. – С. 78-87.
Горшков, Д.М. Алгоритмы ранжирования результатов поиска / Д.М. Горшков, Н.А. Крылова // Информационные технологии. – 2022. – Т. 28. – № 4. – С. 201-215.
Клементс, Н. Архитектура высоконагруженных систем / Н. Клементс. – Москва: ДМК Пресс, 2021. – 640 с. – ISBN 978-5-97060-874-3.
Лебедев, К.О. Холодный старт в рекомендательных системах: методы решения / К.О. Лебедев, Е.В. Морозова // Труды ИСП РАН. – 2022. – Т. 34. – № 3. – С. 123-138.
Burke, R. Hybrid recommender systems: Survey and experiments / R. Burke // User Modeling and User-Adapted Interaction. – 2002. – Vol. 12. – № 4. – P. 331-370.
Koren, Y. Matrix Factorization Techniques for Recommender Systems / Y. Koren, R. Bell, C. Volinsky // Computer. – 2009. – Vol. 42. – № 8. – P. 30-37.
Manning, C.D. Introduction to Information Retrieval / C.D. Manning, P. Raghavan, H. Schütze. – Cambridge University Press, 2008. – 506 p. – ISBN 978-0-521-86571-5.

Просмотров работы: 8

Код для цитирования:

Последние комментарии:

14.02.2026, 16:16
Кривцов Денис Вадимович

Интересная статья, но возможно ли комбинировать предложенный метод с машинным обучением?

Читать

14.02.2026, 15:33
Каменева Мария Дмитриевна

Была интересна данная статья, потому что задаюсь вопросом, как найти мотивацию для изучения иностранного языка. Было интересно узнать взгляд на этот вопрос с психологической точки зрения, а именно "изучение иностранного языка способствует развитию способности видеть одну и ту же ситуацию с разных точек зрения и более гибко интерпретировать действительность". Я никогда не смотрела на изучение иностранного языка с этой стороны. Так же для меня было открытием, что есть связь

14.02.2026, 15:22
Кривцов Денис Вадимович

Актуальная статья, хорошо показаны реальные и современные проблемы P2P-маркетплейсов.

14.02.2026, 15:18
Суханова Любовь Николаевна

А партнёров опрашивали после или до родов или только рожениц?

14.02.2026, 13:41
dashulya.sergeeva.2004@list.ru

Очень интересно, а сейчас в больницах есть программы по подготовке партнеров?

14.02.2026, 13:22
tolokevich05@mail.ru

Интересная тема исследования! Подскажите, пожалуйста, как именно проводилось тестирование: в онлайн-формате или очно? И учитывалось ли эмоциональное состояние партнёра в динамике, например, на разных этапах родов?

14.02.2026, 01:55
Киров Сергей Николаевич

А продолжение работы над темой партнёрских родов будет? Очень редкий и полезный материал

13.02.2026, 22:27
Кривцов Денис Вадимович

Полезная статья, отдельно можно выделить в работе , что автор учитывает локализацию и культурные паттерны, опираясь на примеры российских сервисов, и фиксирует этические границы применения мотивационных механик.

13.02.2026, 22:12
Кривцов Денис Вадимович

Интересная и актуальная тема что охватывает сегодняшние реалии в нашем мире. Отлично показано что ИИ - это не только удобный инструмент, но и новые риски для людей и общества, который необходимо контролировать чтобы не прийти к плохому сценарию.

13.02.2026, 22:04
Кривцов Денис Вадимович

Работа выглядит прикладной и пригодной как основа для реальной системы автоматизации. Статья хорошо описывает практичную клиент-серверную архитектуру для управления умным домом.

XVIII Международная студенческая научная конференция Студенческий научный форум - 2026

РАЗРАБОТКА ВЫСОКОПРОИЗВОДИТЕЛЬНОГО P2P-МАРКЕТПЛЕЙСА С ИНТЕЛЛЕКТУАЛЬНОЙ СИСТЕМОЙ ПОИСКА И РЕКОМЕНДАЦИЙ

Студенческий научный форум - 2026
XVIII Международная студенческая научная конференция