АВТОМАТИЧЕСКОЙ АНАЛИЗ ПАРАМЕТРОВ WEB РЕСУРСОВ - Студенческий научный форум

X Международная студенческая научная конференция Студенческий научный форум - 2018

АВТОМАТИЧЕСКОЙ АНАЛИЗ ПАРАМЕТРОВ WEB РЕСУРСОВ

Кузнецов М.И. 1, Мешков В.Е. 1
1(ВФ) ИТ ДГТУ
 Комментарии
Текст работы размещён без изображений и формул.
Полная версия работы доступна во вкладке "Файлы работы" в формате PDF
В связи с увеличением масштабов и структурной сложности web- ресурсов, задача анализа гипертекста является актуальной.

Сложность данной задачи заключается в построении информационных систем в слабоструктурированных и динамично изменяющихся предметных областях, характеризующихся большими объемами информационных потоков и их неполнотой. При этом, как правило, количественные характеристики предметных областей значительно превосходят ресурсы современного программно-аппаратного обеспечения.

Актуальность данного аспекта проблемы в значительной мере объясняется большими изменениями, которые произошли в компьютерном моделировании за последние несколько десятилетий. В процессе научно-технического прогресса материальная ресурсоемкость вычислительной техники для равномощных устройств уменьшилась на несколько порядков. Вследствие этого происходит компенсирующее замещение материальных ресурсов информационными ресурсами. Материальным ресурсом называется количество составляющих элементов информационной системы, а информационным ресурсом — мощность множества ее состояний.

При всем этом сам процесс разработки и моделирования открытых информационных систем весьма сложен и трудоемок. Поэтому для эффективного использования ограниченных научно-технических ресурсов представляется целесообразным оптимизировать этот процесс. Таким образом, возникает задача поиска и описания важнейших характеристик процесса моделирования информационных систем, а также построения критериев для оценки эффективности этого процесса.

Совокупность вышеназванных особенностей делает актуальной тему данной работы.

Реализация подобных подсистем позволяет проводить объективную оценку сайтов и их продвижение в поисковых системах.

Разработка подсистемы анализа основных параметров web-ресурсов предусматривает анализ основных структурных составляющих сайтов. Поисковая оптимизация гипертекстовых ресурсов, или SEO- оптимизация, это форма онлайн маркетинга, поисковая оптимизация или поисковый маркетинг. Это процесс создания сайта и его контента максимально релевантным как для поисковых систем, так и для пользователей. Успешный поисковый маркетинг (SEO, SEM) помогает сайту занимать высокие позиции по релевантным ключевым словам и фразам в результатах поиска.

Рассмотрим подробнее влияние внутренних параметров гипертекста на оптимизацию его в поисковых системах.

Комбинация поисковых слов должна присутствовать в:

  • названии страницы (title, например Название страницы)

  • заголовке страницы (h1, h2, h3, , например Заголовок)

  • содержании страницы (концентрация поисковых слов в тексте должна быть «естественной»)

  • названиях файлов и папок (например: www.ваш-домен.абв/poiskovye-slova.pdf)

  • мета-тегах (,)

  • ссылках (здесь необходимо заменять русские буквы латинскими, потому что многие сервера до сих пор не могут правильно с ними обращаться; например: www.домен.абв/poiskovye-slova/)

Из вышесказанного следует, что головная страница web ресурса должна быть названа исходя из основного набора поисковых слов.

Одним из очевидных путей улучшения качества поиска в целом является умение учитывать те параметры, которые поисковые системы используют для индексации ресурса. Рассмотрим основные из них.

Региональность.

Выдача должна различаться для разных регионов. Результаты поиска должны учитывать регион пользователя, причем для разных городов внутри России для части запросов.

Сегодня для решения задачи географического позиционирования используют два подхода.

Первый подход. Собрать необходимый объем региональных оценок, сделать региональные факторы, то есть такие факторы, которые зависят от региона документа и от региона пользователя. Обучиться на всем потоке запросов. И, с учетом этих факторов, получить некоторое ранжирование.

Второй подход. Необходимо взять представительный объем региональных оценок и региональных факторов, выделить отдельно те запросы, на которых действительно нужна региональность, и обучиться отдельно на том потоке, на котором региональность нужна, и на том потоке, на котором региональность не нужна.

В зависимости от того, является ли запрос геозависимым, пользователю предлагается либо единая выдача внутри страны, либо региональная. Следовательно, необходимо включать в код ресурса навигационные теги.

Свежесть поиска.

Вебмастера очень внимательно следят за так называемым апдейтом поисковых систем, когда в поиске появляются новые документы, или очень сильно меняется ранжирование, все переставляется местами.

В связи с этим практически все поисковики пытаются определить свежесть запроса. Для этого используются такие средства, как новости, тренды в твиттере, частоты запросов и так далее.

Представление сайта в поиске.

Поисковая выдача среднестатистического поисковика выглядит достаточно однообразной. Понятно, что на самом деле там осмысленный читаемый текст, который человеку обычно понятен, и даже в случае, когда этот текст хороший, читаемый и удобный, вот такая вот выдача, она достаточно безликая, не за что зацепиться глазу. Следовательно, результаты выдачи должны представляться как «структурированные данные в результатах поиска».

На основании анализа структуры сайта и структуры переходов по нему, можно выделять, во-первых, разделы сайта — понимать из чего состоит меню верхнего уровня, во-вторых, понимать, какие из этих разделов нужнее, полезней, интересней пользователю. Представление этого в результатах, это не только способ показать пользователю, что будет на этом сайте, из чего он состоит, но и в некоторых случаях сокращение количества кликов.

Проанализируем, какие мета данные используются для описания свойств документа.

Условно их можно разделить на две группы: NAME и HTTP-EQUIV (HTTP-эквиваленты).

Мета теги NAME используются для указания текстовой информации о странице, авторе, а также служат для описания инструкций роботам поисковых серверов. Мета теги HTTP-EQUIV служат для правильного формирования заголовка документа, а также указывают режим его обработки.

Для начала рассмотрим самые значимые мета теги группы HTTP-EQUIV.

Из мета тегов группы HTTP-EQUIV, в первую очередь, следует обратить внимание на content-type — тип документа и его кодировка. При помощи этого тега можно указать кодировку страницы для правильного отображения символов на сайте.

Также стоит отметить атрибут content-language — указание языка документа. Используется поисковыми машинами при индексировании, хотя в большинстве случаев они различают язык по тексту. Значение этого атрибута используется также и web-серверами.

Далее рассмотрим самые значимые мета теги группы NAME.

Метатег DESCRIPTION.

Одним из способов влияния на представление своего сайта в результатах поиска (его сниппет) является использование мета-описаний — тега meta description.

Поисковые системы иногда используют его в формировании сниппета, поэтому рекомендуем использование всей необходимой информации, интересной для потенциального клиента или посетителя: описание продукции и компании, телефон, адрес, акции, распродажи и т.д.

Хотя поисковики практически не обращают внимание на содержание тега description (за одним важным исключением: Google и Яндекс иногда используют содержание этого мета- тега для составления сниппета), советуем использовать мета-тег description на всех страницах сайта, а присутствие продвигаемого ключевого слова в данном метатеге обязательно.

В заключение работы дадим некоторые рекомендации по составлению мета-описаний:

  1. Мета-описания не должны быть короткими, в несколько слов.

  2. Должны описывать конкретную страницу сайта, а не сайт в целом.

  3. Мета-описания должны быть написаны для людей, нормальным человеческим языком - развернуто, правильно выстроенными предложениями, без злоупотреблений ключевыми словами, фразами. Также, возможно умеренное использование рекламных лозунгов, информации об акциях, специальных предложений, скидках и т.д.

  4. Мета- описания должны быть емкими и при этом содержательными. Старайтесь выразить основную суть документа в нескольких предложениях.

  5. Содержимое тега meta должно быть актуальным, отражать текущее состояние страницы.

  6. Мета- описания должны соответствовать языку документа.

  7. Мета-описание отображается как сниппет в выдаче поисковой системы, поэтому также как и должно быть информативным, актуальным и привлекать внимание потенциального клиента.

Отметим, что данный подход реализован в виде PHP программы, позволяет проводить объективную оценку произвольных web ресурсов и вырабатывать рекомендации по продвижению конкретных сайтов в поисковых системах.

Библиографический список

  1. Проверка текста на уникальность. Алгоритм ШИНГЛОВ онлайн. [Электронный ресурс]: 2017. URL: http://seo-tank.ru/shingle.php

  2. Мешков В.Е., Мешкова Е.В. Определение авторского стиля на основе статистическо-морфологического анализа произведения. Теория операторов, комплексный анализ и математическое моделирование: Тезисы докладов XIII Международной научной конференции (пос. Дивноморское, 7-14 сентября 2016г.). – Владикавказ: ЮМИ ВНЦ РАН, 2016. – 257с.

3. Мешков В.Е., Дьячкин Е.А. . Задача определения близости документов. Материалы Всероссийской нучно- практической конференции «Научный потенциал высшей школы – будущему России», Волгодонск, 2017

Просмотров работы: 135