СЕМАНТИЧЕСКАЯ ПАУТИНА – МЕЧТА ИЛИ РЕАЛЬНОСТЬ!?

Музафарова Л.Б. 1

1Сибирский федеральный университет Институт управления бизнес-процессами и экономики 3 курс

Текст работы размещён без изображений и формул.
Полная версия работы доступна во вкладке "Файлы работы" в формате PDF

Семантическая паутина – это не просто заманчивое футуристическое словосочетание, это новый виток развития Всемирной паутины (World Wide Web). Термин впервые был озвучен 17 мая 2001 года в журнале “Scientific American”. Одним из авторов статьи “The Semantic Web”(«Семантическая паутина») был отец-основатель WWW Тим Бернерс-Ли. Однако спустя пять лет в другом издании “IEEE Intelligent System” всё тот же изобретатель опубликовал новую статью “Semantic Web Revisited” («Семантическая паутина: пересмотр»), в которой автор назвал данный подход организации информации «простой идеей, до сих пор в большей степени нереализованной». Так что же заставило основателя семантической паутины усомниться в своем детище!? И насколько продвинулись исследования и разработки в данном направлении!?

Отвечая на поставленные вопросы, необходимо осветить сам термин «Семантическая паутина». Итак, по версии Wikipedia «Семантическая паутина – это надстройка над существующей Всемирной паутиной, которая призвана сделать размеченную в ней информацию более понятной для компьютеров». В настоящее время большинство сайтов представляют собой конгломерат связанных между собой гипертекстовых документов. То есть при поиске информации машина находит документы, в которых встречаются указанные слова, не анализируя смысла. В результате пользователь получает список ссылок, среди которых часто встречаются сайты, содержащие ключевые слова, однако имеющие другое значение.

Концепция семантической паутины основана на повсеместном использовании унифицированных идентификаторов (URI) и семантических сетей с онтологиями. Традиционно в среде Интернет URI используются для установки ссылок на адресуемый объект (web-страницу, файл или электронную почту), однако в Семантической паутине идентификаторы именуют объекты, при условии глобальной уникальности. Более того, URI протокола HTTP можно также использовать как адреса документов, содержащих машинно-читаемые описания этих объектов.

Использование семантических сетей и онтологий как раз и позволит структурировать информацию и сделать её понятной для компьютеров. Снова обратимся к Wikipedia: «В Семантической паутине используется стандарт RDF, описывающий семантические сети (графы), в которых узлы и дуги имеют URI. Утверждения, кодируемые с помощью RDF, в дальнейшем можно интерпретировать с помощью онтологий, созданных по стандартам RDF Schema и OWL, чтобы получить из них логические заключения». Таким образом, при поиске информации браузер сможет «понимать» текст на страницах, отсеивать самостоятельно «сор», похожий словарно, но отличный по смыслу. Это позволит предоставлять только необходимую информацию, не посещая сайт-источник, а используя только сайт-посредник. Простыми словами не нужно будет перебирать ссылки по списку – на поставленный вопрос будет дан четкий ответ, полученный путем логического вывода при анализе семантического графа.

Хотя семантическая паутина ускоряет и оптимизирует поиск информации в сети, существует несколько нерешенных проблем, которые следует принять во внимание. Первая и, пожалуй, самая масштабная – огромное количество web-документов неструктурированных и семантически не размеченных. Для решения этой проблемы потребуется много времени и подготовка большого количества специалистов, знающих и умеющих работать с такими стандартами, как XML, XML Schema, RDF, RDF Schema, OWL, и некоторыми другими. Затронув языки описания семантической паутины, можно плавно перейти ко второй, не менее актуальной проблеме, связанной с обычными пользователями. Для создания запросов к Семантической паутине необходимо знать формальный язык, а это довольно сложно для простых клиентов, поэтому неотъемлемой частью разработки системы является автоматизация процесса перевода с естественного языка в виде предложений или списка ключевых слов на язык запросов. В настоящее время ведутся обширные исследования в этой области.

Также можно выделить ряд трудностей при разработке и реализации Семантической паутины.

Во-первых, использование дополнительных внешних ресурсов, в виде общих словарей и тезаурусов, представленных в форме связанной онтологии. Они необходимы для устранения неоднозначности свободных запросов, для формирования триплетов, использующихся при семантическом поиске.

Во-вторых, Семантическая паутина должна работать с минимальным вмешательством конечного пользователя. Этого можно добиться при условии, что все процессы будут должным образом автоматизированы и прозрачны.

В-третьих, очень важная характеристика такой системы как Семантическая паутина – это быстродействие. Потребуется реализовать многошаговый процесс с максимально коротким периодом выполнения каждого шага.

В-четвертых, организация контроля качества, а именно проверка полноты сведений, их точности и достоверности, устранение неоднозначности терминов.

В итоге, выявлено достаточно много препятствий для создания Семантической паутины, но все они преодолимы. Как доказательство, можно привести уже запущенные проекты по разработке Семантической паутины.

Например, «Одним из первых серьёзных и популярных проектов, основанных на принципах семантической паутины, стал проект «Дублинское ядро», реализуемый инициативной организацией DCMI. Это открытый проект, цель которого – разработать стандарты метаданных, независимых от платформ и подходящих для широкого спектра задач. Конкретнее, DCMI занимается разработкой словарей метаданных общего назначения, стандартизующих описания ресурсов в формате RDF» повествует Wikipedia.

«Проект «Friend of a Friend» позволяет описывать отношение знакомства с помощью RDF. Любой его участник может идентифицировать себя уникальным образом с помощью URI, создать свой профиль и перечислить идентификаторы людей, которых этот участник знает. Это описание может обрабатываться автоматически; на его основе можно строить сети доверия, анализировать структуру социальных групп».

«DBpedia – проект, направленный на извлечение структурированной информации из данных, созданных в рамках проекта Wikipedia. DBpedia позволяет пользователям запрашивать информацию, основанную на отношениях и свойствах ресурсов Wikipedia, в том числе ссылки на соответствующие базы данных».

Более того в январе 2013 года Facebook представил Graph Search – инструмент поиска по информационному графу (социальной сети).

Подводя итоги, становится очевидным то, что Семантическая паутина имеет неоспоримые достоинства по сравнению с Всемирной паутиной, и это явно прослеживается в современных тенденциях сферы Интернета. Самые дальновидные компании оперативно отреагировали на начинающиеся нововведения, и занялись разработкой стандартов, языков описания и самих систем. И в заключение можно смело добавить, что за этой технологией будущее, какие бы трудности не возникали в процессе проектирования, разработки и эксплуатирования системы.

Список использованных источников:

Статья эксперта в сфере IT Сергея Горшкова «О будущем Интернета и Семантической паутины» от 28 января 2013 года,
Статья «Семантическая паутина»

Ефимов А. А. Семантическая паутина, фантом, или «Интернет будущего» / А. А. Ефимов // Использование информационно-коммуникационных технологий в образовании : межвуз. сб. науч. ст. – Шадринск, 2007. – С. 37–45. – .

Просмотров работы: 1441

Код для цитирования:

VI Международная студенческая научная конференция Студенческий научный форум - 2014

СЕМАНТИЧЕСКАЯ ПАУТИНА – МЕЧТА ИЛИ РЕАЛЬНОСТЬ!?

Студенческий научный форум - 2014
VI Международная студенческая научная конференция