АНАЛИЗ СТРУКТУРЫ ПРЕДСТАВЛЕНИЯ РИЭЛТОРСКОЙ ИНФОРМАЦИИ В СЕТИ ИНТЕРНЕТ С ЦЕЛЬЮ ФОРМИРОВАНИЯ ПОДХОДА К ПРОЕКТИРОВАНИЮ РЕПОЗИТОРИЯ АГЕНТСТВА НЕДВИЖИМОСТИ - Студенческий научный форум

V Международная студенческая научная конференция Студенческий научный форум - 2013

АНАЛИЗ СТРУКТУРЫ ПРЕДСТАВЛЕНИЯ РИЭЛТОРСКОЙ ИНФОРМАЦИИ В СЕТИ ИНТЕРНЕТ С ЦЕЛЬЮ ФОРМИРОВАНИЯ ПОДХОДА К ПРОЕКТИРОВАНИЮ РЕПОЗИТОРИЯ АГЕНТСТВА НЕДВИЖИМОСТИ

Нестеров Р.А. 1
1Национальный исследовательский университет "Высшая школа экономики" (Пермский филиал), факультет бизнес-информатики
 Комментарии
Текст работы размещён без изображений и формул.
Полная версия работы доступна во вкладке "Файлы работы" в формате PDF
Введение

В настоящее время многие агентства недвижимости сталкиваются с проблемой организации эффективного поиска информации об аренде, продаже, покупке объектов недвижимости или земельных участков. В основном они осуществляют поиск «ручным» способом: просмотр объявлений в газетах, на различных категориях Web-сайтов:

  1. сайты бесплатных объявлений;

  2. сайты агентств недвижимости;

  3. сайты строительных компаний;

  4. порталы поиска, интегрирующие информацию из источников, перечисленных в п. 1 3.

Кроме того, информация может быть представлена в разных форматах [1] (текстовый, html-документы, документы Microsoft Office, jpg-фотографии и т.д.), что в свою очередь также затрудняет ее обработку. Тем самым, эффективность работы агентств недвижимости может существенно снизиться.

Для работников агентств недвижимости было бы намного удобнее, если бы вся необходимая актуальная информация об объектах недвижимости, автоматически собранная из множества гетерогенных источников, хранилась в единой базе данных – репозитории, выполняющем помимо функции хранения поиск, обработку, классификацию и структуризацию информации об объектах недвижимости. Таким образом, трудоемкость и время, необходимое для поиска и анализа информации о том или ином объекте недвижимости, могут значительно уменьшиться.

Из перечисленных выше категорий источников информации ближе всего к проектируемому приложению, основанному на использовании репозитория, по функциональности находятся поисковые порталы.

Цель данной работы состоит в анализе информации, необходимой для определения подходов к проектированию репозитория в соответствии с перечисленными выше функциями. Кроме того, в работе должны быть сформулированы общие требования, предъявляемые к репозиторию.

Для достижения поставленной цели прежде всего необходимо выполнить анализ источников информации об объектах недвижимости.

Анализ источников, предоставляющих информацию об объектах недвижимости

В ходе анализа нам необходимо установить, в каком виде разные категории источников информации представляют информацию об объектах недвижимости и какие существуют проблемы в обработке информации, размещенной на разных категориях источников.

Для того чтобы выполнить анализ, нам необходимо:

  1. выделить список информационных ресурсов для сравнения по каждой из перечисленных выше категорий;

  2. сравнить набор сведений, полноту представления информации об объектах недвижимости;

  3. сравнить форматы представления данных об объектах недвижимости с точки зрения трудоемкости анализа, возможности автоматического извлечения и структуризации этих данных.

На первом этапе работы над проектом был выполнен сравнительный анализ Web-сайтов по размещению бесплатных объявлений.

Для проведения анализа выбраны следующие, одни из наиболее популярных и посещаемых, сайты:

  1. доска бесплатных объявлений «AVITO» [4];

  2. доска бесплатных объявлений «Из рук в руки» [5].

Результаты анализа приведены в табл.1 и табл.2.

В табл. 1 отражены сведения по форматам представления данных об объектах недвижимости. В табл. 2 дается краткое описание набора сведения об объектах недвижимости и того, как они размещены на сайте и насколько структурированы.

Таблица 1. Форматы представления данных на сайтах бесплатных объявлений

 

Формат данных

HTML

MicrosoftOffice

Текстовый

Другое

AVITO

блоки и таблицы для общей информации

нет

подробное описание объявления

jpg-фотографии, прикрепленные к объявлению

Из рук в руки

блоки и таблицы для общей информации

нет

подробное описание объявления

jpg-фотографии, прикрепленные к объявлению

Таблица 2. Структуризация информации на сайтах бесплатных объявлений

 

Набор сведений об объекте недвижимости

Степень структуризации

AVITO

  1. общая информация;

  2. стоимость аренды, покупки и т.п.

  3. контактная информация лица, подавшего объявление

Информация структурирована слабо. Большая часть необходимой информации размещается в текстовом описании объявления.

Из рук в руки

  1. общая информация;

  2. стоимость аренды, покупки и т.п.

  3. контактная информация лица, подавшего объявление

Большая часть необходимой информации размещается в специальных атрибутах объявления (местоположение, площадь, стоимость и т.п.)

Вид основных элементов объявлений сайтов «AVITO» и «Из рук в руки» и их содержание представлен на рис. 1 и рис. 2 соответственно.

Рисунок 1. Вид объявления сайта «AVITO»

Рисунок 2. Вид объявления сайта «Из рук в руки»

Затем был проведен сравнительный анализ Web-сайтов следующих известных агентств недвижимости г. Перми:

  1. сайт агентства недвижимости «Тимур» [6];

  2. сайт агентства недвижимости «Перспектива» [7].

Результаты сравнения приведены в табл. 3 и табл. 4. Содержание таблиц аналогично содержанию таблиц сравнительного анализа сайтов бесплатных объявлений.

Таблица 3. Форматы представления данных на сайтах агентств недвижимости

 

Формат данных

HTML

Microsoft Office

Текстовый

Другое

Тимур

блоки и таблицы

нет

дополнительная информация об объектах

jpg-фотографии

Перспектива

блоки и таблицы

прайс-листы в формате xls

дополнительная информация об объектах

jpg-фотографии

Таблица 4. Структуризация информации на сайтах агентств недвижимости

 

Набор сведений об объекте недвижимости

Степень структуризации

Тимур

  1. общая информация;

  2. стоимость аренды, покупки и т.п.;

  3. дополнительное текстовое описание;

Вся информация представлена таблицах включая дополнительное неструктурированное текстовое описание

Перспектива

  1. общая информация;

  2. стоимость аренды, покупки и т.п.;

  3. дополнительное текстовое описание;

Общая информация и информация по стоимости размещается в таблицах, дополнительное текстовое описание представлено отдельно вне таблиц

Визуальное представление информации на сайтах агентств недвижимости «Тимур» и «Перспектива» можно увидеть на рис. 3 и рис. 4 соответственно.

Рисунок 3. Информации на сайте агентства недвижимости «Тимур»

Рисунок 4. Информация на сайте агентства недвижимости «Перспектива»

Выполним сравнительный анализ Web-сайтов следующих также известных пермских строительных компаний:

  1. ОАО «Пермский завод силикатных панелей» [8];

  2. ОАО «Камская долина» [9];

Результаты сравнения приведены в табл. 5 и табл. 6. Содержание таблиц также аналогично содержанию таблиц анализа категорий источников информации, рассмотренных выше. С визуальным представлением информации на сайтах ОАО «ПЗСП» и ОАО «Камская долина» можно ознакомиться на рис. 5 и рис. 6.

Таблица 5. Форматы представления данных на сайтах строительных компаний

 

Формат данных

HTML

Microsoft Office

Текстовый

Другое

ПЗСП

блоки, таблицы

нет

основная описательная информация

прайс-листы в формате pdf;

pdf-буклеты планировок

Камская долина

блоки, таблицы

прайс-листы в формате xls;

дополнительная информация

jpg-фотографии объектов; описание планировок

Таблица 6. Структуризация информации на сайтах строительных компаний

 

Набор сведений об объекте недвижимости

Степень структуризации

ПЗСП

  1. общая информация;

  2. информация о стоимости;

  3. дополнительное текстовое описание

Вся необходимая информация содержится в разных источниках (часть в pdf-документах, часть на страницах сайта)

Камская долина

  1. общая информация;

  2. информация о стоимости;

  3. информация об ипотеке;

  4. дополнительное текстовое описание

Общая информация содержится в xls-документах (прайс-листах), дополнительная информация размещается на сайте

Рисунок 5. Пример информация на сайте ОАО «ПЗСП»

Рисунок 6. Пример информация на сайте ОАО «Камская долина»

Наконец, было выполнено сравнение web-сайтов следующих порталов поиска, агрегирующих информацию об объектах недвижимости:

  1. «Метросфера» [10];

  2. «Яндекс.Недвижимость» [11, 12].

Помимо форматов представления данных и структуры информации, сравним возможности формирования запросов в рассматриваемых поисковых порталах. Результаты сравнительного анализа приведены в табл. 7-9. Содержание табл. 7 и табл. 8 аналогично содержанию таблиц, представленных выше. В табл. 9 рассмотрены основные возможности формирования поисковых запросов.

Таблица 7. Форматы представления данных на поисковых порталах

 

Формат данных

HTML

Microsoft Office

Текстовый

Другое

Метросфера

блоки, таблицы

нет

общее описание объекта

прайс-листы в формате pdf

Яндекс.Недвижимость

ссылки на сайты источников

нет

общее описание объекта

отображение местоположения на карте

Таблица 8. Структуризация информации на поисковых порталах

 

Набор сведений об объекте недвижимости

Степень структуризации

Метросфера

  1. общая информация;

  2. информация о стоимости;

  3. дополнительное текстовое описание с сайта источника

Информация об объекте недвижимости на портале представлена в текстовом неструктурированном виде

Яндекс.Недвижимость

  1. краткая общая информация;

  2. информация о стоимости;

  3. ссылка на сайт источника

На портале размещена только краткая информация в атрибутах объявления; основная информация представления на сайте источника

Таблица 9. Формирование запросов на поисковых порталах

 

Набор полей для отбора информации

Структура запроса

Метросфера

  1. тип объявления (продажа, съем, покупка);

  2. местоположение (район, микрорайон, точный адрес);

  3. тип дома (сталинский, хрущевский и т.п.);

  4. материал (кирпич, панель и т.п.);

  5. площадь;

  6. диапазон цены

Последовательное усложнение запроса, путем добавления новых критериев отбора

Яндекс.Недвижимость

  1. тип объявления (купить, снять);

  2. местоположение (район, микрорайон);

  3. материал (кирпич, панель);

  4. этажность

  5. площадь (жилая, кухня);

  6. диапазон цены

Последовательное усложнение запроса, путем добавления новых критериев отбора

С визуальным представлением информации на сайтах «Метросфера» и «Яндекс.Недвижимость» можно ознакомиться на рис. 7 и рис. 8.

Рисунок 7. Пример информация на сайте «Метросфера»

Рисунок 8. Пример информация на сайте «Яндекс.Недвижимость»

Исходя из результатов проведенного сравнительного анализа, представленных выше, видно, насколько велика степень разнородности источников информации об объектах недвижимости. Можно сформулировать следующие проблемы:

  1. необходимая информация не структурирована в достаточной степени и хранится разных местах;

  2. информация представляется в различных форматах;

  3. на поисковых порталах нет возможности формирования «нестандартных» поисковых запросов (на естественном языке, с использованием логических функций и т.п.).

Формирование общих требований к репозиторию информации об объектах недвижимости

Сформируем минимальные требования к информационной системе агентства недвижимости, использующей репозиторий для хранения и поиска информации об объектах недвижимости:

  1. организация хранения информации о клиентах недвижимости;

  2. обеспечение взаимодействия с клиентами;

  3. орагнизация функционирования репозитория;

  4. организация поиска информации по различным источникам и размещение найденной информации в репозитории;

  5. организация поиска и извлечения информации из репозитория.

Схему интеллектуального поиска информации об объектах недвижимости с помощью такой системы можно представить следующим образом (см. рис. 9):

Рисунок 9. Схема интеллектуального поиска

Согласно набору функций репозитория, описанных во введении, анализатор будет выполнять следующие действия:

  1. поиск информации об объектах недвижимости по источникам на основе их описания, которые хранятся в репозитории;

  2. обработка полученной из источников информации и размещение ее в репозитории;

  3. поиск информации об объектах недвижимости в репозитории.

Технологии поиска и извлечения информации описаны в [2] (для организации поиска по источникам) и в [3] (для организации поиска и обработки информации в репозитории).

Так, минимальные общие требования, предъявляемые к репозиторию, будут состоять в следующем:

  1. необходимо хранить информацию об источниках и их метаописание (на основе анализа информационных источников), на основании которого анализатор будет выполнять поиск по ресурсам и переносить информацию об объектах недвижимости в репозиторий;

  2. необходимо хранить и обрабатывать непосредственно информацию об объектах недвижимости;

  3. необходимо хранить историю изменений информации об объектах недвижимости, то есть организовать хранение темпоральных данных.

Заключение

В работе был предложен способ хранения и обработки информации об объектах недвижимости с помощью репозитория - единой базы данных риэлторского агентсва, агрегирующей информацию из множества источников. Кроме того, нами был сформирован набор основных функций репозитория и требований в соответствии с этими функциями.

Также было определено, что для функционирования репозитория необходим анализатор, выполняющий поиск информации по источникам и по самому репозиторию. Для организации поиска информации об объектах недвижимости по источникам предполагается использовать технологии семантической индексации [2], а для организации поиска и обработки информации в репозитории – онтологий [3].

Библиографический список

  1. Бессонов В.А. Обзор современных форматов электронных документов // Математика программных систем: межвуз. сб. науч. статей. Пермь, 2012. С. 120-131.

  2. Ланин В.В., Соколов Г.В. Организация средств семантического поиска портала на основе мультиангентного подхода // Математика программных систем: межвуз. сб. науч. статей. Пермь, 2012. С. 140-149.

  3. Ланин В.В. Организация обработки информационных ресурсов на учебно-исследовательском портале с использованием онтологий // Математика программных систем: межвуз. сб. науч. статей. Пермь, 2012. С. 132-139.

  4. Доска бесплатных объявлений AVITO.ru [сайт].

URL: http://www.avito.ru (дата обращения: 07.02.2013).

  1. Доска бесплатных объявлений «Из рук в руки» [сайт].

URL: http://irr.ru (дата обращения: 30.01.2013).

  1. Агентство недвижимости в Перми «Тимур» [сайт].

URL: http://www.timur.perm.ru (дата обращения: 30.01.2013).

  1. Агентство недвижимости в Перми «Перспектива» [сайт].

URL: http://perspektiva.ru (дата обращения: 30.01.2013).

  1. ОАО «Пермский завод силикатных панелей» [сайт].

URL: http://pzsp.ru (дата обращения: 4.02.2013).

  1. ОАО «Камская долина» [сайт]. URL: http://kamdolina.ru (дата обращения: 4.02.2013).

  2. Метросфера ­­ глобальный портал о недвижимости [сайт]. URL: http://metrosphera.ru (дата обращения: 4.02.2013).

  3. Яндекс.Недвижимость: поиск объявлений о продаже и аренде квартир, домов и комнат [сайт]. URL: http://realty.yandex.ru (дата обращения: 29.01.2013).

  4. Что такое Яндекс.Недвижимость [сайт].

URL: http://help.yandex.ru/realty/ (дата обращения: 30.01.2013).

Научный руководитель: старший преподаватель кафедры информационных технологий в бизнесе НИУ ВШЭ – Пермь В.В. Ланин

11

Просмотров работы: 2140