КОММУНИКАТИВНЫЙ КОНТЕКСТ ИССЛЕДОВАНИЯ ПОНЯТИЯ БОЛЬШИЕ ДАННЫЕ: ПРОБЛЕМА ПЕРЕРАБОТКИ И АНАЛИЗА ДАННЫХ - Студенческий научный форум

VI Международная студенческая научная конференция Студенческий научный форум - 2014

КОММУНИКАТИВНЫЙ КОНТЕКСТ ИССЛЕДОВАНИЯ ПОНЯТИЯ БОЛЬШИЕ ДАННЫЕ: ПРОБЛЕМА ПЕРЕРАБОТКИ И АНАЛИЗА ДАННЫХ

 Комментарии
Текст работы размещён без изображений и формул.
Полная версия работы доступна во вкладке "Файлы работы" в формате PDF

Проблема больших данных возникла с пониманием необъятности научных данных, полученных в результате проведенных исследований. На протяжении многих лет коммуникации научное сообщество накопило огромное количество данных и конечно не раз задумывалось об их роли в науке. И в 2008 году эти мысли приняли законченную форму, именно в этом году Клиффорд Линч использовал термин «большие данные» в номере журнала Nature, тема которого была выражена в следующем вопросе – «Как могут повлиять на будущее науки технологии, открывающие возможности работы с большими объёмами данных?»[1].

Попробуем разобраться с полученными объемами. В процессе эволюции и развития технологий человечество стремилось расширить свою сырьевую базу от шкур животных до полезных ископаемых, однако при всем разнообразии сырье всегда было природным и материальным, но только с появлением первых вычислительных систем возникло сырье совершенно нового качества — искусственно созданное и нематериальное. Данные. Конечно, область науки и техники приняла «удар» на себя и, как лакмусовая бумажка, оказалась тем самым индикатором, отражающим реакцию среды и общества на быстро меняющиеся запросы мира. Именно наука является первопроходцем в использовании вычислительных систем и это естественно. Кто как не научное сообщество, обладает огромным багажом экспериментальных данных, количество которых с каждым годом возрастает и по сей день. Так современная наука стала все более зависимой от генерации и повторного использования огромных массивов данных. В качестве примеров источников возникновения больших данных приводятся прежде всего непрерывно поступающие данные с измерительных устройств, события от радиочастотных идентификаторов, потоки сообщений из социальных сетей, метеорологические данные, потоки данных о местонахождении абонентов сетей сотовой связи, устройств аудио- и видеорегистрации [1]. На протяжении последних десятилетий в мире наблюдается устойчивая тенденция к расширению горизонтов использования информационных и коммуникационных технологий, предназначенных для передачи и сохранения информации, охватывающей широкий спектр областей человеческой деятельности. В настоящее время сотни тысяч новых объектов находятся в цифровых хранилищах и в Интернете, создавая благоприятную возможность для исследовательского процесса не только в науке, но и в медицине, образовании, культуре и управлении. Попробуем свести проблему больших данных к простой для понимания формуле. Всем нам известен из курса информатики закон Мура, который говорит о росте производительности компьютеров. В нашем случае мы имеем дело с увеличением данных, а значит, закон будет звучать, так количество данных будет удваиваться каждый год, и возможно в скором времени объёмы результатов коммуникации даже превзойдут этот предел.

В чем же проблема Больших Данных? Сам термин «Большие Данные» включает в себя не только данные как таковые, но и методологию работы с ними. Да количество данных неоспоримо огромно, но ключевым здесь являются методы, способные перейти от количества к качеству получаемой информации. Проблема отнюдь не в увеличении данных, а в старых методах, которые не могут справиться с новыми объемами.

По итогам 2011 годаиз заявления Международного союза телекоммуникаций при ООН следует, что каждый третий житель Земли имеет доступ в Интернет [2]. Так в условиях глобальной компьютеризации, благодаря современным средствам коммуникации человек оказывается в западне мира с его возрастающим объемом информации. Человек пытается объять необъятное, стараясь выхватить «отовсюду по чуть-чуть», но в результате теряет львиную долю полезной информации, что нельзя не согласиться со словами Н. Лумана: «информационное общество использует информацию, находящуюся в его распоряжении, лишь в ограниченной степени» [3]. Как верно, в свое время, подчеркивал Э. Фромм: «Человеку нужна система координат, некая карта его природного и социального мира, без которой он может заблудиться и утратить способность действовать целенаправленно и последовательно. У него не было бы возможности ориентироваться и найти точку опоры, которая позволяет человеку классифицировать все впечатления, обрушивающиеся на него» [4]. Коммуникация не имеет никакой цели. Она происходит или не происходит – это все, что о ней можно сказать. Она форсирует ситуацию решения, ибо коммуникация удваивает реальность, создавая два варианта решения: «да» — «нет» [5]. Необходимы средства для извлечения смысла, сакрального знания из бесконечно поступающих объемов информации, формирующейся в результате коммуникации современного общества.

Согласно Никласу Луману, под коммуникацией следует понимать «некое исторически-конкретное протекающее, зависимое от контекста событие» [6], специфическую операцию, характеризующую исключительно социальные системы, в ходе которой происходит перераспределение знания и незнания. Проблема анализа Больших Данных указала на недостатки существующих методов перераспределения знаний, столкнув два понятия «данные» и «информация». Понятие «данные» является более специфическим, чем понятие «информация», но при этом во многих контекстах их используют как взаимозаменяемые. Согласно определению, данные это повторно поддающиеся толкованию представления информации в формализованном виде для последующей их передачи, интерпретации или обработки. Информация же это сведения о чем-либо, независимо от формы, которые устраняют неопределенность путем преобразования данных. Ошибочное использование двух этих терминов повлекло за собой развитие технологий работы с экспериментальными данными, но совершенно была забыта теория информации.

Обозначенные выше объемы данных, которые на практике не имеют каких-либо границ с течением времени, в ходе которого происходит ее накопление, в силу своей разнородности сами по себе являются недоступными для понимания и выделения полезных знаний. Проблема распределения и анализа данных сводиться к отсутствию понимания процесса получения новой информации и новых знаний из уже имеющихся массивов данных. Вот почему вне восстановления связей цепочки «данные — информация — знание» говорить о решении проблемы Больших Данных бессмысленно, не зря в середине XX века философы из разных уголков мира пытались исследовать такую иерархию как DIKW (Data, Information, Knowledge, Wisdom, что в переводе означает «Данные, Информация, Знания, Мудрость») [7]. Данные приводятся к информации, получая контекст, к которому знания добавляют механизм использования в конкретной предметной области, в которой они могли бы найти свое применение.

Какова же связь между «данными» и «информацией»? Данные — это сырые факты, обладающие строгой, хорошо регламентируемой структурой, но не несущие полезного смысла до тех пор, пока не поставлены в контекст. Информация является результатом анализа обработанных данных человеком, этот анализ придает данным смысл и возможность быть использованными в человеческих нуждах. До последнего времени представления об обработке данных сводились к ограниченному кругу алгоритмических, логических или статистических операций над относительно небольшими объемами данных. Однако по мере развития компьютерных технологий и сближения их с реальным миром возрастает потребность превращений данных из реального мира в информацию о реальном мире, при этом счетная нагрузка на компьютеры оказывается намного меньше, чем другие виды работ, выполняемые над данными. Как было замечено, анализ человека превращает данные в знания, а это значит, что необходимо только перевести этот уникальный для человека метод в машинный код. Тогда эта работа будет выполняться в автоматическом режиме с использованием последних технологий параллелизма на системных компьютерных комплексах, чтобы справляться с большими объемами данных, не теряя ни капли полезной информации.

Попробуем подытожить результаты нашей рефлексии относительно понятия Большие Данные. Во-первых, коммуникация научного сообщества и всего мира в целом приводит все к увеличивающемуся объему данных. Проблема Больших Данных заключается не в объемах данных, а в методологии работы с ними. Во-вторых, проблема распределения и анализа данных сводиться к отсутствию понимания процесса получения новой информации и новых знаний из уже имеющихся массивов данных. Данные – это исходный материал, голые факты, которые могут быть использованы для получения полезной информации. В-третьих, информация – это результат связывания «сухих» данных таким «питательным бульоном», как контекст. В конечном итоге информация, полученная в результате анализа данных, используется для принятия решения. В-четвертых, с каждым годом все острее возникает потребность новых форм анализа объемов данных. В-пятых, необходим новый подход для создания алгоритмов анализа и переработки данных, основанный на естественном методе отбора знаний из информации. С такой позиции известные слова семьи Ротшильдов «Кто владеет информацией – тот владеет миром», придуманную ими, после того как один из братьев Натан раньше других узнал о поражении Наполеона при Ватерлоо и провернул аферу с ценными бумагами на бирже, будут звучать так: «Миром владеет тот, кто владеет данными и методами их анализа».

Список литературы

  1. Большие данные [Электронный ресурс] // Википедия: свободная энцикл. – Электрон. дан. – [Б. м.], 2013. –URL: http://ru.wikipedia.org/wiki/Большие_данные (дата обращения: 02.10.2013).

  2. Международный союз электросвязи (МСЭ) Измерение информационного общества Швейцария: ITU, 2012.

  3. Луман, Н. Решения в «информационном обществе»/Н. Луман// Проблемы теоретической социологии. – Спб.: ТОО ТК «Петрополис», 2000. С. 36.

  4. Фромм Э. Анатомия человеческой деструктивности; [пер. с нем. Э. Телятниковой]. М.: АСТ, 2009. С.158.

  5. Михайлова, Т.Л. Проблематизация теоретических основ коммуникативистики / Т.Л. Михайлова – Н.Новгород: НГТУ, 2009. С 13.

  6. Lumen N. Die Gesellschaft der Gesellschaft, Frankfurt, 1997. S.70.

  7. Gene Bellinger, Durval Castro, Anthony Mills Data, Information, Knowledge, and Wisdom, 2003.

 

Просмотров работы: 2152