ИСПОЛЬЗОВАНИЕ СОВРЕМЕННЫХ ПРОГРАММНЫХ СРЕДСТВ ДЛЯ АНАЛИЗА БОЛЬШИХ МАССИВОВ ИНФОРМАЦИИ - Студенческий научный форум

VI Международная студенческая научная конференция Студенческий научный форум - 2014

ИСПОЛЬЗОВАНИЕ СОВРЕМЕННЫХ ПРОГРАММНЫХ СРЕДСТВ ДЛЯ АНАЛИЗА БОЛЬШИХ МАССИВОВ ИНФОРМАЦИИ

 Комментарии
Текст работы размещён без изображений и формул.
Полная версия работы доступна во вкладке "Файлы работы" в формате PDF

В связи с тем, что в жизни общества происходят значительные изменения, особое значение приобретает проблема совершенствования профессиональной подготовки будущих специалистов. В результате таких изменений необходимо преобразовать содержание и методы деятельности педагогов. Система балльных оценок, являющаяся на сегодняшний день абсолютной количественной шкалой, не всегда может отразить качественное развитие учащегося в период его обучения. Она фиксирует только результат учебного процесса. Поэтому в процесс современного образования ввели новую систему контроля и оценки знаний – систему балльно-рейтингового контроля. Рейтинг можно определить как некоторую численную характеристику, которая оценивает какое-либо качественное явление. В большинстве случаев рейтинг используется в качестве индивидуального числового показателя оценки достижений. Обычно рейтинг отождествляется с «накопленной оценкой».

Организуя учебный процесс на основе рейтинговой системы, являющейся одной из эффективных форм реализации механизмов обеспечения объективности в оценке результатов обучения, необходимо преследовать несколько целей, реализация которых формирует побудительные мотивы управления успеваемостью, а именно:

1) активизировать учебную деятельность учащихся;

2) повысить ответственность студентов за счет систематической работы над учебным материалом.

Балльно-рейтинговая система, по сути, является набором правил и положений, которые позволяют количественно, путем накопления специальных баллов оценивать все результаты контролируемой учебной деятельности учащихся при изучении какой-либо дисциплины за семестр.

Балльно-рейтинговая система оценки качества знаний студентов вводится в высших учебных заведениях по 3 основным причинам:

  1. Существенно возрастает объективность оценки студенческих достижений в учебе. Объективность является главным требованием, которое предъявляют к оценке, но в традиционной системе образования оно плохо реализуется. Балльно-рейтинговая система позволяет расценивать экзамен не как «последний приговор», а как обычную контрольную точку, потому что он только добавит баллы к тем, которые студент набрал за семестр.

  2. Использование балльно-рейтинговая системы позволит наиболее точно оценить качество учебы.

  3. Балльно-рейтинговая система снимает одну из главных проблем студентов – «сессионный стресс», так как если студень по завершении курса набирает большую сумму баллов, то его могут освободить от сдачи экзамена или зачета. Таки образом, при введении балльно-рейтинговой системы, существенно повысится качество подготовки студентов к учебным занятиям, что является немаловажным фактором, чтобы занять в будущем достойное место на рынке труда.

Такая система оценки знаний не только повысит качество знаний и обеспечит рост эффективности учебной деятельности, но в перспективе должна стать не только средством контроля качества знаний, но и средством управления профессионально-личностным развитием студентов.

Использование модульно-рейтинговой системы в учебном процессе предполагает формирование больших массивов данных по каждому студенту, по каждой дисциплине, по каждой группе, поэтому при организации такой технологии контроля используем базы данных, в которых хранится вся эта информация. Но учитывая, что эти большие массивы информации могут быть использованы только после проведения всестороннего анализа данных, поэтому следует базы данных по рейтингу анализировать с использованием специальных программных средств, среди которых наиболее перспективными являются OLAP-технологии и DATA Mining. Проведем анализ и выбор этих технологий.

OLAP – набор технологий для оперативной обработки информации, включающих динамическое построение отчётов в различных разрезах, анализ данных, мониторинг и прогнозирование ключевых показателей. В основе OLAP-технологий лежит представление информации в виде OLAP-кубов. OLAP-кубы содержат показатели, используемые для анализа и принятия управленческих решений.

Благодаря детальному структурированию информации OLAP-кубы позволяют оперативно осуществлять анализ данных и формировать отчёты в различных разрезах и с произвольной глубиной детализации. Отчёты могут создаваться аналитиками, менеджерами, руководителями подразделений в интерактивном режиме для того, чтобы быстро получить ответы, на возникающие ежедневно вопросы, и принять правильное решение. При этом сотрудникам, для создания отчетов не нужно прибегать к услугам программистов, на что обычно уходит немало времени.

Из OLAP-куба может быть составлен обычный плоский отчёт. По столбикам и строчкам отчёта будут бизнес-категории (грани куба), а в ячейках показатели.

OLAP – это основной компонент организации хранилищ данных. OLAP-функциональность реализуется различными способами, от простейших средств для анализа данных в приложении до распределенных аналитических систем, которые основаны на серверных продуктах. Пользователь может легко просмотреть данные на многомерной структуре для применения к собственным задачам. OLAP позволяет выполнять синтез информации, а также преобразовать данные оперативных систем в информацию и даже в качественные оценки.

Основой OLAP является многомерная модель данных. Человеческое мышление является многомерным по определению. Когда человек задает какой-либо вопрос, он налагает ограничения, таким образом, формулируя вопросы во многих измерениях, поэтому процесс анализа в многомерной модели максимально приближен к реальному человеческому мышлению. По измерениям в многомерной модели откладывают факторы, влияющие на деятельность предприятия. Таким образом, получают гиперкуб, который затем наполняется специальными показателями. Гиперкуб может заполняться как реальными данными оперативных систем, так и прогнозируемыми на основе исторических данных. Измерения гиперкуба могут носить сложный характер, быть иерархическими, между ними могут быть установлены отношения. В процессе анализа у пользователя может измениться точка зрения на данные, позволяя ему просматривать данные в различных разрезах и решать конкретные задачи.

DATA Mining – процесс анализа базы данных, который направлен на поиск новой полезной информации, которая представлена в форме ранее скрытых отношений между исходными данными. Сфера применения DATA Mining не имеет ограничений – она используется везде, где имеются какие-либо данные.

DATA Mining позволяет решить одну из трудных задач – прогнозирование. Использование данной технологии для решения подобного вида задач, находит применение в самых разных областях деятельности человека: наука, экономика, производство и так далее Прогнозирование – важный элемент в организации управления, от отдельных хозяйственных субъектов до всей экономики. Расширение методов прогнозирования в первую очередь связано с огромным развитием информационных технологий, с увеличением объем данных, которые необходимо хранить, усложняющимися методами и алгоритмами прогнозирования, которые реализованы в инструментах DATA Mining.

Прогнозирование является одной из наиболее сложных задач DATA Mining, так как требует досконального изучения исходных данных и методов, которые подходят для анализа. Основная цель прогнозирования – предсказание будущих событий. Прогнозирование является как задачей DATA Mining, так и ключевым моментом при принятии решений, направленных на определение изменения динамики какого-либо объекта или события на основе исходных данных, то есть, анализа его состояния, как в прошлом, так и в настоящем. Иными словами, для решения задачи прогнозирования необходима некоторая обучающая выборка данных. Задача прогнозирование является распространенной и востребованной во многих областях деятельности человека. Прогнозирование уменьшает риск принятия неверных, необоснованных или субъективных решений.

Рассматривая продукты DATA Mining в краткосрочной перспективе, можно сказать, что они могут стать обычными и необходимыми, и использоваться пользователями для поиска нужной им информации различного характера.

Если же смотреть на DATA Mining с другой стороны, то ее можно использовать для поиска нового вида лечения всевозможных заболеваний. Однако не следует забывать о том, что столь повсеместное применение технологии DATA Mining может быть опасным, так как огромное количество информации, как частного, так и военного характера стало доступным к ознакомлению во всемирной сети, и все больше знаний, возможно, добыть из нее.

Важная особенность DATA Mining состоит в нестандартности и неочевидности разыскиваемых шаблонов. Таким образом, главным отличием средств DATA Mining от OLAP-средств является то, что используя, имеющиеся данные они способны находить взаимосвязи между данными и самостоятельно строить гипотезы об их характере.

Применяя средства DATA Mining нельзя исключать использование OLAP-технологии, так как результаты обработки исходных данных с помощью OLAP-средств способствуют наиболее полному пониманию типов и характеров закономерностей, которые необходимо найти.

OLAP и DATA Mining – обе эти технологии являются составными частями процесса поддержки принятия решений.

OLAP анализ в основном ориентирован на проверку заранее сформулированных гипотез, в то время как DATA Mining – осуществляет поиск скрытых закономерностей. Средства DATA Mining могут обнаружить такие связи самостоятельно, а также на их основе построить строить гипотезы о взаимосвязи между ними. В основном, именно формулирование гипотезы относительно обнаруженных зависимостей остается на сегодняшний день одной из сложнейших задач при анализе данных.

Интеграция технологий OLAP и DATA Mining «обогащает» функциональность и одной, и другой технологии. Эти два вида анализа должны быть тесно объединены, чтобы интегрированная технология могла обеспечивать одновременно многомерный доступ и поиск закономерностей.

Список используемых источников

  1. http://rpp.nashaucheba.ru/docs/index-62764.html

  2. http://elport.ru/articles/chto_takoe_DATA_MINING

  3. http://citforum.ru/cfin/articles/olap_web/

  4. http://knowledge.allbest.ru

Просмотров работы: 1288