НЕОБХОДИМОСТЬ ВЫДЕЛЕНИЯ КЛЮЧЕВЫХ СЛОВ ДЛЯ СВЁРТЫВАНИЯ ТЕКСТА - Студенческий научный форум

VI Международная студенческая научная конференция Студенческий научный форум - 2014

НЕОБХОДИМОСТЬ ВЫДЕЛЕНИЯ КЛЮЧЕВЫХ СЛОВ ДЛЯ СВЁРТЫВАНИЯ ТЕКСТА

 Комментарии
Текст работы размещён без изображений и формул.
Полная версия работы доступна во вкладке "Файлы работы" в формате PDF
В последние десятилетия в лингвистике заметно активизировался интерес к проблемам грамматики и семантики текста, к исследованию закономерностей речевого построения и языковой организации текстов различных типов. Это обусловлено, в первую очередь, сложностью и многоаспектностью определения самого понятия «текст», нерешенностью вопроса о составе текстовых признаков и категорий.

Одной из наиболее сложных исследовательских задач является решение в теоретическом аспекте вопроса, об интерпретации содержательной стороны текста, о понимании его целостного смысла и описании семантической структуры. Решение этой задачи неразрывно связано в филологии с проблемой ключевых слов текста.

Сочетания «ключевые слова», «ключевое слово» общеизвестны и широко используются в школьной и вузовской практике преподавания филологических дисциплин. Умение выделять ключевые слова очень важно как студенту, выполняющему научную работу (реферат, аннотацию и т.д.), так и специалисту, ученому.

Популярность методики выделения ключевых слов связана в первую очередь с развитием информационно-поисковых систем, где правильно подобранные ключевые слова и фразы облегчают нахождение текста в сети Интернет. На сегодняшний момент совершенствуются методы поиска в Интернете с помощью ключевых слов, на каждом сайте существует своя система поиска.

Актуальность темы определяется тремя факторами: теоретическим (лингвистическим), прикладным и практическим (учебным).

  1. К настоящему времени назрела необходимость обобщения и систематизации всех существующих точек зрения на феномен ключевых слов для уточнения терминологического статуса этого понятия, выявления его теоретической сущности, определения функциональной природы и роли ключевых слов как особых лексико-семантических единиц текста.

  2. Эта проблема непосредственно связана с индексированием текста, с реферированием и, конечно, с разработкой методики релевантного «поискового образа» документа, а также с усовершенствованием компьютерных поисковых систем. Компьютеры научились "понимать" смысл текста и самостоятельно выделять ключевые слова. Сегодня все поисковые системы используют в своей работе присущие текстам закономерности.

  3. Нам, как будущим специалистам, учёным, необходимо приобретение навыков работы с научным текстом, извлекать нужную информацию из текстов, выступать на профессиональные темы, уметь свёртывать, сжимать информацию, решать типовые стандартные и профессионально-ориентированные задачи с целью овладения профессионально-коммуникативными умениями работы.

Первая попытка теоретического решения проблемы ключевых слов была предпринята в 40-е годы XX века в работах А. Н. Соколова, А. А. Смирнова, посвященных вопросам психологии памяти и проблеме понимания речевого высказывания. А. Н. Соколов называл ключевые слова текста «опорными» или «обобщающими» словами. Следует отметить, что психологическое понимание сущности ключевых слов получило дальнейшее развитие в работах А. Р. Лурии, Л. В. Сахарного, Л. Н. Мурзина, А. С. Штерн, А. А. Сиротко-Сибирского и других авторов.

Под ключевыми словами мы понимаем такие языковые единицы, которые представляют текст в свёрнутом виде, являясь носителями его смысла.

Цель работы- рассмотреть проблему ключевых слов и выделить их на материале текста по специальности.

Как известно, не все слова в тексте равнозначны. Есть слова, которые позволяют представить текст в свёрнутом виде, при этом такое представление достаточно точно отражает содержание исходного текста. Мы постоянно используем такой метод, например, при конспектировании лекций, книги или статьи. Ключевые слова – это те слова, которые могут представить основное содержание текста.

Основное содержание всякого документа (текста) может быть выражено с помощью определенных слов, взятых непосредственно из этого текста. Как правило, к каждому развернутому тексту можно составить целый набор ключевых слов различного объема (от 5 до 15 слов). Но вообще количество ключевых слов может варьироваться в широких пределах. Согласно мнению Л.В. Сахарного и А.С. Штерн [2], самым оптимальным является небольшой набор ключевых слов и словосочетаний – 7-10 слов. В отдельных случаях компрессия может привести к выделению одного основного ключевого слова, которое является самым частотным знаменательным словом.

Ключевое слово — слово в тексте, способное в совокупности с другими ключевыми словами представлять текст. Набор ключевых слов близок к аннотации, плану и конспекту, которые тоже представляют документ с меньшей детализацией, но лишён синтаксической структуры.

Заметим, что термин «ключевые слова» в значительной степени условен: как ключевые знаки в тексте могут выступать не только слова, но и словосочетания и даже предложения

В качестве основных смысловых единиц, выделяемых из исходного текста на 2-м этапе, могут выступать: 1) целые ключевые предложения; 2) ключевые словосочетания и слова. Ключевое (опорное) слово — это термин, относящийся к основному содержанию текста и повторяющийся в нем несколько раз (с учетом всех возможных синонимов). Ключевое словосочетание — это сочетание слов, среди которых есть одно или несколько ключевых.

Ключевым предложением считается предложение, содержащее два и более ключевых слова или ключевых словосочетания.

Т.о., 1) ключевыми словами считаются такие знаменательные слова текста, которые с учетом всех синонимов встречаются в тексте наибольшее число раз; 2) ключевым предложением считается предложение текста, которое:

а) имеет несколько ключевых слов;

б) содержит ключевые слова на небольшом расстоянии друг от друга.

Ключевые слова обладают рядом существенных признаков:

1) высокая степень повторяемости данных слов в тексте, частотность их употребления

2) способность знака конденсировать, свертывать информацию, выраженную целым текстом, объединять «его основное содержание»; этот признак особенно ярко проявляется у ключевых слов в позиции заглавия.

Однако выбор ключевых слов является очень непростой операцией и требует серьезного подхода. Следует выбирать те ключевые слова, которые наиболее точно отражают специфику именно вашей темы. При этом необходимо избегать случайных и общих фраз и не рекомендуется повторять несколько раз одни и те же ключевые слова. То есть процесс выделения ключевых слов является еще и аналитическим.

Методика выделения ключевых слов. Благодаря многим лингвистическим исследованиям был выявлен алгоритм «формального определения зон наиболее вероятного расположения ключевых слов в тексте». Именно так обозначал их Л.В. Сахарный [3]. Во-первых, мы выявляем наиболее часто повторяющееся слово в тексте. Во-вторых, выделяются местоимения и синонимы к нему. Третий шаг – необходимо установить интервал между основным словом и словами слева и справа от него. Оптимальным интервалом обычно является интервал в три слова, это так называемая тематическая зона. Затем из этих слов выбираются знаменательные слова, или же только имена существительные. Это зависит от задач исследования. В-пятых, выбор падает на последние слова предложения, которые чаще всего и оказываются ключевыми. Это рематическая зона расположения ключевых слов.

Место и количество ключевых слов в тексте. Ключевые слова, повторяясь, могут встречаться в любой части текста и не имеют фиксированной, жестко закрепленной в нем позиции. Исследователи заметили, что они нередко концентрируются в начале произведения, а также относительно часто функционируют как заглавия. Однако это лишь тенденция, которая проявляется далеко не всегда. Ключевые слова по-разному распределяются в конкретных текстах, часто не совпадают с заглавием. По-разному (в зависимости от характера текста) решается и вопрос об их количестве.

Принадлежность слова, словосочетания или предложения к числу ключевых определяется специальными статистическими коэффициентами.

Ключевое слово в анализе текста— набор слов, представляющих содержание текста и получаемых лингвистическими и математическими методами (например, анализируя частоту появления слова в тексте).

Воспользовавшись «Анализатором текста» [4], по подсчету ключевых слов, мы установили, что наиболее употребительными в тексте «Трансгенные животные» являются слово животное —15 употреблений, трансгенные — 14, клетка — 7, днк — 6, создание – 4, гены, первый, орган, стволовые, эмбриональный,организм – 3. Остальные слова, в том числе человек, биотехнология и др. встретились по 1-2 раза.

Особое место в семантической структуре текста занимают ключевые слова животные и трансгенные ,вынесенные в позицию заглавия. Это подтверждает достоверность выявленных ключевых слов.

Выполнив статистико-математическую часть анализа, следует приступать к собственно лингвистической. Ведь ключевые слова выражают в тексте не только содержательную, сторону, но и образуют ряд связанных отношениями обусловленности «опорных» знаков. Ключевые слова в тексте «Трансгенные животные» выделены повторами разных типов: лексическими, синонимическими, морфемными, синтаксическими. Они последовательно занимают сильные позиции текста (заглавие, начало или конец абзаца).

Ключевое слово, как мы видим, — это лексическая единица, разные значения которой одновременно реализуются в тексте, при этом в нем обязательно актуализируются и ее деривационные и ассоциативные связи. Ключевые слова образуют в тексте семантические комплексы: вокруг них группируются синонимичные им единицы, слова, ассоциативно с ними связанные, наконец, однокоренные слова, повтор которых в том или ином контексте, как правило, не случаен.

Дальнейшая наша работа состоит в выявлении таких семантических и ассоциативных комплексов (с т.з. образования словообразовательных гнёзд - выбор однокоренных слов, группировки тематических групп, а также морфологических, синтаксических средств). В результате будут получены ключевые слова анализируемого текста, и возможно, количество и перечень ключевых слов, указанных выше, изменится.

Использованная литература
  1. Даркулова К.Н., Мусантаева М.А. Русский язык: Научный стиль. Текст. Лексические и грамматические особенности научного стиля./Учебное пособие. Шымкент: Южно-Казахстанский государственный университет им. М. Ауезова 2010.- 192 с. с приложениями.

  2. Сахарный Л. В., Штерн А. С. Набор ключевых слов как тип текста // Лексические аспекты в системе профессионально-ориентированного обучения иноязычной речевой деятельности. Пермь: Пермский политехнический ун-т, 1988. С. 34—51.

  3. Сахарный Л. В. Расположение ключевых слов в структуре развернутого текста (к изучению деривационных механизмов компрессии текста) // Деривация в речевой деятельности (Общие вопросы. Текст. Семантика). Пермь, 1988. С.27—29.

  4. www.shipbottle.ru. Инструмент для формирования запросов к поисковым системам.

Просмотров работы: 13611