В анонимных сетях существует необходимость для скрытия пользователя между своими псевдонимами.
Для этого требуется знать, насколько близки сообщения между собой с лингвистической точки зрения.
Данный анализ должен производиться на компьютере пользователя, не используя внешних источников.
Постановка задачи.
В современных информационных технологиях роль извлечения информации всё больше возрастает – из-за стремительного увеличения количества неструктурной информации. Кроме того, программная выборка достигает больших результатов, нежели пользовательская. Для решения проблемы были проанализированы существующие методы и алгоритмы информационного поиска.
Цель работы
Возможность получения связей между пользователями в зависимости от лингвистических связей.
Схожий подход к извлечению информации используется в таких программных средствах, как TermFinder, TermExtractor. [1]
На данный момент существует другой подход к сбору и хранению в другой среде FMS, основанный на пропорциях над частями речи. [2]
В данной работе будут рассмотрены виды сбора лингвистических данных. Опираясь на рассмотренные методы необходимо разработать интеллектуального агента с использованием СУБД, организованной для возможного дальнейшего лингвистического анализа принимая во внимание быстродействие и объёмы используемой оперативной памяти.
Для достижения поставленной цели, необходимо
решение следующих исследовательских задач:
Разработка математического описания сбора и хранения лингвистических данных.
Разработка алгоритмов и программная реализация модуля-коллектора лингвистической информации в сетевых программах Frost и Freetalk.
Оценка эффективности предлагаемого математического описания, алгоритмов и модуля-коллектора лингвистической информации Frost, Freetalk.
Списоклитературы:
on-line terminology extractor for EN, FR & IT — web application: http://labs.translated.net/terminology-extraction/
Моженков В.В. Anonymous XML -