ИССЛЕДОВАНИЕ СОСТАВА СЛОЖНЫХ КРИСТАЛЛОВ С ПОМОЩЬЮ АЛГОРИТМА НА ОСНОВЕ ИНС - Студенческий научный форум

XI Международная студенческая научная конференция Студенческий научный форум - 2019

ИССЛЕДОВАНИЕ СОСТАВА СЛОЖНЫХ КРИСТАЛЛОВ С ПОМОЩЬЮ АЛГОРИТМА НА ОСНОВЕ ИНС

Чечевичко Р.С. 1, Благина Л.В. 2
1ИТ (филиал) ДГТУ в г. Волгодонске
2ИТ (филиал) ДГТУ в г. Волгодонске
 Комментарии
Текст работы размещён без изображений и формул.
Полная версия работы доступна во вкладке "Файлы работы" в формате PDF

Анализ состава многокомпонентных кристаллических гетероструктур является дорогостоящей компонентой технологии электронных приборов в информационных технологиях. Это стимулирует поиск других методов, сопряженных с компьютерным статистическим экспериментом. В данной работе описывается использование технологии, основанной на методе искусственных нейронных сетей (ИНС), для идентификации химического состава сложных полупроводниковых структур.

В основу ИНС положены следующие признаки живых нейронных сетей, позволяющие им хорошо справляться с нерегулярными задачами [1]:

простой обрабатывающий элемент - нейрон;

большое количество нейронов участвует в обработке информации;

один нейрон связан с большим числом других нейронов (глобальные связи);

изменяющиеся по весу связи между нейронами;

массированная параллельность обработки информации.

Прототипом для создания нейрона послужил биологический нейрон головного мозга. Биологический нейрон имеет тело, совокупность отростков - дендридов, по которым в нейрон поступают входные сигналы, и отросток - аксон, передающий выходной сигнал нейрона другим клеткам. Точка соединения дендрида и аксона называется синапсом. Упрощенно функционирование нейрона можно представить следующим образом:

к нейрону от дендридов поступает набор (вектор) входных сигналов;

в теле нейрона оценивается суммарное значение входных сигналов;

нейрон формирует выходной сигнал, интенсивность которого зависит от значения вычисленного скалярного произведения;

выходной сигнал поступает на аксон и передается дендридам других нейронов.

Особенность такой системы в том, что входы нейрона не являются равнозначными. Каждый вход характеризуется некоторым коэффициентом, определяющим важность информации, которая поступает по нему.

Нейронная сеть представляет собой совокупность большого числа сравнительно простых элементов - нейронов, топология соединений которых зависит от типа сети. Чтобы создать нейронную сеть для решения какой-либо задачи, необходимо определить способ соединения нейронов между собой, и соответствующим образом подобрать значения весовых параметров на этих связях. Может ли влиять один элемент на другой, зависит от установленных соединений. Сила влияния определяется весом соединения.

Прежде чем рассматривать проблему обучения ИНС, приведем математическое определение функционирования отдельного нейрона. Оно осуществляется в два этапа:

находится суммарный взвешенный вход
, где Yi - уровень активности i-го элемента в предшествующем слое,
Wij - вес связи между i-м и j-м элементами; 2) вычисляется активность Yj с помощью некоторой функции от суммарного взвешенного входа. Обычно применяется сигма-функция:

Для обучения искусственных нейронных сетей решению какой-либо задачи использовалась следующая процедура. Сначала, сети предъявлялся набор тренировочных примеров, состоящих из вектора активностей входных элементов вместе с вектором желаемых активностей выходных элементов и сравнивалась действительная активность на выходных элементах с желаемой активностью. Затем высчитывалась ошибка, определяемая как квадрат разности между действительным и желаемым выходом. После этого для уменьшения ошибки изменялся вес каждой связи. Начиная с выходного слоя, эти действия выполняются последовательно для всех предшествующих слоев. Описанный процесс «распространения ошибки» (back propagation, [2,3]) повторялся со многими различными тренировочными примерами, для того чтобы научить сеть правильно их распознавать.

Алгоритм обратного распространения ошибки состоит из четырех шагов:

Вычислить, как быстро изменяется ошибка при изменении выходного элемента. Эта производная ошибки EA есть разность между действительной и ожидаемой активностью.

Вычислить, как быстро меняется ошибка по мере изменения суммарного входа, получаемого выходным элементом. Величина EI есть результат шага 1, умноженный на скорость изменения выходного элемента с изменением его суммарного входа.

Вычислить, как быстро меняется ошибка по мере изменения веса на входной связи выходного элемента. Результирующая величина EW есть результат шага 2, умноженный на уровень активности элемента, из которого исходит связь.

Вычислить, как быстро меняется ошибка с изменением активности элемента из предыдущего слоя. Этот ключевой шаг позволяет применять обратное распространение к многослойным сетям. Когда активность элемента из предыдущего слоя изменяется, это влияет на активности всех выходных элементов, с которыми он связан. Поэтому, чтобы подсчитать суммарное воздействие на ошибку, мы складываем все эти воздействия на выходные элементы. Это результат шага 2, умноженный на вес связи к соответствующему выходному элементу.

Используя шаги 2 и 4, мы можем преобразовать величины EA одного слоя элементов в EA предыдущего слоя. Эту процедуру можно повторять, чтобы вычислять EA стольких предыдущих слоев, сколько их есть. Зная EA для элемента, мы можем воспользоваться шагами 2 и 3, чтобы вычислить EW на его выходных связях и, соответствующим образом подстроить синаптические веса.

Рассмотренный метод может быть применен для распознавания качественного состава сложных кристаллов по их спектру фотолюминесценции. Пусть имеется некоторый спектр фотолюминесценции структуры на основе кристалла, описываемый функцией .

В качестве идентификационного параметра будем использовать величину энергии, излучаемой в достаточно узком i-м диапазоне длин волн которую можно оценить как интеграл по этому диапазону.

Разобьем спектр на n отрезков длиной h; будем считать, что на каждом из них спектр линейный. Т.е.

Величины Qi будут зависеть от большого числа параметров, однако их соотношения для одного и того же состава должны оставаться постоянными. Поэтому, чтобы снизить влияние посторонних факторов, в качестве характеристики i-го участка выберем , где .

Таким образом, спектру фотолюминесценции кристалла мы сопоставим n элементов Pi – значений, поступающих на вход нейронной сети. На выходе ИНС будем иметь 9 сигналов, соответствующих компонентам 3 и 5 групп. При обучении сети используем в качестве эталонов экспериментально полученные данные по спектрам кристалла на входе и единичные значения на выходах, соответствующих заданному составу. Остальные выходные значения устанавливаем нулевыми. Положительным будем считать состояние сети, когда все обучающие примеры будут давать отклик на требуемых выходах не менее 0,9; на остальных – не более 0,1. Качественный состав неизвестного образца будем оценивать по величине откликов нейронной сети.

Обработка исходных данных проводилась в два этапа и, соответственно, использовалось несколько ИНС. Первоначально оценивался качественный состав. ИНС при обучении, в качестве примеров предъявлялись спектры фотолюминесценции состава GaAsXBiYP1-X-Y/GaP (Рис. 1). При этом величине x придавались значения от 0,005 до 0,025, а y – от 0,0005 до 0,0020. Было использовано 22 образца. Выходные значения устанавливались соответственно качественному составу: 1 соответствовала компоненту, входящему в состав, 0 – всем остальным. При использовании метода обратного распространения ошибки удалось добиться удовлетворительного распознавания 100% обучающих примеров. На втором этапе была предпринята попытка идентифицировать количественный состав рассматриваемых составов.

Был выявлен интересный факт. ИНС оказалась чувствительной к изменениям Y, хотя придаваемые этому параметру значения были на порядок меньше значений X. Экспериментальные данные свидетельствуют о том, что даже малые изменения состава по Bi приводят к существенной перестройке зонной энергетической структуры кристаллов. Это обстоятельство объясняет указанную неравнозначность – устойчивость оптических свойств по отношению к изменениям X и неустойчивость по отношению к изменениям Y.

Полученные результаты позволяют предположить возможность успешного применения данного метода для других многокомпонентных систем. При этом, очевидно, существенно увеличится число выходов ИНС. Недостатком рассмотренного моделирования является то, что успешность попыток определения состава пропорциональна объему статистических данных по спектрам соединений, образующих исследуемый состав. Однако, в тех случаях, когда объем достаточно велик, состав новых образцов может быть оценен быстро и практически без материальных затрат, что, несомненно, предоставляет значительное преимущество для кристаллофизики и технологии многокомпонентных полупроводников. Представленная в настоящей работе методика может представлять интерес в различных областях современной физики, имеющих дело с графическим представлением характеристик вещества и поля.

Список литературы:

Колмогоров А.Н. О представлении непрерывных функций нескольких переменных суперпозициями непрерывных функций меньшего числа переменных // Докл. АН СССР, том 108, с. 2, 1956.

Almeida L.B. A learning rule for asynchronous perceptrons with feedback in a combinatorial environment. Proc. 1st IEEE Intl. Conf. on Neural Networks, vol. 2, pp. 609-618, San Diego, CA, June 1987.

Gilev S.E., Gorban A.N., Mirkes E.M. Several methods for acceleration the training process of neural networks in pattern recognition. USSR Academy of Sciences, Siberian Branch, Institute of Biophysics, Krasnoyarsk, 1990. Preprint N 146Б.

Степанов П. П. Искусственные нейронные сети // Молодой ученый. — 2017. — №4. — С. 185-187.

Просмотров работы: 5