Возможности использования метода нейронных сеток в задачах исследования состава многокомпонентных структур электронной техники - Студенческий научный форум

XI Международная студенческая научная конференция Студенческий научный форум - 2019

Возможности использования метода нейронных сеток в задачах исследования состава многокомпонентных структур электронной техники

Капран Е.П. 1, Благина Л.В. 1
1ИТ (филиал) ДГТУ в г.Волгодонске
 Комментарии
Текст работы размещён без изображений и формул.
Полная версия работы доступна во вкладке "Файлы работы" в формате PDF

Введение

Важной проблемой в исследовании свойств искусственно синтезируемых полупроводниковых соединений является высокая стоимость анализа их состава. В настоящее время такой анализ основан на рентгенодифрактометрических (характеризуются одновременной регистрацией интенсивности и направления дифрагированных лучей) и электронноскопических (характеризуются использованием электронных микроскопов) методах. Такие установки имеются только в крупнейших исследовательских центрах металлургии и электроники. Однако, широкие возможности анализа веществ заложены в современных информационных технологиях. В настоящее время обсуждается попытка использования технологии, основанной на методе искусственных нейронных сетей (ИНС), для распознавания химического состава сложных полупроводниковых структур.

Искусственная нейронная сеть (ИНС) – это математическая модель, построенная по принципам живых нейронных сетей. К этим принципам можно отнести [1]:

простой обрабатывающий элемент - нейрон;

большое количество нейронов участвует в обработке информации;

один нейрон связан с большим числом других нейронов;

изменяющиеся по весу связи между нейронами;

массированная параллельность обработки информации.

Прототипом для создания искусственного нейрона послужил биологический нейрон головного мозга. Биологический нейрон имеет тело, дендриты - совокупность отростков, по которым в нейрон поступают входные сигналы, и аксоны - отростки, передающий выходной сигнал нейрона другим клеткам. Синапсом называется точка соединения дендрита и аксона. Можно упрощенно представить функционирование нейрона следующим образом [2]:

нейрон получает от дендритов набор (вектор) входных сигналов;

в теле нейрона оценивается суммарное значение входных сигналов;

нейрон формирует выходной сигнал, интенсивность которого зависит от значения вычисленного скалярного произведения;

выходной сигнал поступает на аксон и передается дендритам других нейронов.

Однако нужно обратить внимание на то, что входы нейрона неравнозначны. Каждый вход характеризуется некоторым весовым коэффициентом, который определяет важность поступающей к нему информации. Благодаря этому, нейрон не просто суммирует значения входных сигналов, а вычисляет скалярное произведение вектора входных сигналов и вектора весовых коэффициентов.

Нейронная сеть представляет собой совокупность большого числа сравнительно простых элементов - нейронов, топология соединений которых зависит от типа сети. Чтобы создать нейронную сеть для решения какой-либо конкретной задачи, необходимо выбрать способ соединения нейронов друг с другом, и соответствующим образом подобрать значения весовых параметров на этих связях. От установленных соединений зависит, может ли влиять один элемент на другой. Сила влияния определяется весом соединения.

ИНС на данный момент нашли свое применение в системах обработки сигналов, распознавания образов, предсказания и диагностики, в робототехнических и бортовых системах. Нейронные сети обеспечивают решение сложных задач за времена порядка времени срабатывания цепочек электронных и/или оптических элементов. Решение слабо зависит от неисправности отдельного нейрона. Это делает их удобными для использования в интеллектуальных системах разнообразных направлений.

Моделирование ИНС и их обучение

Для решения поставленной задачи нами была использована многослойная ИНС прямого распространения, то есть всякое направление связи идет от входа к выходу; слои имеют общие входы, выходы которых связаны со следующим слоем (Рис.1.).

Для оценки числа нейронов в слоях однородных нейронных сетей можно воспользоваться формулой для необходимого числа синоптических весов Nw в многослойной сети с сигмоидальными передаточными функциями [3]:

где Ny - размерность выходного сигнала, Np - число элементов обучающей выборки,
Nx - размерность входного сигнала.

Оценив необходимое число весов, можно рассчитать число нейронов в скрытых слоях. Например, число нейронов в двухслойной сети составит:

Аналогично можно рассчитать число нейронов в сетях с большим числом слоев.


Рис. 1. Нейронная сеть с одним скрытым слоем.

Нейронные сети не программируются в привычном смысле слова, они обучаются. Технически обучение состоит в том, чтобы найти коэффициенты связей между нейронами. Обучаясь нейронная сеть может выявлять сложные зависимости между входными и выходными данными, а также выполнять обобщение.

Для того, чтобы научить ИНС принимать решения используется следующая процедура. Вначале, сети предъявлялась серия тренировочных примеров, состоящих из системы активностей (вектора) входных элементов и желаемой системой активностей выходных элементов и сравнивалась действительная активность на выходных элементах с желаемой активностью. Затем подсчитывалась ошибка, определяемая как квадрат разности между действительным и желаемым выходом. После этого уменьшались ошибки при помощи изменения веса каждой связи. Начиная с выходного слоя, эти действия выполняются последовательно для всех предыдущих слоев. Описанный процесс тренировки повторялся со многими различными тренировочными примерами, для того чтобы научить сеть правильно их распознавать. В литературе такой подход получил название метода обратного распространения ошибки (back propagation).

Алгоритм обратного распространением состоит из четырех шагов [4]:

Вычислить, насколько быстро меняется ошибка при изменении выходного элемента. Эта производная ошибки (EA) является разностью между действительной и ожидаемой активностью.

где Yj -уровень активности j-го элемента в верхнем слое, Dj -желаемый выход j-го элемента.

Вычислить, с какой быстротой изменяется ошибка по мере изменения суммарного входа, получаемого выходным элементом. Эта величина (EI) является результатом шага 1, умноженным на скорость изменения выходного элемента с изменением его суммарного входа.

Вычислить, как быстро изменяется ошибка по мере изменения веса на входной связи выходного элемента. Эта величина (EW) является результатом шага 2, умноженным на уровень активности элемента, из которого исходит связь.
где Yi - уровень активности i-го элемента в предшествующем слое.

Вычислить, насколько быстро изменяется ошибка с изменением активности элемента из предыдущего слоя. Этот ключевой шаг позволяет применять обратное распространение к многослойным сетям. Когда активность элемента из предыдущего слоя изменяется, это влияет на активности всех выходных элементов, с которыми он связан. Из-за этого, чтобы подсчитать суммарное воздействие на ошибку, мы складываем все эти воздействия на выходные элементы. Но эти воздействия нетрудно подсчитать. Это результат шага 2, умноженный на вес связи к соответствующему выходному элементу.

где Wij - вес связи между i-м и j-м элементами.

Пользуясь шагами 2 и 4, возможно преобразовать величины EA одного слоя элементов в EA предыдущего слоя. Эту процедуру можно повторять, чтобы вычислять EA всех предыдущих слоев, какие есть. Зная EA для элемента, мы можем воспользоваться шагами 2 и 3, чтобы вычислить EW на его выходных связях и, соответствующим образом подстроить синаптические веса.

Модель идентификации химического состава многокомпонентных твердых растворов.

Будем использовать нейронную сеть для распознавания качественного состава МТР по их спектру фотолюминесценции. При обучении сети используем в качестве эталонов экспериментально полученные ранее данные по спектрам МТР на входе и единичные значения на выходах, соответствующих заданному МТР. Остальные выходные значения устанавливаем нулевыми. Удовлетворительным будем считать состояние сети, когда все обучающие примеры будут давать отклик на требуемых выходах не менее 0,9; на остальных – не более 0,1. Качественный состав неизвестного образца будем оценивать по величине откликов нейронной сети – максимальные значения будут соответствовать наиболее вероятным компонентам представленного образца.

Обсуждение результатов и выводы

Обработка исходных данных проводилась в два этапа и, соответственно, использовалось несколько ИНС.

Первоначально оценивался качественный состав МТР. ИНС при обучении, в качестве примеров предъявлялись спектры фотолюминесценции МТР InSbXBi1-X/InSb и GaAsYP1-Y/GaP. При этом x принимал значения от 0,005 до 0,025, а y – от 0,005 до 0,300. Всего было использовано более 70 образцов. Шесть выходных значений (Ga,In,P,As,Sb,Bi) устанавливались соответственно качественному составу МТР: 1 соответствовала компоненту, входящему в МТР, 0 – всем остальным.

При использовании метода обратного распространения ошибки удалось добиться удовлетворительного распознавания 100% обучающих примеров. Для проверки правильности функционирования ИНС были предъявлены спектры (рис.2,3), не входившие в обучающую выборку. Они были успешно идентифицированы.

На втором этапе была предпринята попытка идентифицировать количественный состав рассматриваемых МТР. Для этого использовались две различные ИНС, структуры входов которых остались прежними.

ИНС структуры InSbXBi1-X/InSb имела 10 выходов, соответствующих значению x от 0,006 до 0,024 с шагом 0,002. (Единичное значение устанавливалось только на одном из них.)

После обучения, ИНС достоверно определила содержание Bi в тестовых образцах InSbXBi1‑X/InSb (рис.2.а, б)

В случае обучения третьей ИНС для структуры GaAsYP1-Y/GaP возникли некоторые трудности - не удалось определить состав точнее 0,01. Это можно объяснить, с одной стороны, недостаточным объемом статистических данных; с другой стороны, тем, что вариации y вызывают сравнительно слабое, близкое к линейному изменение спектра фотолюминесценции, в то время как даже незначительное изменение содержания Bi приводит к заметным изменениям спектров.

0,15

0,55 λ,мкм

Тем не менее использование ИНС с 30 выходами (y=0,01; y=0,02;y=0,03; …; y=0,30) позволило также удовлетворительно оценить содержание As в образцах GaAsYP1-Y/GaP (рис.3.а, б).

Полученные результаты позволяют предположить возможность применение данного метода и для более сложных четырех- и пятикомпонентных систем. При этом резко возрастет число выходов ИНС. Эту проблему можно решить, используя данные по областям существования ТР, а для компонентов, слабо влияющих на спектр фотолюминесценции, использовать только один выход – присутствует ли этот компонент в МТР. Очевидно, описанная методика может быть эффективно использована и для решения других проблем технологии полупроводниковых материалов – там, где возможно применение методов идентификации и прогнозирования с помощью ИНС.

Список литературы:

Куссуль В.М., Байдык Т.Н. Разработка архитектуры нейроподобной сети для распознавания формы объектов на изображении // Автоматика. 1990. № 5. С. 56-61.

А.С.Тоноян// Прогнозирование на основе нейронных сетей.

URL: http://it-claim.ru/Library/Books/ITS/wwwbook/ist5/glava_3/3_11.htm (дата обращения 20.12.2018).

Widrow B., Lehr M.A. 30 years of adaptive neural networks: perceptron, madaline, and backpropagation // Proceedings of the IEEE, vol. 78, No. 9, September, 1990, p. 1415-1442.

Джеффри Е. Хинтон. Как обучаются нейронные сети // В мире науки. 1992. № 11–2. C. 103-107.

Просмотров работы: 3