Планирование с учетом минимальных временных и финансовых затрат является важной задачей. Динамическое программирование позволяет повысить результативность проектирования систем управления технологическим оборудованием.
Динамическое программирование появилось в 1951-1953 годах, благодаря работам Р. Беллмана. Динамическое программирование основано на принципе оптимальности Р. Беллмана, который заключается в замене решения исходной многомерной задачи последовательностью задач меньшей размерности. Принцип Р. Беллмана применяется для принятия решений в многоступенчатых процессах и формулируется следующим образом: если в каждом из состояний дальнейшее поведение системы не зависит от того, как она попала в это состояние, то дальнейшая траектория должна быть оптимальной. Траектория относится к последовательности состояний, в которых находится система.
В каждом из состояний системы известны воздействия, последствия и затраты на переход из одного состояния в другое. Пусть шаговое управление на этапе, , — количество этапов. Решение задачи сводится к определению последовательности воздействий на состояние системы при которой суммарные затраты минимальны
где — затраты на шаге.
В соответствии с принципом оптимальности Р. Беллмана, выбираются таким образом, чтобы суммарные затраты на последующие этапы были минимальны. Суммарные затраты зависят от состояния и складываются из затрат на шаге и на последующих шагах. Суммарные затраты на все этапы обозначим , тогда оптимальное управление на каждом шаге определяется по рекуррентному уравнению динамического программирования.
где — состояние системы; — затраты на этапе; — затраты на следующем этапе.
Рекуррентное уравнение динамического программирования выражает затраты на все оставшиеся этапы из любого состояния через затраты на данном и на всех последующих шагах . Для последнего шага затраты рассчитываются по формуле
где — затраты на последнем шаге .
Разработаем математическую модель динамического программирования оптимального размещения электронных компонентов на электромонтажной панели системы управления технологическим оборудованием.
Постановка задачи. Имеется окончательный набор электронных компонентов системы управления технологическим оборудованием, и известен приоритет и оценка эффективности размещения электронного компонента на электрической панели. Необходимо разместить электронные компоненты на панели таким образом, чтобы максимизировать общий эффект (полезность).
Размещение электронных компонентов на панели системы управления — многоэтапный процесс. Решение задачи определяется методом динамического программирования (метод Р. Беллмана).
Пусть — электронный компонент системы управления технологическим оборудованием ( — пустой электронный компонент), , — уникальное место размещения электронного компонента,, , — бинарная переменная ( — электронный компонент размещен на месте, иначе =0 ). Оценка эффективности (полезность) размещения электронного компонента на месте размещения.
Математическая модель оптимального размещения электронных компонентов системы управления имеет вид
Целевая функция при ограничениях
Ограничение 1 обеспечивает размещение одного электронного блока на панели схемы системы управления технологическим оборудованием на шаге.
Ограничение 2 обеспечивает уникальность места расположения электронного компонента на схеме системы управления.
Ограничение 3 налагает не отрицательность на искомые переменные.
Ограничение 4 налагает дискретность на искомые переменные.
Множество сформировано в результате решения задачи оптимизации структуры схемы системы управления модульной компрессорной станцией. Множество ранжировано. Это позволяет размещать в первую очередь значимые и ответственные электронные компоненты на электромонтажной панели системы управления.
Оценка эффективности (полезность) размещения электронного компонента на месте размещения, , представляет интегрированный показатель, учитывающий количественные и качественные характеристики электронных компонентов системы управления. К примеру, размеры и конструктивные особенности электронных компонентов, удобство монтажа и обслуживания, требования техники безопасности и т. д.
На рисунке 1 представлена сетевая модель задачи оптимизации размещения электронных компонентов системы управления.
Рисунок 1 - Декомпозиция задачи оптимизации размещения электронных компонентов системы управления на этапов
Динамическое программирование определяет наиболее подходящее решение -мерных задач путем ее декомпозиции на этапов. Вычислительное преимущество данного подхода состоит в том, что решается одномерная оптимизационная задача вместо — мерной задачи. Для решения задач методом динамического программирования используются рекуррентные алгоритмы прямой и обратной прогонки. В прямом алгоритме вычисления проводятся последовательно от первого этапа до последнего. В обратном алгоритме вычисления проводятся от последнего этапа до первого.
Если задано начальное состояние управляемой системы, то задача решается в обратном направлении, a если конечное, то в прямом. Если заданы как начальное, так и конечное состояния, то задача усложняется.
С вычислительной точки зрения алгоритм обратной прогонки более эффективный, чем алгоритм прямой прогонки.
Модели динамического программирования включают три основных элемента:
1. Определение этапов.
2. Определение на каждом этапе вариантов решения.
3. Определение состояний на каждом этапе.
В соответствии с поставленной целью в работе сформулированы следующие выводы.
Разработана математическая модель динамического программирования размещения электронных компонентов схемы системы управления модульной компрессорной станцией. Математическая модель позволяет сократить затраты и сроки проектирования схемы, повысить обоснованность принимаемых решений.