Главная Контакты Добавить в избранное Авторы Вопросы и ответы
,

УДК 681.51

CИНТЕЗ АДАПТИВНОЙ КВАЗИОПТИМАЛЬНОЙ ПО БЫСТРОДЕЙСТВИЮ СИСТЕМЫ УПРАВЛЕНИЯ ПРИ ВХОДНОМ ВОЗДЕЙСТВИИ ВИДА КВАДРАТИЧНОЙ ФУНКЦИИ И НАЛИЧИИ ОГРАНИЧЕННЫХ ПОМЕХ

Кучеров Д.П.

Введение. Вопросы создания оптимальных по быстродействию систем являются актуальной задачей теории автоматического управления и в настоящее время. В большинстве публикаций, посвященных этой теме, предлагаются подходы, основанные на полной информации об управляемом объекте и отсутствии помех в каналах измерения фазовых координат (см. напр. [1]).

Однако постановка задачи в такой форме не в полной мере отражает ситуацию, с которой приходится сталкиваться при проектировании систем. Как правило, точная математическая модель управляемой системы конструктору неизвестна, условия функционирования могут изменяться, в каналах измерения фазовых координат действуют помехи, стохастическая природа которых неизвестна.

Возможный выход в сложившейся ситуации основывается на адаптивном подходе. Некоторые вопросы применения этого подхода к построению квазиоптимальных по быстродействию систем изложены в [2, 3]. Так, в [2] показано решение задачи синтеза квазиоптимальной по быстродействию системы управления с линейной по неизвестным параметрам разделяющей функцией в условиях нерегулярных, нестохастических помех; в [3] предложен синтез финитного управления объектом, вращающимся в пространстве, разделяющая функция которого существенно нелинейна по неизвестным параметрам. Особенностью решения этих задач есть неизменность входного воздействия, т.е. синтезируемые в работах [2, 3] системы решают задачу стабилизации. Кроме того, алгоритмы, применяемые в [2, 3], обладают низкой скоростью сходимости.

Трудности, возникающие при синтезе следящих систем, связаны не только с реализацией оптимального управления в условиях отсутствия априорной информации о параметрах объекта, входного воздействия с наличием помех в каналах измерения координат, но и с выбором подходящего размера предполагаемой области достижимости вследствие асимметричности линии переключения (см., например, [4, c. 618]). Таким образом, задаваясь произвольным размером области достижимости, квазиоптимальность системы управления не гарантируется.

В работе ставится и решается задача синтеза эффективной адаптивной квазиоптимальной по быстродействию системы, обеспечивающей отработку входного воздействия в виде квадратичной функции за минимально возможное время при отсутствии априорной информации о параметрах объекта, входного воздействия и наличии ограниченных шумов в каналах измерения. Материалы работы существенно опираются на результаты работы [5], в которой предлагается интеграция различных подходов к задаче синтеза квазиоптимальной по быстродействию системы терминального управления в условиях априорной неопределенности.

Постановка задачи. Пусть имеется объект, заданный в виде уравнений состояния:

 

,

(1)

 

в которых z – вектор zT=(z1, z2) c координатами z1(t)=b(t), z2(t)=db(t)/dt, b(t) – характеризует закон изменения выходной величины; k>0, k – коэффициент передачи; u(t) - управляющее воздействие объекта, которое принимает только два возможных значения +1 и -1. Считается, что параметр k в уравнениях (1) неизвестен.

Предполагается, что имеется некоторое задающее воздействие a(t), которое представляет гладкую непрерывную функцию времени и может быть аппроксимировано функцией

 

,

(2)

 

где a0, a1, a2 – в каждом отдельном процессе постоянные величины. Считается, что сигналы z1(t), z2(t) и a(t), da(t)/dt, d2a(t)/dt2 измеряются с помехами

 

,

(3)

(4)

 

где |x1(t)|£N1, |x2(t)|£N2, |z1(t)|£N1, |z2(t)|£N2, |z3(t)|£N3, уровни помех N1, N2, N3 априори известны, как и в [2], при чем уровни N1, N2, N3 такие, что N1³N3, N2³N3.

Воздействие a(t) считается допустимым, если выполняется условие

.

(5)

 

Условие (5) предполагает, что точка z способна ²догнать² точку a.

Задача состоит в том, чтобы разработать методику синтеза квазиоптимальной по быстродействию следящей системы, воспроизводящей квадратичное воздействие a(t) для случая, когда параметры динамической системы (2) неизвестны, в каналах измерения координат системы присутствуют помехи, затраты на настройку неизвестных параметров регулятора должны быть по возможности малыми.

Cинтез квазиоптимальной по быстродействию следящей системы. Сделаем предположение на некоторое время о том, что известно значение параметра  в уравнениях (1), где d³0. Для этого случая вместо уравнений (1) воспользуемся уравнениями состояния относительно ошибки

 

(6)

 

где q1(t)=q(t)=a(t)-b(t) – ошибка следящей системы, T – время регулирования, априори неизвестное, W - область достижимости, которая определяется далее.

Введем в рассмотрение вектор vT(t)=(v1(t), v2(t)), v(t)ÎV, где

.

(7)

Следуя [2, 3], закон управления (уравнение регулятора) следящей системы выберем в форме

(8)

где

.

(9)

 

Выражение (9) определяет уравнение линии переключения, в котором dT=(d1, d2), v²= =(v²1, v²2)T – векторы, компоненты которых определяются следующим образом

.

(10)

 

Здесь l>0 – произвольное положительное число,

 ;

(11)

,

(12)

при t=0 и

(13)

при t>0, где DT=(D1, D2);

 

(14)

 

где |c1(t)|£|x1(t)+z1(t)|£2N1=D1, |c2(t)|£|x2(t)+z2(t)|£2N2=D2.

Замечание 1. Система уравнений состояния (6) имеет порядок n=2 и нулевые собственные значения. В соответствии с теоремой ²об n интервалах² оптимальное по быстродействию управление (8) для уравнений (6) имеет не более, чем два интервала. Кроме того, система уравнений (6) линейна по u(t) и управляющее воздействие u(t) на каждом интервале управления принимает свое предельное значение, следовательно, закон управления (8) удовлетворяет принципу максимума, а значит, является оптимальным законом управления. Время регулирования Т считается минимально возможным, если регулятор, реализующий закон управления (8), обеспечивает перемещение вектора v²(t) в некоторую окрестность начала координат WÎV\v(0) такую, что при d®0 окрестность W стягивается в начало координат. Такой регулятор, обеспечивающий перемещение вектора v(t) из произвольного начального состояния v(0) в W не более, чем за два интервала управления, будем называть квазиоптимальным, а W - областью достижимости.

Наличие шумов в каналах измерения координат позволяет сделать утверждение, что все точки v(0) фазовой плоскости V будут переводиться в некоторую окрестность W, которая не может быть произвольно малой. Размеры этой области в значительной степени будут определяться уровнями шумов N1, N2, N3, величиной d, а также зависят от начальных условий v(0). Естественно предположить, что если N1®0, N2®0, N3®0 и d®0, то и W®0.

Соотношение (13) совместно с (8) реализует своеобразную переключательную функцию signf(d, v) с гистерезисом, ²ширина гистерезиса² выбрана так, чтобы обеспечить выполнение неравенства 2|Di|³ |ci(t)| (i=1, 2) на интервале 0<t£T. Введение гистерезиса в переключательную функцию необходимо для исключения ложных переключений управления u(t) (см., например, [2, 3]) при движении вдоль линии переключения. Таким образом, имеет место следующая

Теорема. Пусть имеется объект вида (1), которому ставится задача воспроизвести задающее воздействие вида (2), тогда закон оптимального управления в форме (8) обеспечивает перемещение вектора координат v(t) объекта (1) из произвольного начального состояния v(0) в область WÎV\v(0) не более, чем за два интервала управления. Область W определяется объединением областей S+, S-, т.е.

,

(15)

где

, .

(16)

В (16) введены следующие обозначения wT=(w(1), w(2)), , , i=1, 2; тогда компоненты векторов ,  с учетом (6) в силу (5) имеют вид

 

,

(17)

,

(18)

,

(19)

,

(20)

 

где А – есть решение уравнения  в котором для уравнений (17), (18) коэффициенты l, m имеют вид

 

,

(21)

,

(22)

 

а для уравнений (19), (20)

(23)

.

(24)

 

Доказательство существенно опирается на результаты работы [4]; ввиду ограниченного объема статьи здесь не приводится.

Замечание 2. Закон управления (8) такой же, как и предложенный в [2, 3] ранее для системы работающей в режиме стабилизации, т.е. когда a(t)=const. В отличие от результатов работы [2, 3] область достижимости W, определяемая выражениями (17)-(20), не является симметричной относительно начала координат, что связано с необходимостью ²догона² встречной (область (17), (18)) или убегающей (область (19), (20)) точки a(t). Область W ²стягивается² в начало координат при отсутствии шумов x(i)(t), z(i)(t) и точном знании параметров d(i) в законе управления (8), т.е. при D1®0, D2®0 и d®0 область W®0, как и должно быть.

Алгоритм адаптации. Предположим теперь, что параметр  неизвестен. В этом случае закон управления будем строить по схеме (8) с учетом (9)-(13), заменяя в соответствующих выражениях неизвестный вектор  его подходящей оценкой , которая определяется на каждом (n-1)-м цикле перемещения вектора v²(t) из начального v²(0) в некоторое конечное положение.

Между тем, для построения алгоритма определения  необходимо знание размера области W, определяемой параметрами , , которые априори неизвестны, поскольку неизвестен вектор d. Вторая проблема, которая сразу же возникает, если область W определена каким-либо образом, это вопрос фиксации факта попадания (или не попадания) v(t) в W, ведь вектор v(t) недоступен для измерения.

Чтобы обойти упомянутые затруднения, попытаемся оценить наибольший размер области Wm при всех допустимых значениях d. В силу линейной зависимости выражений (17) — (20) с учетом (21)-(24) заключаем, что размер этой области находится как

,

(25)

где параметры  и  определяются с учетом границ области V, получаемых заменой в (22) и (24) значений v(0) на  или

, .

(26)

Следует заметить, что заключение о попадании точки v²(t) в область Wm, при любом максимальном размере Wm, сделать невозможно, так как в Wm фиксируется не истинный вектор v(t), а измеренный v¢(t). При этом вовсе не гарантируется существование такого случая, что вектор v¢(t) находится в области Wm, а вектор v(t) вне ее при любом размере Wm.

Для фиксации попадания фазовой точки v(t) в Wm воспользуемся результатом работы [6], где предложено попадание в область Wm регистрировать по факту наличия участка траектории в области Wm. Таким образом, если существуют такие моменты ti, ti+1, ti+2,…, что v¢(ti)ÎWm, v¢(ti+1)ÎWm, v¢(ti+2)ÎWm,…, то принимается решение о достижении объектом цели управления.

Теперь сформулируем алгоритм адаптации. Этот алгоритм предусматривает запоминание координаты точки пересечения траекторией движения v¢(tn) разделяющей поверхности  в первый раз. Обозначим через l(tn) общее число переключений к текущему моменту tn времени, начиная с момента t=0, тогда алгоритм адаптации строится в форме следующей рекуррентной процедуры:

 

(27)

 

Здесь PrX{×} обозначает операцию проектирования вектора  в область .

Исследование свойств алгоритма (27) для других объектов в [2, 3, 6] показывает, что скорость сходимости существенно зависит от выбора начального значения вектора . Повысить скорость сходимости алгоритма (27) удается применением идентификационного подхода, идея которого предлагалась в [5].

Алгоритм идентификации. Как и [5, 6], воспользуемся процедурой точечного оценивания, предполагающей принудительную периодическую дискретизацию сигналов u(t), v1(t), v2(t). Для этого неизвестные компоненты вектора  определим идентификацией параметров дискретных моделей, соответствующих уравнениям (7), в форме

 

,

(28)

.

(29)

 

Здесь t1, t2 - неизвестные величины, связанные с параметрами системы и периодом Т квантования сигналов q1, q2 по времени соотношениями

 

,

(30)

 

а  — приведенные к выходам интеграторов помехи измерения в каждый j-й дискретный момент времени, обладающие (в силу ограничений |x(1)(t)|<D1, |x(2)(t)|<D2) свойствами , . Следует отметить, что уравнения (28), (29) справедливы только для тех интервалов дискретности, когда управление u(t) остается неизменным, т.е. для всех tÎ[(j-2)T, jT].

В качестве алгоритма получения точечных оценок неизвестных t1[j], t2[j] в (28), (29) возьмем идентификационную процедуру вида

 

(31)

(32)

 

где e[j]=t1(u[j-1]+u[j-2])-q1[j]+2q1[j-1]-q1[j-2], e1[j]=t2u[j-1]-q2[j]+q2[j-1] - ошибки идентификации моделей (28), (29); g[j] - свободный параметр, выбираемый из условия  таким образом, чтобы выполнить требование , ; вектор t[0] может принимать произвольное значение.

Процедура (31), (32) представляет собой рекуррентный алгоритм решения неравенств (см., например, ²Полоска-1² [7])

 

(33)

(34)

 

относительно неизвестных . Неравенства (33), (34) получаются прямо на основании (28), (29) с учетом ограничений .

Переход от оценок , полученных с помощью процедур идентификации (31), (32), к оценкам вектора  алгоритма адаптации (28) осуществляется по уравнениям связи

 

, ,

(35)

, .

(36)

 

Методика. Предлагаемая методика заключается в следующем:

1. Для объекта (1) предварительно устанавливаются исходные данные: начальные условия v(0), начальный вектор , область Wm.

2. Осуществляется прогон системы, в процессе которого вектор  корректируется с помощью процедур идентификации (31), (32).

3. Проверяется выполнение условий квазиоптимальности (попадание в область Wm не более, чем за два интервала управления), в случае необходимости осуществляется коррекция  с помощью процедуры адаптации (27).

4. Устанавливается новое значение  и осуществляется очередной прогон следящей системы.

Результаты моделирования. Эффективность предлагаемой методики проводилось моделированием адаптивного регулятора (8), (9), (27), (31), (32) при воспроизведении воздействия a(t)=t2 объектом (1) с параметром k=3 с-2, при различных начальных условиях vT(0)={z1(0), z2(0)}. Предварительно установлено, что объект (1) из начального состояния vT(0)=(-5, 0) перемещается за два интервала управления в начало координат за время topt= 3,54 c, считающееся оптимальным, с оптимальным dopt=(2,33, 0,167) и в отсутствии помех.

При наличии помех x1(t), x2(t), действующих по каналам измерения фазовых координат, объект (1) удается перевести в область W также за два интервала управления, время регулирования становится равным t*opt= 3,62 c, параметры области S+ÌW рассчитаны в условиях решения задачи по формулам (19), (20) и равны S+=(0,34, 1,07).

Далее проводилась оценка эффективности предлагаемого алгоритма адаптации. Выбирался произвольным образом начальный вектор d0, например, . При тех же начальных условиях алгоритмом адаптации (28) за n=13 циклов испытаний получен вектор , при котором в следящей системе реализуется квазиоптимальный по быстродействию процесс. Применение алгоритма обучения (27) совместно с процедурами точечной идентификации (31), (32) позволило за n=3 цикла испытаний получить вектор настроечных параметров .

Результаты моделирования приведены на рис. 1-3. Рис. 1 показывает динамику системы во временной плоскости на первом, а рис. 2 на последнем цикле испытаний. На рисунках использованы обозначения q(t) – ошибка следящей системы,  - ее производная, u(t) – управляющее воздействие, a(t) – задающее воздействие, b(t) – выходная величина.

Рис.1 Переменные a(t), b(t), q(t),  и управление u(t) на первом цикле

 

Из рис.1 видно, что для воспроизведения воздействия a(t) с заданной точностью следящей системе при произвольно выбраном векторе d0 понадобилось 10 интервалов управления u(t), что привело к увеличению времени регулирования на 12 % (по сравнению с оптимальным). После выполнения алгоритма адаптации в следящей системе устанавливается квазиоптимальный по быстродействию процесс, т.е. заданная ошибка слежения, определяемая областью S+, устанавливается за два интервала управления (см. рис.2), проигрыш во времени регулирования не превышает 2,4 %. Применение процедуры точечной идентификации позволило сократить общее время адаптации в 6 раз.

 

Рис. 2 Переменные a(t), b(t), q(t), , u(t) после окончания процесса адаптации

 

Сходимость алгоритма (27), (31), (32) оценивалась функцией

 

,

(37)

 

где коэффициент l выбирался равным l=10000. Вид функции Wn показан на рис.3, ее убывающий характер свидетельствует о сходимости процесса адаптации.

 

Рис. 3 Функция Wn

 

Выводы

1.                  Сходимость предлагаемого алгоритма адаптивной квазиоптимальной по быстродействию следящей системы, которая воспроизводит квадратичное воздействие, существенно зависит от выбора начальной оценки вектора d0.

2.                  Совместное использование алгоритмов точечной идентификации и обучения позволяет улучшить показатели процесса адаптации, а именно повысить скорость его сходимости.

3.                  Квазиоптимальный по быстродействию процесс в следящей системе возможен после окончания процесса адаптации.

1.                  Предполагается, что дальнейшие исследования будут направлены на изучение функционирования адаптивного регулятора для объектов более высокого порядка.

The technique of synthesizing of adaptive time-quasioptimal of a servo-mechanism is offered. A feature of a technique is the application of a procedure of tutoring of a pattern recognition together with a procedure of a dot estimation. The considered approach allows considerably to increase efficiency of a procedure of adaptation.

 

1. Крутько П.Д. Исследование динамики субоптимальных по быстродействию автоматических систем // Известия Академии наук. Теория и системы управления. – 2004. - № 2. - С. 16-33.

2. Кучеров Д.П. Решение одной задачи синтеза адаптивной системы управления, квазиоптимальной по быстродействию, при наличии ограниченного шума // Кибернетика и вычисл. техника. – 1999. – Вып. 122. – С. 13 – 22.

3. Кучеров Д.П. Синтез адаптивного регулятора для финитного управления вращающимся телом при наличии ограниченных помех // Проблемы управления и информатики. – 2005. - № 1. – С. 38-48.

4. Фельдбаум А.А., Бутковский А.Г. Методы теории автоматического управления. – М.: Наука, 1971. – 744 с.

5. Кучеров Д.П., Скурихин В.И., Житецкий Л.С. Интеграция информационных технологий при обучении принятию решений в задачах терминального управления // УСИМ. – 2003. - № 5. – С. 30-41.

6. Кучеров Д.П. Алгоритм адаптивного терминального управления одним неминимально-фазовым объектом в условиях ограниченных помех // Вестник Харьковского НТУ ²ХПИ². – 2005. - №55. - С. 121-126.

7. Фомин B.Н., Фрадков А.Л., Якубович В.А. Адаптивное управление динамическими объектами. – М.: Наука, 1981. – 441 с.

 

 





Ответы на вопросы [_Задать вопроос_]

Читайте также

 
Кучеров Д.П. Алгоритм обучения субоптимальному по быстродействию управлению динамической системой второго порядка без нулевых полюсов

Михайленко В.С., Никольский В.В. Использование нечеткой адаптивной системы управления для компьютерного мониторинга сетью котельных установок

Балтовский А.А. Выбор критериев эффективности функционирования адаптивной автоматизированной системы управления, ее подсистем и промышленного производства

Усов А.В., Ситников В.С. Возможности построения передаточных функций линейных цифровых частотно-зависимых вторичных преобразователей по частотным характеристикам

68 Различные отрасли промышленности и ремесла, производящие конечную продукцию. Точная механика

Митрахович М.М. Интеграция методов при синтезе сложных систем в условиях априорной неопределенности

Шутеев Э.И., Белокопытов Д.О. Определение постоянной составляющей сигналов методом адаптации

Клименко А.К. Об использовании дискретной обратной модели в системах с интегрирующим звеном

Кучеров Д.П., Василенко А.В., Иванов Б.П. Алгоритм адаптивного терминального управления динамической системой с элементом дифференцирования

Орлов В.В. Влияние квантования обучающих выборок на эффективность цифровых адаптивных фильтров компенсации помех.

Клименко А.К. О получении желаемых показателей качества адаптивной системы с обратной моделью

Кучеров Д.П., Копылова З.Н. Принципы построения интеллектуального автору-левого

Ходаков В.Е., Ходаков Д.В. Адаптивный пользовательский интерфейс: проблемы построения

Яковенко А.Е. Проектирование автоматизированных систем принятия решений в условиях адаптивного обучения с учетом требований болонского процесса

Методы построения адаптивных систем управления

Михайленко В.С., Ложечников В.Ф. Методы настройки нечеткого адаптивного ПИД-регулятора

Щокін В.П., Сушенцев О.О., Коломіц Г.В. Інтелектуальна система управління з нечітким адаптивним емулятором

Михайленко В.С., Ложечников В.Ф. Анализ методов разработки нечетких САР для управления сложными взаимосвязанными объектами

Кучеров Д.П., Василенко А.В., Иванов Б.П. Алгоритм адаптивного терминального управления динамической системой с элементом дифференцирования

Клименко А.К. О получении желаемых показателей качества адаптивной системы с обратной моделью

Шутеев Э.И., Белокопытов Д.О. Определение постоянной составляющей сигналов методом адаптации

Митрахович М.М. Интеграция методов при синтезе сложных систем в условиях априорной неопределенности

Клименко А.К. Об устранении колебательности адаптивной системы в промежутках дискретного времени

Балтовский А.А. Выбор критериев эффективности функционирования адаптивной автоматизированной системы управления, ее подсистем и промышленного производства

Малахов В.П., Ситников В.С., Яковлева И.Д. Адаптивная перестройка цифрового фильтра в системе автоматического управления.

Клименко А.К. Об обеспечении сходимости процесса адаптации посредством воспроизведения измерительной программы в обратном времени.

Михайленко В.С., Никольский В.В. Использование нечеткой адаптивной системы управления для компьютерного мониторинга сетью котельных установок

Ковриго Ю.М., Мовчан А.П., Полищук И.А., Фоменко Б.В. Адаптивное управление теплоэнергетическими процессами

Клименко А.К. Об ускорении сходимости процессов в адаптивной системе с обратной моделью

Вишневский Л.В., Веретенник А.М., Войтецкий И.Е. Выбор критерия для оценки процесса включения генераторов на параллельную работу

Носов П.С. Принятие адаптивной стратегии при формировании траектории обучения в пространстве.

Ковриго Ю.М., Фоменко Б.В., Поліщук І.А. Адаптивна система регулювання витрати палива.

Клименко А.К. Об оптимизации коэффициента усиления в адаптивной системе с обратной моделью.

Бобриков С.А., Пичугин Е.Д. Коррекция нелинейной характеристики типа «реле с зоной нечувствительности».

Ладанюк А.П., Заєць Н.А., Луцька Н.М. Застосування адаптивних систем керування для нестаціонарних об'єктів технологічних комплексів неперервного типу.

Ковриго Ю.М., Мовчан А.П., Полищук И.А. Метод построения самонастраивающихся регуляторов для промышленного применения.

Балтовский А.А. Способ адаптивной алгоритмизации задач расчета производст-венной программы.

Орлов В.В. Эффективность адаптивных фильтров при расстройке принимаемого и опорных сигналов.