ЧИСЕЛЬНЕ РОЗВ’ЯЗАННЯ ЗАДАЧ оптимального керування
1 Дискретизація задачі із закріпленим лівим і вільним правим кінцем. Необхідні умови оптимальності
Розглянемо неперервну задачу оптимального керування
,(1)
,(2)
, , . (3)
Виконаємо дискретну апроксимацію даної задачі. Для цього розіб’ємо відрізок точками , і будемо обчислювати значення цільового функціонала і закону руху тільки в точках розбиття: , , . Закон руху в цьому випадку можна записати у вигляді:
.
Тепер дискретна задача оптимального керування, що апроксимує неперервну задачу (1) – (3), матиме вигляд:
, , (4)
, (5)
(6)
, . (7)
Для пошуку оптимального розв’язку отриманої дискретної задачі може бути застосований метод множників Лагранжа. Функція Лагранжа має вигляд:
,
,(8)
де .
Обмеження на керування введемо далі, під час реалізації чисельного методу. Відзначимо, що перед першим доданком стоїть знак «–», оскільки і якщо не додавати «–», то характер екстремуму початкової функції зміниться.
Якщо – локально-оптимальний процес для задачі (4) – (7), то існують такі нерівні одночасно нулю множники Лагранжа , , , , що матимуть місце наступні умови:
1. або
,
,
. (10)
2. або
,
. (11)
Із (9) одержимо ітераційні співвідношення для спряжених змінних , а з (10) – співвідношення для :
, (12)
. (13)
Перепишемо співвідношення (12) у вигляді:
.
Очевидно, що останнє співвідношення є аналогом спряженої системи для неперервних задач керування. Дійсно,
.
Якщо , то з останнього співвідношення одержимо
.
Зі співвідношення (13) випливає, що .
Сформулюємо критерій оптимальності для задачі (4) – (7). Вважатимемо, що функції , неперервно-диференційовані за змінними і опуклі за . Тоді для локально-оптимального процесу існують такі множники Лагранжа , , , , не всі рівні нулю одночасно, що матимуть місце необхідні умови екстремуму:
1) умови стаціонарності в точці :
;
2) . (14)
Розпишемо (14), використовуючи вираз для функції Лагранжа:
Перетворимо вираз під знаком мінімуму, переходячи до довільного :
Або
Якщо , то з останнього співвідношення одержимо
2 Ітераційний метод розв’язання дискретної задачі оптимального керування з двійним перерахуванням
Розглянемо ітераційний метод пошуку оптимального керування задачі (4) – (7). Суть методу полягає в тому, що на кожній ітерації обчислюються два вектори: і . Перший із них містить -е наближення для керувань у моменти часу для системи (14), при , а другий – -е наближення для фазових станів системи в ці ж моменти часу. Отже, на кожній ітерації ми одержуємо процес , що є -м наближенням до шуканого оптимального процесу.
Контроль у методі подвійного перерахування полягає в повторному перерахуванні результатів задачі і порівнянні отриманих даних для різних значень кроку розбиття. У випадку розбіжності виконується корекція і обчислення повторюються.
Розглянемо алгоритм методу.
1. Задаємо крок розбиття та точність обчислень .
2. Задаємо початкове наближення – припустимий набір керувань на кожному кроці – початкову стратегію керування:
, , ,
де – наближення керування в момент на ітерації .
3. За визначеною в п. 2 стратегією керування будуємо фазову траєкторію процесу
, ,
на початкової ітерації , використовуючи початкові умови і різницеві співвідношення, що апроксимують рівняння руху:
, .
4. Визначаємо початкове наближення відповідно до (5).
5. Знаходимо спряжені змінні за формулами (12) – (13).
Визначаємо наступні наближення до оптимального керування ,
в момент як розв’язки задачі (15) або (16):
, .
7. Обчислюємо відповідну стратегії траєкторію
за формулами (4), (6):
, , .
8. Знаходимо наступне наближення цільового функціонала
за формулою (5).
9. Якщо , то переходимо до п. 10, інакше вважаємо, що
, , і переходимо до п. 13.
10. Перевіряємо, чи виконується задана точність обчислень. Якщо
і ,
то переходимо до п. 13, інакше – до п. 11.
11. Позначаємо
, , .
12. Виконуємо наступний крок ітераційного методу – п. 5.
13. Позначаємо
, , – розв’язок, отриманий із кроком розбиття .
1 Якщо крок не ділився, то переходимо до п. 15, інакше – до п. 1
15. Ділимо крок
. Тоді і переходимо до п. 2 при .
1 Перевіряємо задану точність. Якщо
і ,
то переходимо до п. 18, інакше переходимо до п. 17.
17. Позначаємо
, , , , і переходимо до п. 15 – наступного кроку подвійного перерахування.
18. , , – розв’язок задачі.
Кінець алгоритму.
3. Оптимальне стохастичне керування: формулювання із зовнішнім інтегралом
Розглянемо відображення , що задане формулою
, (17)
за таких припущень:
параметр приймає значення з вимірного простору . Для будь-якої фіксованої пари задана ймовірнісна міра на просторі , а символ у формулі (12) означає зовнішній інтеграл відносно цієї міри. Отже,
;
функції і відображують множину відповідно в множини і , тобто , ;
скаляр додатний.
Формули (1), (6) є окремими випадками відображення з (12). Очевидно, що відображення (1) для детермінованої задачі випливає з (12), якщо множина складається з єдиного елемента, а відображення (6) (для стохастичної задачі зі зліченним простором збурень) відповідає випадку, коли множина зліченна, а є -алгеброю, складеною із всіх підмножин .
Очевидно, що відображення з (12) задовольняє припущенню монотонності. Якщо на множини , і функції , і накласти вимоги вимірності, то витрати за кроків можна визначити в термінах звичайного інтегрування для будь-якої стратегії , для якої функції , вимірні.
Для початкового стану і стратегії ймовірнісні міри
, ...,
у сукупності із системою рівнянь
, (18)
визначають єдину міру на -кратному прямому добутку копій простору . У випадку, якщо , , і виконується одна з умов
або
,
то функція витрат за кроків, що відповідає вимірній стратегії , приводиться до звичайного вигляду
,
де стани , виражено як функції змінних , ..., за допомогою рівнянь (13) та початкового стану .
Рекурентне співвідношення методу динамічного програмування для розв’язання багатоетапних задач оптимального стохастичного керування зі скінченним горизонтом можна записати так:
, ,
де – щільність розподілу величини .
4 Оптимальне стохастичне керування: мультиплікативний функціонал витрат
Розглянемо відображення , що задане формулою
, (19)
за припущення, що параметр приймає значення зі зліченної множини відповідно до заданого розподілу ймовірностей, що залежать від стану і керування . Вважатимемо також, що , , , . Тоді відображення з формули (14) задовольняє припущенню монотонності.
Якщо , , то задача оптимального керування з мультиплікативним функціоналом витрат і скінченним горизонтом матиме такий вигляд:
, (20)
. (21)
а відповідна задача з нескінченним горизонтом:
, (22)
. (23)
Границя в (23) існує, якщо : або .
Самостійний інтерес становить задача з експоненціальною функцією витрат
,
,
де .
Для розв’язання багатоетапних задач оптимального стохастичного керування з мультиплікативним функціоналом витрат використовується таке рекурентне співвідношення алгоритму динамічного програмування:
, ,
де – щільність розподілу величини .
5. Мінімаксне керування
Розглянемо задачу керування системою, у якій некерованими впливами є стратегії супротивника (або явища природи) , , що обираються залежно від поточного стану і керування . Вважатимемо, що припустимі стратегії супротивника приймають значення із множини , . Будемо обчислювати стратегію керування , орієнтуючись на найгіршу поведінку супротивника. Розглянемо відображення , задане формулою
,
за таких припущень:
параметр приймає значення з деякої множини , а – непуста підмножина при будь-яких , ;
функції і відображують множину в множини та відповідно, тобто , ;
скаляр додатний.
За таких умов припущення про монотонність для відображення має місце. Якщо при цьому , і для всіх , , , то відповідну -крокову задачу мінімаксного керування можна сформулювати так:
, (17)
. (18)
Задача з нескінченним горизонтом формулюється аналогічно:
, (24)
. (25)
Границя у співвідношенні (25) існує при виконанні будь-якої з умов:
, , , ;
, , , ;
, , , , і деякого .
Для розв’язання багатокрокових мінімаксних задач оптимального стохастичного керування рекурентне співвідношення алгоритму динамічного програмування використовується у такому вигляді:
, ,
,
.
Другие работы по теме:
Необхідні умови оптимальності. Принцип максимуму Понтрягіна
Сутність загальної задачі керованості. Аналіз основних властивостей оптимальних керувань. Доказ теореми – "Принцип максимуму Понтрягіна", особливості її застосування для задачі оптимальної швидкодії. Методика перевірки траєкторій задачі на оптимальність.
Зварювання неплавким електродом в захисному газі
Зміст Вступ Аналіз процесу зварювання Структура дослідницької установки Література Вступ Моніторинг зварних з’єднань за електричними показниками дуги в процесі зварювання в середовищі інертних газів (Аr) неплавким електродом, дозволяє виявляти дефекти, котрі можуть виявитись під час зварювання.
Керування точністю обробки
Керування точністю процесу обробки заготовок за вихідними даними. Керування пружними переміщеннями елементів технологічної системи для усунення систематичних та змінних систематичних похибок, які викликають похибки геометричної форми заготовок.
Налагоджування та програмування промислового робота МП-9С
Основні системи у складі промислового робота: виконавча (рушійна), керуюча (інтелектна), інформаційно-вимірювальна (сенсорна) та система зв'язку. Налагоджування та програмування робота, основні режими роботи. Розробка програми для виконання операцій.
Метод динамічного програмування
1 Принцип оптимальності Оптимальне керування в будь-який момент часу не залежить від передісторії процесу і визначається тільки станом системи в поточний момент і метою керування. Якщо в якийсь період часу керування було неоптимальним, то наслідки цього в майбутньому виправити вже не можна. Під метою керування розуміються вимоги, яким повинна задовольняти керована система, наприклад, це може бути приведення системи в заданий стан або забезпечення певних умов руху протягом заданого періоду часу.
Фазовая автоподстройка в относительной фазовой манипуляции ОФМн
Graphics Фазовая автоподстройка (ФАП) в приемниках ОФМн радиосигналов. Схемы Пистолькорса и Сифорова Graphics Безусловная оценка фазы Graphics Схема оптимального приемника ФМн-радиосигналов с флюктуирующей начальной фазой (переприсвоение оценки фазы) Graphics
Оптимальність у системах керування
1. Умови оптимальності у неавтономних системах керування У загальному випадку неавтономної системи права частина закону руху й підінтегральна функція цільового функціонала залежать явно від часу
Окремі випадки задач оптимального стохастичного керування
1. Зовнішній інтеграл Функції можуть бути довільними, а математичні сподівання можна обчислювати, якщо як функція від є вимірною. Якщо ж оптимальна стратегія, отримана в результаті оптимізації, виявиться невимірною, то і функція
Постановка задачі оптимального керування
Теорія оптимального керування; об’єкт як система, що функціонує під впливом певного фактора, здатного регулювати її еволюцію. Крайові умови задачі оптимального детермінованого керування. Числові характеристики критеріїв якості. Задачі з дискретним часом.
Системи та засоби відображення інформації
Забезпечення індикації інформації навігаційних систем літака, електронні пілотажні прилади: пульт керування, генератор символів, метеолокатор, перемикач вибору режиму; типова індикація електронного директорного авіагоризонту і горизонтального положення.
Чисельне розв’язання задач оптимального керування
Дискретизація задачі із закріпленим лівим і вільним правим кінцем. Необхідні умови оптимальності. Ітераційний метод розв’язання дискретної задачі оптимального керування з двійним перерахуванням. Оптимальне стохастичне керування. Мінімаксне керування.
Дослідження перехідних характеристик цифрових САК
Дослідження цифрових систем автоматичного керування. Типові вхідні сигнали. Моделювання цифрової та неперервної САК із використання MatLab. Результати обчислень в програмі MatLab. Збільшення періоду дискретизації цифрової системи автоматичного керування.
Розрахунок інтегралів за допомогою методів Гауса та Чебишева
Дослідження застосування різницевого методу для розв’язання крайової задачі. Дослідження проводиться на прикладі заданого диференційного рівняння. Дається опис методу та задачі в цілому. Застосування при обчисленні формули Чебишева і формули Гаусса.
Рішення задач з елементарної математики в пакеті MAPLE-8
Алгебраїчні перетворення в Maple за допомогою вбудованих функцій елементарних перетворень. Позбавлення від ірраціональності в знаменнику. Побудування графіку функції в пакеті Maple-8. Пакет plottools – пакет для створення та роботи з графічними об’єктами.
Дослідження чисельних методів інтегрування
Дослідження методів чисельного інтегрування Чебишева та Трапеції, порівняння їх точності. Способи розробки програми на компіляторі Turbo C++, яка знаходить чисельне значення вказаного інтегралу. Обґрунтування вибору інструментальних засобів програми.
Мови та системи програмування
ІНФОРМАТИКА Тема: Мови та системи програмування Однією з найпоширеніших мов з програмування серед сучасних мов високого рівня, що використовуються в ПК, є мова Visual BASIC.
Застосування електронних таблиць в діяльності менеджера
Реферат на тему: . Можливості застосування електронних таблиць. Сьогодні особливо актуальними стали прикладні засоби управління організацією, призначені для аналізу результатів діяльності, управлінського обліку, фінансового планування і формування. На початку широкомасштабного залучення прикладних програмних засобів пройшла автоматизація бухгалтерського обліку та підготовки звітності.
Построение и анализ на чувствительность моделей задач линейного программирования
Лабораторная работа №1 ПОСТРОЕНИЕ И АНАЛИЗ НА ЧУВСТВИТЕЛЬНОСТЬ МОДЕЛЕЙ ЗАДАЧ ЛИНЕЙНОГО ПРОГРАММИРОВАНИЯ Цель работы: научиться определять оптимальный план производства (приобретения) продукции с учетом ограниченного обеспечения ресурсами различного вида; освоить методику и технологию поиска оптимального решения задач линейного программирования (ЗЛП) с помощью ЭВМ; приобрести практический опыт проведения анализа оптимального решения ЗЛП на чувствительность.
Складні випадки керування в ділових паперах
Складні випадки керування у ділових паперах Керування /рос. управление/ - один із способів поєднання слів, при якому слово вимагає конкретної відмінкової форми іншого слова, тобто керує формою іншого слова. Наприклад, поширена в транспортному сервісі фраза "Оплачуйте за проїзд· не правильна тому, що дієслово оплачувати вимагає після себе знахідного відмінка без прийменника /оплатити, оплачувати проїзд, послуги, рахунок/.
Встановлення драйверів
СТАНОВЛЕННЯ ДРАЙВЕРІВ. Поняття драйверу. Драйвер – програма, що розширює можливості операційної системи. Драйвер пристрою – програма операційної системи для керування роботою периферійними пристроями: дисководами, монітором, клавіатурою, принтером, маніпулятором “миш” та ін.
Цей дивний світ уяви
Реферат з психології на тему: Цей дивний світ уяви Людина використовує в діяльності власний досвід не лише через відтворення того, що сприймала раніше. Збережені образи спрйнятих предметів, життєвих ситуацій, почутих розповідей або побачених спектаклів можуть відтворюватись у нових звязках, нових, незвичайних комбінаціях чи сполученях.
Панель керування в ОС Windows Панель управління пристороями Пк у середовищі Windows
Лабораторна робота №11 Тема: Панель керування в ОС Windows. Центром керування, у якому зосереджена переважна більшість засобів керування настройками операційної системи Windows, є спеціальна логічна тека Панель керування (їй не відповідає жоден з каталогів жорсткого диска). Приступ до Панелі керування відкривається з Головного меню командою Пуск > Настроювання > Панель керування.
Програмування рядкових величин
Тема 7. . 1. Поняття рядкової величини. Величиною рядкового типу ( strings ) називається послідовність символів, укладена в одинарні лапки. Цей тип даних є стандартним для мови ПАСКАЛЬ, хоча він є структурованим. Величини можуть бути як константами, так і змінними. При завданні змінних символьного типу можна вказати кількість символів у цій величині.
Лекция 5A Манипуляторы
Маніпулятори За типом керування маніпулятори поділяються на дві основні групи: маніпулятори з ручним та автоматичним управлінням. Маніпулятори з ручним управлінням не мають самокерування. В їхній системі автоматичного регулювання завжди присутня людина. Оскільки рухи цих маніпуляторів синхронно чи паралельно наслідують дії оператора чи копіюють їх, вони називаються синхронні, паралельні та копіювальні маніпулятори, чи маніпулятори системи Master-Slave (M-S-Системи).