1. Зовнішній інтеграл
Функції і можуть бути довільними, а математичні сподівання можна обчислювати, якщо як функція від є вимірною.
Якщо ж оптимальна стратегія, отримана в результаті оптимізації, виявиться невимірною, то і функція може виявитися невимірною. У цьому випадку математичне сподівання невизначено.
Для розв’язання цієї проблеми застосовують два підходи. Перший полягає в накладенні на функції і таких обмежень, які забезпечували б вимірність підінтегральної функції на кожному кроці оптимізації : функції і , , повинні бути неперервними по своїх аргументах і повинна існувати щільність імовірності розподілу випадкової величини , а множини значень припустимих стратегій повинні бути компактними.
На жаль, на практиці ці вимоги не завжди виконуються. Тому другий підхід пов’язаний з використанням зовнішнього інтеграла.
Позначимо через простір елементарних подій, що є довільною множиною, а – деяка система підмножин множини .
Математичним сподіванням випадкової величини , заданої на імовірнісному просторі , називається число , якщо інтеграл з правої частини існує.
Нехай і – борелівські простори, , є -алгеброю в . Функція називається -вимірною, якщо для будь-якої множини . Тут – борелівська -алгебра простору .
Для функції , () зовнішній інтеграл за мірою визначається як нижня грань інтегралів від всіх вимірних функцій (), що мажорують , тобто
, .
Тут – функція розподілу випадкової величини , що відповідає ймовірнісній мірі .
Для довільної функції має місце співвідношення:
,
де , , і вважають, що .
Оскільки зовнішній інтеграл визначений для будь-якої функції, як для вимірної, так і для невимірної, то ніяких додаткових обмежень на функції і накладати не треба.
Для вимірних функцій обидва види математичних сподівань співпадають. Отже, у постановках задач можна замінити звичайне математичне сподівання на зовнішнє, і навіть якщо знайдена при цьому функція виявиться вимірною, то отримана стратегія керування не перестане бути оптимальною.
Зовнішня міра множини визначається співвідношенням .
Для будь-якої множини
,
де – це індикатор множини , що визначається як
а) якщо , то ;
б) якщо і , то ;
в) якщо або , то ;
г) якщо задовольняє рівності , то для будь-якої функції має місце рівність ;
д) якщо , то для будь-якої функції ;
е) якщо і , то . Якщо при цьому хоча б одна з функцій або -вимірна, то останнє співвідношення вірно зі знаком рівності.
Позначимо через дійсну пряму, а через – розширену дійсну пряму і надалі у всіх висновках замість дійсної прямої використовуватимемо поняття розширеної дійсної прямої.
Вважатимемо, що для розширеної дійсної прямої мають місце всі співвідношення порядку додавання і множення, які було введено для , і припустимо, що і .
Позначимо через множину всіх дійсних у розширеному розумінні функцій , де – простір станів.
– банахів простір всіх обмежених дійсних функцій з нормою, що визначається за формулою
, .
Позначатимемо , якщо , , і , якщо , , .
Для будь-якої функції і будь-якого числа позначимо через функцію, що приймає значення в кожній точці , так, що
, .
Припущення монотонності. Для будь-яких станів , керування і функцій мають місце нерівності
якщо і ;
, якщо і ;
, якщо , і .
Для будь-якого стратегія називається -оптимальною при горизонті , якщо
і -оптимальною, якщо
Багато задач послідовної оптимізації, що становлять практичний інтерес, можуть розглядатися як окремі випадки задач загального виду. Розглянемо деякі з них:
задачі детермінованого оптимального керування;
задачі стохастичного керування зі зліченним простором збурень;
задачі стохастичного керування із зовнішнім інтегралом;
задачі стохастичного керування з мультиплікативним функціоналом витрат;
задачі мінімаксного стохастичного керування.
2. Детерміноване оптимальне керування
Розглянемо відображення , що задане формулою
, , , (1)
за таких припущень:
функції і відображають множину відповідно в множини і , тобто , ; скаляр додатний.
За цих умов відображення задовольняє припущенню монотонності. Якщо функція дорівнює нулю, тобто , , то відповідна -крокова задача оптимізації (1) набуває вигляду:
, (2)
. (3)
Ця задача є задачею детермінованого оптимального керування зі скінченним горизонтом. Задача з нескінченним горизонтом має наступний вигляд:
, (4)
. (5)
Границя в (4) існує, якщо має місце хоча б одна з наступних умов:
, , ;
, , ;
, , , і деякого .
У задачі (4) – (5) може бути уведене додаткове обмеження на стан системи , . У такому разі, якщо , позначатимемо .
3. Оптимальне стохастичне керування: зліченний простір збурень
Розглянемо відображення , що задане формулою
, (6)
за таких припущень:
параметр приймає значення зі зліченної множини з заданим розподілом ймовірностей , що залежать від і ; функції і відображають множину відповідно в множини і , тобто , ; скаляр додатний.
Якщо , , – елементи множини , – довільний розподіл ймовірностей на , а – деяка функція, то математичне сподівання визначається за формулою
,
де ,
,
.
Оскільки , то математичне сподівання визначене для будь-якої функції і будь-якого розподілу ймовірностей на множині .
Зокрема, якщо , ,… – розподіл ймовірностей на множині , то формулу (6) можна переписати так:
При використанні цього співвідношення треба пам’ятати, що для двох функцій , рівність має місце, якщо виконується хоча б одна з трьох умов:
та ;
та ;
та .
Відображення задовольняє припущенню монотонності. Якщо функція – тотожний нуль, тобто , , то за умови , , функцію витрат за кроків можна подати у вигляді:
(7)
де , .
Ця умова означає, що математичне сподівання обчислюється послідовно по всіх випадкових величинах .
При цьому зміна порядку операцій додавання і узяття математичного сподівання припустима, тому що , , і для довільних простору з мірою , вимірної функції і числа має місце рівність .
Якщо виконується одна з двох нерівностей
або
,
то функцію витрат за кроків можна записати у вигляді:
,
де математичне сподівання обчислюється на добутку мір на , а стани , , виражаються через за допомогою рівняння .
Якщо функція допускає подання у такому вигляді для будь-якого початкового стану та будь-якої стратегії , то -крокова задача може бути сформульована так:
, (8)
. (9)
Відповідна задача з нескінченним горизонтом формулюється так:
, (10)
. (11)
Границя в (10) існує при виконанні будь-якої з трьох наступних умов:
, , , ;
, , , ;
, , , , і деякого .
Математичне сподівання визначається і як звичайний інтеграл, і як зовнішній інтеграл з -алгеброю в множині , що складається із всіх підмножин , в залежності від вимірності або невимірності функцій.
Для багатьох практичних задач виконується припущення про зліченність множини .
Якщо ж множина незліченна, то справа ускладнюється необхідністю обчислення математичного сподівання
для будь-якої функції . Подолання цих труднощів і пов’язане з використанням зовнішнього інтеграла.
Другие работы по теме:
Необхідні умови оптимальності. Принцип максимуму Понтрягіна
Сутність загальної задачі керованості. Аналіз основних властивостей оптимальних керувань. Доказ теореми – "Принцип максимуму Понтрягіна", особливості її застосування для задачі оптимальної швидкодії. Методика перевірки траєкторій задачі на оптимальність.
Структура конфлікту
Реферат на тему: У структурі конфлікту можна виділити такі основні поняття: учасники конфлікту, умови перебігу конфлікту, образи конфліктної ситуації, можливі дії учасників конфлікту, наслідки конфліктних дій. Учасниками конфлікту можуть бути окремі індивіди, соціальні групи, організації, держави й т.д.
Зварювання неплавким електродом в захисному газі
Зміст Вступ Аналіз процесу зварювання Структура дослідницької установки Література Вступ Моніторинг зварних з’єднань за електричними показниками дуги в процесі зварювання в середовищі інертних газів (Аr) неплавким електродом, дозволяє виявляти дефекти, котрі можуть виявитись під час зварювання.
Керування точністю обробки
Керування точністю процесу обробки заготовок за вихідними даними. Керування пружними переміщеннями елементів технологічної системи для усунення систематичних та змінних систематичних похибок, які викликають похибки геометричної форми заготовок.
Налагоджування та програмування промислового робота МП-9С
Основні системи у складі промислового робота: виконавча (рушійна), керуюча (інтелектна), інформаційно-вимірювальна (сенсорна) та система зв'язку. Налагоджування та програмування робота, основні режими роботи. Розробка програми для виконання операцій.
Метод динамічного програмування
1 Принцип оптимальності Оптимальне керування в будь-який момент часу не залежить від передісторії процесу і визначається тільки станом системи в поточний момент і метою керування. Якщо в якийсь період часу керування було неоптимальним, то наслідки цього в майбутньому виправити вже не можна. Під метою керування розуміються вимоги, яким повинна задовольняти керована система, наприклад, це може бути приведення системи в заданий стан або забезпечення певних умов руху протягом заданого періоду часу.
Фазовая автоподстройка в относительной фазовой манипуляции ОФМн
Graphics Фазовая автоподстройка (ФАП) в приемниках ОФМн радиосигналов. Схемы Пистолькорса и Сифорова Graphics Безусловная оценка фазы Graphics Схема оптимального приемника ФМн-радиосигналов с флюктуирующей начальной фазой (переприсвоение оценки фазы) Graphics
Оптимальність у системах керування
1. Умови оптимальності у неавтономних системах керування У загальному випадку неавтономної системи права частина закону руху й підінтегральна функція цільового функціонала залежать явно від часу
Постановка задачі оптимального керування
Теорія оптимального керування; об’єкт як система, що функціонує під впливом певного фактора, здатного регулювати її еволюцію. Крайові умови задачі оптимального детермінованого керування. Числові характеристики критеріїв якості. Задачі з дискретним часом.
Системи та засоби відображення інформації
Забезпечення індикації інформації навігаційних систем літака, електронні пілотажні прилади: пульт керування, генератор символів, метеолокатор, перемикач вибору режиму; типова індикація електронного директорного авіагоризонту і горизонтального положення.
Чисельне розв’язання задач оптимального керування
Дискретизація задачі із закріпленим лівим і вільним правим кінцем. Необхідні умови оптимальності. Ітераційний метод розв’язання дискретної задачі оптимального керування з двійним перерахуванням. Оптимальне стохастичне керування. Мінімаксне керування.
Дослідження перехідних характеристик цифрових САК
Дослідження цифрових систем автоматичного керування. Типові вхідні сигнали. Моделювання цифрової та неперервної САК із використання MatLab. Результати обчислень в програмі MatLab. Збільшення періоду дискретизації цифрової системи автоматичного керування.
Мови та системи програмування
ІНФОРМАТИКА Тема: Мови та системи програмування Однією з найпоширеніших мов з програмування серед сучасних мов високого рівня, що використовуються в ПК, є мова Visual BASIC.
Застосування електронних таблиць в діяльності менеджера
Реферат на тему: . Можливості застосування електронних таблиць. Сьогодні особливо актуальними стали прикладні засоби управління організацією, призначені для аналізу результатів діяльності, управлінського обліку, фінансового планування і формування. На початку широкомасштабного залучення прикладних програмних засобів пройшла автоматизація бухгалтерського обліку та підготовки звітності.
Задачі нелінійного програмування
У задачах лінійного програмування, які розглядалися раніше, всі невідомі входили як до системи обмежень, так і до цільової функції, у першому степені. Тому ці задачі були досить простими у постановці і за методами розв'язування.
Построение и анализ на чувствительность моделей задач линейного программирования
Лабораторная работа №1 ПОСТРОЕНИЕ И АНАЛИЗ НА ЧУВСТВИТЕЛЬНОСТЬ МОДЕЛЕЙ ЗАДАЧ ЛИНЕЙНОГО ПРОГРАММИРОВАНИЯ Цель работы: научиться определять оптимальный план производства (приобретения) продукции с учетом ограниченного обеспечения ресурсами различного вида; освоить методику и технологию поиска оптимального решения задач линейного программирования (ЗЛП) с помощью ЭВМ; приобрести практический опыт проведения анализа оптимального решения ЗЛП на чувствительность.
Складні випадки керування в ділових паперах
Складні випадки керування у ділових паперах Керування /рос. управление/ - один із способів поєднання слів, при якому слово вимагає конкретної відмінкової форми іншого слова, тобто керує формою іншого слова. Наприклад, поширена в транспортному сервісі фраза "Оплачуйте за проїзд· не правильна тому, що дієслово оплачувати вимагає після себе знахідного відмінка без прийменника /оплатити, оплачувати проїзд, послуги, рахунок/.
Адміністративно-правові норми
Вивчення сутності адміністративно-правових норм - правил поведінки, установлених державою (Верховною Радою України, органом виконавчої влади) з метою регулювання суспільних відносин у сфері державного керування. Поняття про гіпотезу, диспозицію, санкцію.
Встановлення драйверів
СТАНОВЛЕННЯ ДРАЙВЕРІВ. Поняття драйверу. Драйвер – програма, що розширює можливості операційної системи. Драйвер пристрою – програма операційної системи для керування роботою периферійними пристроями: дисководами, монітором, клавіатурою, принтером, маніпулятором “миш” та ін.
Структура вікна Windows 98
При роботі з будь-якою програмою на екрані дисплея з’являється вікно, що має стандартний вигляд і складається з таких частин: кнопка системного меню, що містить команди:
Панель керування в ОС Windows Панель управління пристороями Пк у середовищі Windows
Лабораторна робота №11 Тема: Панель керування в ОС Windows. Центром керування, у якому зосереджена переважна більшість засобів керування настройками операційної системи Windows, є спеціальна логічна тека Панель керування (їй не відповідає жоден з каталогів жорсткого диска). Приступ до Панелі керування відкривається з Головного меню командою Пуск > Настроювання > Панель керування.
Цивільно-правова відповідальність іноземців в Україні
Згідно з Законом України "Про правовий статус іноземців" іноземці, які вчинили правопорушення, відповідають на загальних підставах (ст. 29). Тобто на іноземців у питаннях відповідальності поширюється національний режим. Це означає, що іноземці підлягають юрисдикції та законодавству України і відповідають за цивільними позовами, заявленими до них, нарівні з громадянами України.
Лекция 5A Манипуляторы
Маніпулятори За типом керування маніпулятори поділяються на дві основні групи: маніпулятори з ручним та автоматичним управлінням. Маніпулятори з ручним управлінням не мають самокерування. В їхній системі автоматичного регулювання завжди присутня людина. Оскільки рухи цих маніпуляторів синхронно чи паралельно наслідують дії оператора чи копіюють їх, вони називаються синхронні, паралельні та копіювальні маніпулятори, чи маніпулятори системи Master-Slave (M-S-Системи).
Адміністративно-правові норми і відносини
КУРСОВА РОБОТА на тему: Адміністративно-правові норми і відносини. План I. Вступ. II. Основна частина: Поняття адміністративних правовідносин. Основні риси адміністративного правовідносини.