Пользовательского поиска

Управляемой цепью Маркова (УЦМ) называется случайный процесс, обладающий марковским свойством и включающий в качестве элемента математической модели конструкцию (кортеж) Image13444. Решение, принимаемое в каждый конкретный момент (шаг процесса), назовем частным управлением.

Таким образом, процесс функционирования системы, описываемой УЦМ, выглядит следующим образом:

· если система находится в состоянии Image13445и принимается решение Image13446, то она получает доход Image13447;

· состояние системы в последующий момент времени (шаг) определяется вероятностью Image13448, то есть существует вероятность того, что система из состояния Image13449перейдет в состояние Image13445, если выбрано решение Image13450.

Очевидно, общий доход за n шагов является случайной величиной, зависящей от начального состояния и качества, принимаемых в течение хода процесса решений, причем это качество оценивается величиной среднего суммарного дохода (при конечном времени) или среднего дохода за единицу времени (при бесконечном времени).

Стратегией p называется последовательность решений:

Image13451(18),

где

Image13452 — вектор управления.

Задание стратегии означает полное описание конкретных решений, принимаемых на всех шагах процесса в зависимости от состояния, в котором находится в этот момент процесс.

Если в последовательности (векторе) p все Image13453одинаковы, то такая стратегия называется стационарной, т. е. не зависящей от номера шага. Стратегия Image13454 называется марковской, если решение Image13455, принимаемое в каждом конкретном состоянии, зависит только от момента времени n, но не зависит от предшествующих состояний.

Оптимальной будет такая стратегия, которая максимизирует полный ожидаемый доход для всех i и n. В теории УМЦ разработаны два метода определения оптимальных стратегий: рекуррентный и итерационный.

 

Яндекс цитирования Rambler's Top100

Главная

Тригенерация

Новости энергетики

Сочи-2014,новости спорта