Пользовательского поиска

доходов состоит также из постоянных, не зависимых от n величин, то можно предположить, что с ростом n общая величина доходов будет возрастать линейно.

Представим графически линейную зависимость суммарного дохода от числа шагов Image13461.

Image13464показывает зависимость суммарного дохода, если система “стартовала” из состояния Image13465. Соответственно, прямая Image13466изображает ту же зависимость для состояния Image13467. Обе прямые могут быть описаны линейными уравнениями Image13468:

Image13469(20),

где

g — угловой коэффициент прямой Image13470;

Image13471 — доход в i-том состоянии в конце процесса

Легко заметить, что при таком представлении зависимости Image13470величина непосредственно ожидаемого дохода q (см. формулу (19)) заменяется g. Отличие здесь лишь в том, что g является величиной постоянной для всего процесса, в то время как q меняется на каждом шаге. Величина Image13470показывает, на сколько в среднем отличается доход, когда процесс заканчивается в том или ином состоянии. В теории марковских цепей Image13470называют весом, так как разница Image13472при двух состояниях показывает средний выигрыш от того, в каком состоянии мы находимся в конце процесса (независимо от выбранной стратегии).

Таким образом, подводя итоги общих рассуждений, можно сказать, что свойство эргодичности позволяет нам считать справедливым приближенное равенство:

Image13473(21)

На этом предположении и основан итерационный метод. Суть его сводится к тому, что при разных стратегиях путем последовательных приближений определяются значения сумм.

Image13474(22)

Таким образом, если ранее (при рекуррентном методе) искалась стратегия, обеспечивающая на каждом шаге максимум суммы непосредственно ожидаемого

Яндекс цитирования Rambler's Top100

Главная

Тригенерация

Новости энергетики

Сочи-2014,новости спорта