Марковский момент
В математике теория момента остановки или марковский момент времени связана с проблемой выбора времени, чтобы принять определённое действие, для того чтобы максимизировать ожидаемое вознаграждение или минимизировать ожидаемые затраты. Проблема момента остановки может быть найдена в области статистики, экономики и финансовой математики (связанные с ценообразованием на американские опционы). Самым ярким примером, относящимся к моменту остановки, является Задача о разборчивой невесте. Проблема момента остановки часто может быть написана в форме уравнения Беллмана и поэтому часто решается с помощью динамического программирования.
Определение
Случай с дискретным временем
Как правило, проблема момента остановки связана с двумя объектами:
- Последовательность случайных величин , чье совместное распределение предполагается известным
- Последовательность «вознаграждающих» функций которые зависят от наблюдаемых значений случайных величин в 1.:
С учетом этих объектов, проблема заключается в следующем:
- Вы, соблюдая последовательность случайных величин, на каждом можете выбрать либо прекратить наблюдение либо продолжить
- Если вы прекратите наблюдать на , вы получите награду
- Вы хотите выбрать правило остановки, чтобы максимизировать предполагаемое вознаграждение (или, что эквивалентно, минимизации ожидаемых потерь)
Случай непрерывного времени
Рассмотрим усиление процессов определёнными на фильтрованном вероятностном пространстве и предположим, что это адаптирование фильтрации. Задача момента остановки состоит в том, чтобы найти время остановки которое максимизирует ожидаемый выигрыш
где называется значением функции. Здесь может иметь значение .
Более конкретная формулировка выглядит следующим образом. Мы считаем, адаптированный сильный Марковский процесс определённый на фильтрованном вероятностном пространстве где обозначает вероятность измерения, где случайный процесс начинается с . С учетом непрерывных функций и в задаче момента остановки
Иногда это называется МЛС (Майер, Лагранж и супремум, соответственно) формулировка.[1]
Методы решения
Есть два подхода к решению проблемы момента остановки. Когда основной процесс (или усиление процесса) описывается своим безусловным конечномерным распределением, тогда соответствующий метод решения — подход Мартингала, названный так потому, что он использует теорию Мартингала, наиболее важным понятием является разработка Снелла. В дискретном случае, если горизонт планирования конечен, проблема может быть легко решена с помощью динамического программирования.
Когда основной процесс определяется семейством (условных) функций переходов приводящих к Марковскому семейству вероятностных переходов, часто могут быть использованы мощные аналитические инструменты теории Марковских процессов и такой подход называется Марковским методом. Решение обычно получается решения ассоциированных задач со свободными границами (Стефан проблемы).
Результат диффузии прыжка
Пусть будет диффузия Леви в из стохастического дифференциального уравнения
где — -мерное Броуновское движение, это -мерное компенсированная пуассоновская случайная мера, , , и заданы такие функции, что единственное решение существует. Пусть будет открытым множеством (область платежеспособности) и
время банкротства. Задача оптимальной остановки:
Получается, что при некоторых условиях регулярности,[2] следующая проверка теоремы содержит:
Если функция удовлетворяет
- где области являются продолжением ,
- на и
- на , где — бесконечно малый генератор из
тогда для всех . Кроме того, если
- на
Тогда для всех и — момент остановки
Эти условия могут быть записаны в более компактной форме (интегро-вариационного неравенства):
- на
Примеры
Подбрасывание монетки
(Например, где сходится)
У вас есть монета и вы её неоднократно бросаете. Каждый раз, перед тем, как её бросить, вы можете прекратить бросать её и получать деньги (в долларах, скажем), за средним числом наблюдаемых головок.
Вы хотите, чтобы сумма, которую бы вам заплатили, была бы максимальной, выбирая правило остановки. Если хi (где i ≥ 1) образует последовательность независимых, одинаково распределенных случайных величин с распределением Бернулли
и если
тогда в последовательности и будут объекты, связанные с этой проблемой.
Продажа дома
(Например, где не обязательно сходится)
У вас есть дом и вы хотели бы продать его. Каждый день вам предлагают за ваш дом, и платить для продолжения рекламы. Если вы продаете ваш дом в день , вы заработаете , где .
Вы хотите максимизировать сумму, которую вы зарабатываете, выбирая правило остановки.
В этом примере последовательности () является последовательностью предложений за ваш дом, а последовательность «вознаграждений» функций определяет, сколько вы будете зарабатывать.
Задача о разборчивой невесте
(Например, где — это конечная последовательность)
Вы наблюдаете последовательность объектов, которые могут быть отсортированы от лучшего к худшему. Вы хотите выбрать правило остановки, которое максимизирует ваши шансы на выбор лучшего объекта.
К примеру, если (n - это некоторое большое число, возможно) — ранги объектов, и это шанс, что вы выберете лучший объект, если вы остановите намеренное отклонение объектов на этапе i, то и являются последовательности, связанные с этой проблемой. Эта проблема была решена в начале 1960-х годов несколько человек. Изящное решение проблемы секретаря и несколько модификаций этой проблемы обеспечивается более современным алгоритмом оптимальной остановки (алгоритм Брюса).
Теория поиска
Экономисты изучили ряд оптимальных проблем момента остановки, подобных «проблеме секретаря», и обычно называют этот тип анализа «теорией поиска». Теория поиска особенно ориентирована на поиск работником высокооплачиваемой работы или поиск потребителем недорогой продукции.
Торговля опционами
В торговле опционами на финансовых рынках, держатель американского опциона может осуществлять право купить (или продать) базовый актив по определённой цене в любое время до или в момент истечения срока. Таким образом, оценка американских опционов, по сути, проблема оптимальной остановки. Рассмотрим классическую модель Блэка-Шоулза и пусть будет безрисковой процентной ставкой и ставка дивидендов и непостоянство акции. Цена акций следует следует за геометрическим броуновским движением
В соответствии с мерой риска.
Когда параметр является бессрочным, задача оптимальной остановки
где функция выигрыша для опциона вызова и для опциона ставки. Вариационное неравенство
для всех где это граница физических упражнений. Решение известно[3]
- (Бесконечный вызов) где и
- (Бесконечная ставка) где и
С другой стороны, когда конечный срок действия конечен, задача связана с двумерной задачей о свободной границе без известного решения замкнутой формы. Однако могут быть использованы различные численные методы. См. Модель Black-Scholes # Американские опционы для различных методов оценки здесь, а также Fugit для дискретного дерева на основе расчета оптимального времени для тренировки.
См. также
- Стохастическое управление
- Марковский процесс принятия решений
Ссылки
- Peskir, Goran; Shiryaev, Albert Optimal Stopping and Free-Boundary Problems (неопр.). — 2006. — Т. Lectures in Mathematics. ETH Zürich. — ISBN 978-3-7643-2419-3. — doi:10.1007/978-3-7643-7390-0.
- Øksendal, B.; Sulem, A. S. Applied Stochastic Control of Jump Diffusions (неопр.). — 2007. — ISBN 978-3-540-69825-8. — doi:10.1007/978-3-540-69826-5.
- Karatzas, Ioannis; Shreve, Steven E. Methods of Mathematical Finance (неопр.). — 1998. — Т. 39. — ISBN 978-0-387-94839-3. — doi:10.1007/b98840.