В Алгоритм GHK (Гевеке, Хадживассилиу и Кин)[1] является выборка по важности метод моделирования вероятностей выбора в многомерная пробит модель. Эти смоделированные вероятности можно использовать для восстановления оценок параметров из уравнения максимального правдоподобия с использованием любого из обычных хорошо известных методов максимизации (Метод Ньютона, BFGS, так далее.). Тренироваться[2] имеет хорошо задокументированные шаги для реализации этого алгоритма для полиномиальной пробит-модели. Дальнейшее здесь применимо к бинарной многомерной пробит-модели.
Рассмотрим случай, когда кто-то пытается оценить вероятность выбора куда и где мы можем взять как выбор и как отдельные лица или наблюдения, это среднее и - ковариационная матрица модели. Вероятность соблюдения выбора является
Где и,
Пока не мало (меньше или равно 2), нет решения в закрытой форме для интегралов, определенных выше (некоторая работа была проделана с [3]). Альтернативой вычислению этих интегралов в замкнутой форме или квадратурными методами является использование моделирования. GHK - это метод моделирования для моделирования указанной выше вероятности с использованием методов выборки по важности.
Оценка упрощается за счет признания того, что скрытая модель данных можно переписать с использованием факторизации Холецкого, . Это дает где условия распространяются .
Используя эту факторизацию и тот факт, что распределены независимо, можно смоделировать вытяжки из усеченного многомерного нормального распределения, используя вытяжки из одномерного случайного нормального.
Например, если область усечения имеет нижний и верхний пределы, равные (включая a, b = ) тогда задача становится
Примечание: , заменяя:
Переставив выше,
Теперь все, что нужно сделать, это итеративно извлечь из усеченного одномерного нормального распределения с указанными выше границами. Это можно сделать с помощью метода обратного CDF, и, учитывая усеченное нормальное распределение,
Где будет числом от 0 до 1, потому что это CDF. Это предлагает генерировать случайные ничьи из усеченного распределения, которое нужно решить для давая
куда и и стандартный нормальный CDF. С помощью таких рисунков можно реконструировать его упрощенным уравнением с использованием факторизации Холецкого. Эти отрисовки будут зависеть от предшествующих отрисовок, и с использованием свойств нормалей произведение условных PDF-файлов будет совместным распределением ,
Где - многомерное нормальное распределение.
Потому что при условии ограничен набором установив факторизацию Холецкого, мы знаем, что - усеченная многомерная нормаль. Функция распределения усеченный нормальный является,
Следовательно, имеет распространение,
куда стандартный нормальный pdf для выбора .
Потому что Вышеупомянутая стандартизация делает каждый термин средним 0, дисперсия 1.
Пусть знаменатель и числитель куда - многомерный нормальный PDF.
Возвращаясь к исходной цели, чтобы оценить
Используя выборку по важности, мы можем оценить этот интеграл,
Это хорошо аппроксимируется .
Рекомендации