Статистика случайных перестановок - Random permutation statistics
Эта статья возможно содержит оригинальные исследования. Пожалуйста Улучши это к проверка заявленные претензии и добавление встроенные цитаты. Заявления, содержащие только оригинальные исследования, следует удалить.(Июль 2014 г.) (Узнайте, как и когда удалить этот шаблон сообщения)
В статистика случайных перестановок, такой как структура цикла из случайная перестановка имеют фундаментальное значение в анализ алгоритмов, особенно алгоритмов сортировки, которые работают со случайными перестановками. Предположим, например, что мы используем быстрый выбор (двоюродный брат быстрая сортировка ), чтобы выбрать случайный элемент случайной перестановки. Quickselect выполнит частичную сортировку массива, так как он разбивает массив в соответствии с точкой поворота. Следовательно, после выполнения быстрого выбора перестановка будет менее беспорядочной. Количество оставшегося беспорядка можно проанализировать с помощью производящих функций. Эти производящие функции фундаментальным образом зависят от производящих функций статистики случайных перестановок. Следовательно, очень важно вычислить эти производящие функции.
Перестановки - это наборы помеченных циклов. Используя маркированный корпус Основная теорема Флажоле – Седжвика. и письмо для набора перестановок и для одноэлементного набора у нас есть
где мы использовали тот факт, что EGF комбинаторные виды перестановок (есть п! перестановки п элементы)
Это одно уравнение позволяет получить большое количество статистик перестановок. Во-первых, отбросив термины из , т.е. exp, мы можем ограничить количество циклов что перестановка содержит, например ограничив EGF до получаем перестановки, содержащие два цикла. Во-вторых, заметим, что EGF помеченных циклов, т.е. , является
потому что есть k! / k помеченные циклы. Это означает, что, отбрасывая члены из этой производящей функции, мы можем ограничить размер циклов которые встречаются в перестановке и получают EGF перестановок, содержащих только циклы заданного размера.
Вместо удаления и выбора циклов можно также присвоить разные веса циклам разного размера. Если весовая функция, которая зависит только от размера k цикла и для краткости запишем
определение стоимости б для перестановки быть суммой его значений на циклах, то мы можем отметить циклы длины k с тыб(k) и получим производящую функцию с двумя переменными
Это "смешанная" производящая функция: это экспоненциальная производящая функция в z и обычная производящая функция во вторичном параметре u. Дифференцировать и оценивать на ты = 1, имеем
Это функция, производящая вероятность ожидания б. Другими словами, коэффициент в этом степенном ряду - ожидаемое значение б о перестановках в , учитывая, что каждая перестановка выбирается с одинаковой вероятностью .
В этой статье используется оператор извлечения коэффициентов [zп], задокументированный на странице для формальный степенной ряд.
Количество перестановок, которые являются инволюциями
An инволюция является перестановкой σ, так что σ2 = 1 при перестановочной композиции. Отсюда следует, что σ может содержать только циклы длины один или два, т.е. экспоненциальная производящая функцияграмм(z) этих перестановок[1]
Это дает явную формулу для общего числа инволюций среди перестановок σ ∈Sп:[1]
Деление на п! дает вероятность того, что случайная перестановка является инволюцией. Эти числа известны как телефонные номера.
Количество перестановок, которые мкорни единства
Это обобщает понятие инволюции. An мкорень-й степени из единицы - это перестановка σ так, что σм = 1 при перестановочной композиции. Теперь каждый раз, когда мы применяем σ, мы продвигаемся на один шаг параллельно по всем его циклам. Цикл длины d применяемый d раз производит тождественную перестановку на d элементы (d фиксированные точки) и d это наименьшее значение для этого. Следовательно м должно быть кратно всем размерам цикла d, т.е. возможны только циклы, длина которых d является делителем м. Отсюда следует, что EGF грамм(Икс) этих перестановок
Когда м = п, куда п простое, это упрощает до
Количество перестановок порядка точно k
Это можно сделать Инверсия Мёбиуса. Работая с той же концепцией, что и в предыдущей записи, отметим, что комбинаторные виды перестановок, порядок которых делит k дан кем-то
Переходя к экспоненциальным производящим функциям, мы получаем EGF перестановок, порядок которых делит k, который
Теперь мы можем использовать эту производящую функцию для точного подсчета перестановок порядка k. Позволять быть количеством перестановок на п чей заказ точно d и количество перестановок на п количество перестановок, порядок которых делит k. Тогда у нас есть
Предположим, есть п люди в гостях, каждый из которых принес зонтик. В конце вечеринки все выбирают зонтик из стопки зонтиков и листьев. Какова вероятность, что никто не ушел со своим зонтом? Эта проблема эквивалентна подсчету перестановок без неподвижных точек (называемых расстройства ), и, следовательно, EGF, где мы вычитаем неподвижные точки, удаляя член z, является
Теперь умножение на просто суммирует коэффициенты, так что у нас есть следующая формула для , общее количество нарушений:
Следовательно, есть около расстройства и вероятность того, что случайная перестановка является расстройством, равна
Этот результат также может быть доказан включение – исключение. Использование наборов куда для обозначения множества перестановок, фиксирующих п, у нас есть
Эта формула подсчитывает количество перестановок, у которых есть хотя бы одна фиксированная точка. Мощности следующие:
Следовательно, количество перестановок без неподвижной точки равно
или же
и у нас есть претензии.
Существует обобщение этих чисел, известное как номера rencontres, т.е. число перестановок содержащий м Соответствующий EGF получается путем маркировки циклов первого размера переменной ты, т.е. выбирая б(k) равный единице для и ноль в противном случае, что дает производящую функцию множества перестановок по количеству неподвижных точек:
Следует, что
и поэтому
Отсюда сразу следует, что
за п большой, м фиксированный.
Порядок случайной перестановки
Если п перестановка, порядок из п наименьшее положительное целое число п для которого - тождественная перестановка. Это наименьшее общее кратное длин циклов п.
Теорема Го и Шмутца[2]заявляет, что если ожидаемый порядок случайной перестановки размера п, тогда
где постоянная c является
Нарушения, содержащие четное и нечетное количество циклов
Мы можем использовать ту же конструкцию, что и в предыдущем разделе, для вычисления количества нарушений. содержащий четное число циклов и число содержащий нечетное количество циклов. Для этого нам нужно отметить все циклы и вычесть фиксированные точки, получив
Некоторые очень простые рассуждения показывают, что EGF из дан кем-то
Тюремный надзиратель хочет освободить место в своей тюрьме и рассматривает возможность освобождения ста заключенных, тем самым освобождая сто камер. Поэтому он собирает сто заключенных и просит их сыграть в следующую игру: он выстраивает в ряд сто урн, каждая из которых содержит имя одного заключенного, где имя каждого заключенного встречается ровно один раз. Игра ведется следующим образом: каждому заключенному разрешается заглянуть внутрь пятидесяти урн. Если он или она не найдет своего имени в одной из пятидесяти урн, все заключенные будут немедленно казнены, в противном случае игра продолжается. У заключенных есть несколько моментов, чтобы определиться со стратегией, зная, что после начала игры они не смогут общаться друг с другом, каким-либо образом отмечать урны или перемещать урны или имена внутри них. Выбирая урны наугад, их шансы на выживание почти равны нулю, но есть стратегия, дающая им 30% шанс на выживание, предполагая, что имена присвоены урнам случайным образом - что это такое?
Прежде всего, вероятность выживания при случайном выборе равна
так что это определенно не практическая стратегия.
Стратегия 30% выживания состоит в том, чтобы рассматривать содержимое урн как перестановку заключенных и пересекать циклы. Для упрощения обозначений присвойте каждому заключенному номер, например, отсортировав их имена в алфавитном порядке. После этого можно считать, что урны содержат числа, а не имена. Теперь ясно, что содержимое урн определяет перестановку. Первый пленник открывает первую урну. Если он найдет свое имя, он закончил и выживает. В противном случае он открывает урну с номером, который он нашел в первой урне. Процесс повторяется: заключенный открывает урну и выживает, если найдет свое имя, в противном случае он открывает урну с только что полученным номером, но не более пятидесяти урн. Второй заключенный начинает с урны номер два, третий - с урны номер три и так далее. Эта стратегия в точности эквивалентна обходу циклов перестановки, представленной урнами. Каждый заключенный начинает с урны со своим номером и продолжает свой цикл до пятидесяти урн. Номер урны, содержащей его номер, является прообразом этого числа при перестановке. Следовательно, заключенные выживают, если все циклы перестановки содержат не более пятидесяти элементов. Мы должны показать, что эта вероятность составляет не менее 30%.
Обратите внимание, что это предполагает, что надзиратель выбирает перестановку случайным образом; если надзиратель предвидит эту стратегию, он может просто выбрать перестановку с циклом длиной 51. Чтобы преодолеть это, заключенные могут заранее договориться о случайной перестановке своих имен.
Рассмотрим общий случай заключенные и урны открываются. Сначала мы вычисляем дополнительную вероятность, т. Е. Того, что существует цикл, превышающий элементы. Имея это в виду, вводим
или же
так что желаемая вероятность равна
потому что цикл более чем элементы обязательно будут уникальными. Используя тот факт, что , мы находим, что
Связанный результат состоит в том, что асимптотически ожидаемая длина самого длинного цикла равна λn, где λ - Константа Голомба – Дикмана, примерно 0,62.
Этот пример принадлежит Анне Гал и Петеру Бро Милтерсену; дополнительную информацию см. В статье Питера Винклера, а также см. Обсуждение Les-Mathematiques.netПроконсультируйтесь с ссылки на 100 заключенных ссылки на эти ссылки.
Вышеупомянутое вычисление может быть выполнено более простым и прямым способом следующим образом: сначала обратите внимание, что перестановка элементов содержит не более одного цикла длины, строго большей, чем . Таким образом, если обозначить
тогда
За , количество перестановок, содержащих цикл длины ровно является
Объяснение: количество способов выбора элементы, составляющие цикл; это количество способов организации предметы в цикле; и - количество способов переставить оставшиеся элементы. Здесь нет двойного счета, потому что существует не более одного цикла длины когда . Таким образом,
Мы делаем вывод, что
Вариант задачи 100 заключенных (ключи и ящики)
Существует тесно связанная проблема, которая очень хорошо подходит для представленного здесь метода. Скажите, что у вас есть п заказанные коробки. Каждый ящик содержит ключ к другому ящику или, возможно, сам по себе, дающий перестановку ключей. Вы можете выбрать k из этих п коробки сразу и одновременно открывать их, получая доступ к k ключи. Какова вероятность, что с помощью этих ключей вы сможете открыть все п ящики, где вы используете найденный ключ, чтобы открыть ящик, которому он принадлежит, и повторите.
Математическая постановка этой задачи такова: выберите случайную перестановку на п элементы и k значения из диапазона 1 к п, тоже наугад, называют эти марки. Какова вероятность того, что в каждом цикле перестановки есть хотя бы одна отметка? Утверждается, что эта вероятность равна к / п.
Виды циклов перестановок с некоторым непустым подмножеством каждого отмеченного цикла имеет спецификацию
Индекс внутренней суммы начинается с единицы, потому что у нас должна быть хотя бы одна отметка в каждом цикле.
Переводя спецификацию на производящие функции, мы получаем двумерную производящую функцию
Это упрощает
или же
Чтобы извлечь коэффициенты из этой перезаписи, например,
Отсюда следует, что
и поэтому
Поделить на чтобы получить
Нам не нужно делить на п! потому что экспоненциально в z.
Мы можем вычислить OGF подписанных чисел Стирлинга для п фиксированный, т.е.
Начать с
что дает
Суммируя это, получаем
Используя формулу с логарифмом для слева определение справа, а биномиальная теорема, мы получаем
Сравнивая коэффициенты , и используя определение биномиальный коэффициент, наконец-то у нас есть
а падающий факториал. Вычисление OGF беззнаковых чисел Стирлинга первого рода работает аналогичным образом.
Ожидаемое количество циклов заданного размера м
В этой задаче мы используем двумерную производящую функцию грамм(z, ты), как описано во введении. Значение б для цикла не по размеру м равен нулю, а единица для цикла размера м. У нас есть
или же
Это означает, что ожидаемое количество циклов размера м в перестановке длины п меньше, чем м равен нулю (очевидно). Случайная перестановка длины не менее м содержит в среднем 1 /м циклы длины м. В частности, случайная перестановка содержит около одной фиксированной точки.
OGF ожидаемого числа циклов длиной меньше или равной м следовательно является
куда ЧАСм это мth номер гармоники. Следовательно, ожидаемое количество циклов длины не более м в случайной перестановке около lnм.
Моменты неподвижных точек
Смешанный GF множества перестановок по количеству неподвижных точек есть
Пусть случайная величина Икс - количество неподвижных точек случайной перестановки. Числа Стирлинга второго рода, имеем следующую формулу для мй момент Икс:
который равен нулю, когда , и один в противном случае. Следовательно, только термины с внести свой вклад в сумму.
Ожидаемое количество фиксированных точек в случайной перестановке в некоторой степени k
Предположим, вы выбрали случайную перестановку и поднять его до некоторой мощности , с положительное целое число и спросите об ожидаемом количестве фиксированных точек в результате. Обозначим это значение как .
Для каждого делителя из цикл длины распадается на фиксированные точки при поднятом к власти Следовательно, нам нужно пометить эти циклы Чтобы проиллюстрировать это, рассмотрим
Мы получили
который
Еще раз продолжая, как описано во введении, мы находим
который
Вывод таков: за и в среднем есть четыре фиксированных точки.
Общая процедура
Еще раз продолжая, как прежде, мы находим
Мы показали, что значение равно (в количество делителей из ) как только Это начинается в за и увеличивается на единицу каждый раз попадает в делитель до включительно сам.
Ожидаемое количество циклов любой длины случайной перестановки
Построим двумерную производящую функцию с помощью , куда равно единице для всех циклов (каждый цикл дает один вклад в общее количество циклов).
Следовательно, ожидаемое количество циклов - это номер гармоники, или около .
Количество перестановок с длиной цикла больше, чем п/2
(Обратите внимание, что Раздел Сто заключенных содержит точно такую же задачу с очень похожим вычислением, а также более простое элементарное доказательство.)
Еще раз начнем с экспоненциальной производящей функции , на этот раз в классе перестановок по размеру, где циклы длиной более отмечены переменной :
Может быть только один цикл длиной более , поэтому ответ на вопрос дает
или же
который
Показатель в срок возведения во власть больше чем и, следовательно, не имеет значения для может способствовать
Отсюда следует, что ответ
У суммы есть альтернативное представление, с которым можно столкнуться, например в OEIS OEIS: A024167.
наконец давая
Ожидаемое количество транспозиций случайной перестановки
Мы можем использовать декомпозицию непересекающихся циклов перестановки, чтобы факторизовать ее как продукт транспозиций, заменив цикл длины k к k - 1 переложение. Например. цикл факторы как . Функция для циклов равно и получаем
и
Следовательно, ожидаемое количество транспозиций является
куда это Номер гармоники Мы также могли бы получить эту формулу, заметив, что количество транспозиций получается сложением длин всех циклов (что дает п) и вычитая единицу для каждого цикла (что дает в предыдущем разделе).
Обратите внимание, что снова генерирует беззнаковый Числа Стирлинга первого рода, но в обратном порядке. Точнее, у нас есть
Чтобы увидеть это, обратите внимание, что приведенное выше эквивалентно
и это
который мы видели как EGF беззнаковых чисел Стирлинга первого рода в разделе о перестановках, состоящем в точности из м циклы.
Ожидаемый размер цикла случайного элемента
Выбираем случайный элемент q случайной перестановки и спросите об ожидаемом размере цикла, который содержит q. Здесь функция равно , потому что цикл длины k способствует k элементы, которые находятся на циклах длины k. Обратите внимание, что в отличие от предыдущих вычислений, нам нужно усреднить этот параметр после того, как мы извлечем его из производящей функции (разделим на п). У нас есть
Следовательно, ожидаемая длина цикла, содержащего q является
Вероятность того, что случайный элемент лежит в цикле размера м
Этот средний параметр представляет вероятность того, что если мы снова выберем случайный элемент случайной перестановки элемент лежит в цикле размера м. Функция равно за и ноль в противном случае, потому что только циклы длины м способствовать, а именно м элементы, которые лежат в цикле длины м. У нас есть
Отсюда следует, что вероятность того, что случайный элемент лежит в цикле длины м является