Статистика случайных перестановок - Random permutation statistics

В статистика случайных перестановок, такой как структура цикла из случайная перестановка имеют фундаментальное значение в анализ алгоритмов, особенно алгоритмов сортировки, которые работают со случайными перестановками. Предположим, например, что мы используем быстрый выбор (двоюродный брат быстрая сортировка ), чтобы выбрать случайный элемент случайной перестановки. Quickselect выполнит частичную сортировку массива, так как он разбивает массив в соответствии с точкой поворота. Следовательно, после выполнения быстрого выбора перестановка будет менее беспорядочной. Количество оставшегося беспорядка можно проанализировать с помощью производящих функций. Эти производящие функции фундаментальным образом зависят от производящих функций статистики случайных перестановок. Следовательно, очень важно вычислить эти производящие функции.

Статья о случайные перестановки содержит введение в случайные перестановки.

Основное отношение

Перестановки - это наборы помеченных циклов. Используя маркированный корпус Основная теорема Флажоле – Седжвика. и письмо для набора перестановок и для одноэлементного набора у нас есть

Переводя на экспоненциальные производящие функции (EGF), имеем

где мы использовали тот факт, что EGF комбинаторные виды перестановок (есть п! перестановки п элементы)

Это одно уравнение позволяет получить большое количество статистик перестановок. Во-первых, отбросив термины из , т.е. exp, мы можем ограничить количество циклов что перестановка содержит, например ограничив EGF до получаем перестановки, содержащие два цикла. Во-вторых, заметим, что EGF помеченных циклов, т.е. , является

потому что есть k! / k помеченные циклы. Это означает, что, отбрасывая члены из этой производящей функции, мы можем ограничить размер циклов которые встречаются в перестановке и получают EGF перестановок, содержащих только циклы заданного размера.

Вместо удаления и выбора циклов можно также присвоить разные веса циклам разного размера. Если весовая функция, которая зависит только от размера k цикла и для краткости запишем

определение стоимости б для перестановки быть суммой его значений на циклах, то мы можем отметить циклы длины k с тыб(k) и получим производящую функцию с двумя переменными

Это "смешанная" производящая функция: это экспоненциальная производящая функция в z и обычная производящая функция во вторичном параметре u. Дифференцировать и оценивать на ты = 1, имеем

Это функция, производящая вероятность ожидания б. Другими словами, коэффициент в этом степенном ряду - ожидаемое значение б о перестановках в , учитывая, что каждая перестановка выбирается с одинаковой вероятностью .

В этой статье используется оператор извлечения коэффициентов [zп], задокументированный на странице для формальный степенной ряд.

Количество перестановок, которые являются инволюциями

An инволюция является перестановкой σ, так что σ2 = 1 при перестановочной композиции. Отсюда следует, что σ может содержать только циклы длины один или два, т.е. экспоненциальная производящая функция грамм(z) этих перестановок[1]

Это дает явную формулу для общего числа инволюций среди перестановок σ ∈Sп:[1]

Деление на п! дает вероятность того, что случайная перестановка является инволюцией. Эти числа известны как телефонные номера.

Количество перестановок, которые мкорни единства

Это обобщает понятие инволюции. An мкорень-й степени из единицы - это перестановка σ так, что σм = 1 при перестановочной композиции. Теперь каждый раз, когда мы применяем σ, мы продвигаемся на один шаг параллельно по всем его циклам. Цикл длины d применяемый d раз производит тождественную перестановку на d элементы (d фиксированные точки) и d это наименьшее значение для этого. Следовательно м должно быть кратно всем размерам цикла d, т.е. возможны только циклы, длина которых d является делителем м. Отсюда следует, что EGF грамм(Икс) этих перестановок

Когда м = п, куда п простое, это упрощает до

Количество перестановок порядка точно k

Это можно сделать Инверсия Мёбиуса. Работая с той же концепцией, что и в предыдущей записи, отметим, что комбинаторные виды перестановок, порядок которых делит k дан кем-то

Переходя к экспоненциальным производящим функциям, мы получаем EGF перестановок, порядок которых делит k, который

Теперь мы можем использовать эту производящую функцию для точного подсчета перестановок порядка k. Позволять быть количеством перестановок на п чей заказ точно d и количество перестановок на п количество перестановок, порядок которых делит k. Тогда у нас есть

Далее следует Инверсия Мёбиуса который

Следовательно, у нас есть EGF

Желаемое количество затем дается

Эта формула дает, например, за k = 6 EGF

с последовательностью значений, начиная с п = 5

(последовательность A061121 в OEIS )

За k = 8 получаем EGF

с последовательностью значений, начиная с п = 8

(последовательность A061122 в OEIS )

Наконец для k = 12 получаем EGF

с последовательностью значений, начиная с п = 7

(последовательность A061125 в OEIS )

Количество перестановок, которые являются расстройствами

Предположим, есть п люди в гостях, каждый из которых принес зонтик. В конце вечеринки все выбирают зонтик из стопки зонтиков и листьев. Какова вероятность, что никто не ушел со своим зонтом? Эта проблема эквивалентна подсчету перестановок без неподвижных точек (называемых расстройства ), и, следовательно, EGF, где мы вычитаем неподвижные точки, удаляя член z, является

Теперь умножение на просто суммирует коэффициенты, так что у нас есть следующая формула для , общее количество нарушений:

Следовательно, есть около расстройства и вероятность того, что случайная перестановка является расстройством, равна

Этот результат также может быть доказан включение – исключение. Использование наборов куда для обозначения множества перестановок, фиксирующих п, у нас есть

Эта формула подсчитывает количество перестановок, у которых есть хотя бы одна фиксированная точка. Мощности следующие:

Следовательно, количество перестановок без неподвижной точки равно

или же

и у нас есть претензии.

Существует обобщение этих чисел, известное как номера rencontres, т.е. число перестановок содержащий м Соответствующий EGF получается путем маркировки циклов первого размера переменной ты, т.е. выбирая б(k) равный единице для и ноль в противном случае, что дает производящую функцию множества перестановок по количеству неподвижных точек:

Следует, что

и поэтому

Отсюда сразу следует, что

за п большой, м фиксированный.

Порядок случайной перестановки

Если п перестановка, порядок из п наименьшее положительное целое число п для которого - тождественная перестановка. Это наименьшее общее кратное длин циклов п.

Теорема Го и Шмутца[2]заявляет, что если ожидаемый порядок случайной перестановки размера п, тогда

где постоянная c является

Нарушения, содержащие четное и нечетное количество циклов

Мы можем использовать ту же конструкцию, что и в предыдущем разделе, для вычисления количества нарушений. содержащий четное число циклов и число содержащий нечетное количество циклов. Для этого нам нужно отметить все циклы и вычесть фиксированные точки, получив

Некоторые очень простые рассуждения показывают, что EGF из дан кем-то

Таким образом, мы имеем

который

Вычитание из , мы нашли

Разница этих двух ( и ) является

Сто заключенных

Тюремный надзиратель хочет освободить место в своей тюрьме и рассматривает возможность освобождения ста заключенных, тем самым освобождая сто камер. Поэтому он собирает сто заключенных и просит их сыграть в следующую игру: он выстраивает в ряд сто урн, каждая из которых содержит имя одного заключенного, где имя каждого заключенного встречается ровно один раз. Игра ведется следующим образом: каждому заключенному разрешается заглянуть внутрь пятидесяти урн. Если он или она не найдет своего имени в одной из пятидесяти урн, все заключенные будут немедленно казнены, в противном случае игра продолжается. У заключенных есть несколько моментов, чтобы определиться со стратегией, зная, что после начала игры они не смогут общаться друг с другом, каким-либо образом отмечать урны или перемещать урны или имена внутри них. Выбирая урны наугад, их шансы на выживание почти равны нулю, но есть стратегия, дающая им 30% шанс на выживание, предполагая, что имена присвоены урнам случайным образом - что это такое?

Прежде всего, вероятность выживания при случайном выборе равна

так что это определенно не практическая стратегия.

Стратегия 30% выживания состоит в том, чтобы рассматривать содержимое урн как перестановку заключенных и пересекать циклы. Для упрощения обозначений присвойте каждому заключенному номер, например, отсортировав их имена в алфавитном порядке. После этого можно считать, что урны содержат числа, а не имена. Теперь ясно, что содержимое урн определяет перестановку. Первый пленник открывает первую урну. Если он найдет свое имя, он закончил и выживает. В противном случае он открывает урну с номером, который он нашел в первой урне. Процесс повторяется: заключенный открывает урну и выживает, если найдет свое имя, в противном случае он открывает урну с только что полученным номером, но не более пятидесяти урн. Второй заключенный начинает с урны номер два, третий - с урны номер три и так далее. Эта стратегия в точности эквивалентна обходу циклов перестановки, представленной урнами. Каждый заключенный начинает с урны со своим номером и продолжает свой цикл до пятидесяти урн. Номер урны, содержащей его номер, является прообразом этого числа при перестановке. Следовательно, заключенные выживают, если все циклы перестановки содержат не более пятидесяти элементов. Мы должны показать, что эта вероятность составляет не менее 30%.

Обратите внимание, что это предполагает, что надзиратель выбирает перестановку случайным образом; если надзиратель предвидит эту стратегию, он может просто выбрать перестановку с циклом длиной 51. Чтобы преодолеть это, заключенные могут заранее договориться о случайной перестановке своих имен.

Рассмотрим общий случай заключенные и урны открываются. Сначала мы вычисляем дополнительную вероятность, т. Е. Того, что существует цикл, превышающий элементы. Имея это в виду, вводим

или же

так что желаемая вероятность равна

потому что цикл более чем элементы обязательно будут уникальными. Используя тот факт, что , мы находим, что

что дает

Наконец, используя интегральную оценку, такую ​​как Суммирование Эйлера – Маклорена., или асимптотическое разложение пth номер гармоники, мы получаем

так что

или не менее 30%, как заявлено.

Связанный результат состоит в том, что асимптотически ожидаемая длина самого длинного цикла равна λn, где λ - Константа Голомба – Дикмана, примерно 0,62.

Этот пример принадлежит Анне Гал и Петеру Бро Милтерсену; дополнительную информацию см. В статье Питера Винклера, а также см. Обсуждение Les-Mathematiques.netПроконсультируйтесь с ссылки на 100 заключенных ссылки на эти ссылки.

Вышеупомянутое вычисление может быть выполнено более простым и прямым способом следующим образом: сначала обратите внимание, что перестановка элементов содержит не более одного цикла длины, строго большей, чем . Таким образом, если обозначить

тогда

За , количество перестановок, содержащих цикл длины ровно является

Объяснение: количество способов выбора элементы, составляющие цикл; это количество способов организации предметы в цикле; и - количество способов переставить оставшиеся элементы. Здесь нет двойного счета, потому что существует не более одного цикла длины когда . Таким образом,

Мы делаем вывод, что

Вариант задачи 100 заключенных (ключи и ящики)

Существует тесно связанная проблема, которая очень хорошо подходит для представленного здесь метода. Скажите, что у вас есть п заказанные коробки. Каждый ящик содержит ключ к другому ящику или, возможно, сам по себе, дающий перестановку ключей. Вы можете выбрать k из этих п коробки сразу и одновременно открывать их, получая доступ к k ключи. Какова вероятность, что с помощью этих ключей вы сможете открыть все п ящики, где вы используете найденный ключ, чтобы открыть ящик, которому он принадлежит, и повторите.

Математическая постановка этой задачи такова: выберите случайную перестановку на п элементы и k значения из диапазона 1 к п, тоже наугад, называют эти марки. Какова вероятность того, что в каждом цикле перестановки есть хотя бы одна отметка? Утверждается, что эта вероятность равна к / п.

Виды циклов перестановок с некоторым непустым подмножеством каждого отмеченного цикла имеет спецификацию

Индекс внутренней суммы начинается с единицы, потому что у нас должна быть хотя бы одна отметка в каждом цикле.

Переводя спецификацию на производящие функции, мы получаем двумерную производящую функцию

Это упрощает

или же

Чтобы извлечь коэффициенты из этой перезаписи, например,

Отсюда следует, что

и поэтому

Поделить на чтобы получить

Нам не нужно делить на п! потому что экспоненциально в z.

Количество перестановок, содержащих м циклы

Применяя Основная теорема Флажоле – Седжвика., т.е. теорема о помеченном перечислении с , к множеству

получаем производящую функцию

Период, термин

дает подписанный Числа Стирлинга первого рода, и является EGF беззнаковых чисел Стирлинга первого рода, т. е.

Мы можем вычислить OGF подписанных чисел Стирлинга для п фиксированный, т.е.

Начать с

что дает

Суммируя это, получаем

Используя формулу с логарифмом для слева определение справа, а биномиальная теорема, мы получаем

Сравнивая коэффициенты , и используя определение биномиальный коэффициент, наконец-то у нас есть

а падающий факториал. Вычисление OGF беззнаковых чисел Стирлинга первого рода работает аналогичным образом.

Ожидаемое количество циклов заданного размера м

В этой задаче мы используем двумерную производящую функцию грамм(zты), как описано во введении. Значение б для цикла не по размеру м равен нулю, а единица для цикла размера м. У нас есть

или же

Это означает, что ожидаемое количество циклов размера м в перестановке длины п меньше, чем м равен нулю (очевидно). Случайная перестановка длины не менее м содержит в среднем 1 /м циклы длины м. В частности, случайная перестановка содержит около одной фиксированной точки.

OGF ожидаемого числа циклов длиной меньше или равной м следовательно является

куда ЧАСм это мth номер гармоники. Следовательно, ожидаемое количество циклов длины не более м в случайной перестановке около lnм.

Моменты неподвижных точек

Смешанный GF множества перестановок по количеству неподвижных точек есть

Пусть случайная величина Икс - количество неподвижных точек случайной перестановки. Числа Стирлинга второго рода, имеем следующую формулу для мй момент Икс:

куда это падающий факториал.С помощью , у нас есть

который равен нулю, когда , и один в противном случае. Следовательно, только термины с внести свой вклад в сумму.

Ожидаемое количество фиксированных точек в случайной перестановке в некоторой степени k

Предположим, вы выбрали случайную перестановку и поднять его до некоторой мощности , с положительное целое число и спросите об ожидаемом количестве фиксированных точек в результате. Обозначим это значение как .

Для каждого делителя из цикл длины распадается на фиксированные точки при поднятом к власти Следовательно, нам нужно пометить эти циклы Чтобы проиллюстрировать это, рассмотрим

Мы получили

который

Еще раз продолжая, как описано во введении, мы находим

который

Вывод таков: за и в среднем есть четыре фиксированных точки.

Общая процедура

Еще раз продолжая, как прежде, мы находим

Мы показали, что значение равно количество делителей из ) как только Это начинается в за и увеличивается на единицу каждый раз попадает в делитель до включительно сам.

Ожидаемое количество циклов любой длины случайной перестановки

Построим двумерную производящую функцию с помощью , куда равно единице для всех циклов (каждый цикл дает один вклад в общее количество циклов).

Обратите внимание, что имеет закрытую форму

и генерирует беззнаковый Числа Стирлинга первого рода.

У нас есть

Следовательно, ожидаемое количество циклов - это номер гармоники , или около .

Количество перестановок с длиной цикла больше, чем п/2

(Обратите внимание, что Раздел Сто заключенных содержит точно такую ​​же задачу с очень похожим вычислением, а также более простое элементарное доказательство.)

Еще раз начнем с экспоненциальной производящей функции , на этот раз в классе перестановок по размеру, где циклы длиной более отмечены переменной :

Может быть только один цикл длиной более , поэтому ответ на вопрос дает

или же

который

Показатель в срок возведения во власть больше чем и, следовательно, не имеет значения для может способствовать

Отсюда следует, что ответ

У суммы есть альтернативное представление, с которым можно столкнуться, например в OEIS OEISA024167.

наконец давая

Ожидаемое количество транспозиций случайной перестановки

Мы можем использовать декомпозицию непересекающихся циклов перестановки, чтобы факторизовать ее как продукт транспозиций, заменив цикл длины k к k - 1 переложение. Например. цикл факторы как . Функция для циклов равно и получаем

и

Следовательно, ожидаемое количество транспозиций является

куда это Номер гармоники Мы также могли бы получить эту формулу, заметив, что количество транспозиций получается сложением длин всех циклов (что дает п) и вычитая единицу для каждого цикла (что дает в предыдущем разделе).

Обратите внимание, что снова генерирует беззнаковый Числа Стирлинга первого рода, но в обратном порядке. Точнее, у нас есть

Чтобы увидеть это, обратите внимание, что приведенное выше эквивалентно

и это

который мы видели как EGF беззнаковых чисел Стирлинга первого рода в разделе о перестановках, состоящем в точности из м циклы.

Ожидаемый размер цикла случайного элемента

Выбираем случайный элемент q случайной перестановки и спросите об ожидаемом размере цикла, который содержит q. Здесь функция равно , потому что цикл длины k способствует k элементы, которые находятся на циклах длины k. Обратите внимание, что в отличие от предыдущих вычислений, нам нужно усреднить этот параметр после того, как мы извлечем его из производящей функции (разделим на п). У нас есть

Следовательно, ожидаемая длина цикла, содержащего q является

Вероятность того, что случайный элемент лежит в цикле размера м

Этот средний параметр представляет вероятность того, что если мы снова выберем случайный элемент случайной перестановки элемент лежит в цикле размера м. Функция равно за и ноль в противном случае, потому что только циклы длины м способствовать, а именно м элементы, которые лежат в цикле длины м. У нас есть

Отсюда следует, что вероятность того, что случайный элемент лежит в цикле длины м является

Вероятность того, что случайное подмножество [п] лежит в том же цикле

Выберите случайное подмножество Q из [п] содержащий м элементов и случайной перестановки, и спросите о вероятности того, что все элементы Q лежат в одном цикле. Это еще один средний показатель. Функция б(k) равно , потому что цикл длины k способствует подмножества размера м, куда за k < м. Это дает

Усредняя, ​​получаем, что вероятность элементов Q находиться в одном цикле

или же

В частности, вероятность того, что два элемента п < q находятся в одном цикле - 1/2.

Количество перестановок, содержащих четное количество четных циклов

Мы можем использовать Основная теорема Флажоле – Седжвика. напрямую и вычислить более сложную статистику перестановок. (Проверьте эту страницу, чтобы узнать, как вычисляются операторы, которые мы будем использовать.) Например, набор перестановок, содержащий четное число четных циклов, задается следующим образом:

Перевод на экспоненциальные производящие функции (EGFs), получаем

или же

Это упрощает

или же

Это означает, что существует одна перестановка нулевого размера, содержащая четное число четных циклов (пустая перестановка, которая содержит нулевые циклы четной длины), одна такая перестановка размера один (фиксированная точка, которая также содержит нулевые циклы четной длины ), и что для , Существуют такие перестановки.

Перестановки, которые представляют собой квадраты

Рассмотрим, что происходит, когда мы возводим перестановку в квадрат. Фиксированные точки сопоставляются с фиксированными точками. Нечетные циклы отображаются в нечетные циклы во взаимно однозначном соответствии, например превращается в . Четные циклы разделяются на две части и производят пару циклов размером в половину исходного цикла, например превращается в . Следовательно, перестановки, которые являются квадратами, могут содержать любое количество нечетных циклов, четное количество циклов размера два, четное количество циклов размера четыре и т. Д. И задаются формулой

что дает EGF

Инварианты нечетного цикла

Типы перестановок, представленные в двух предыдущих разделах, т.е. перестановки, содержащие четное число четных циклов, и перестановки, которые являются квадратами, являются примерами так называемых инварианты нечетного цикла, изученные Сун и Чжан (см. внешняя ссылка ). Термин «инвариант нечетного цикла» просто означает, что членство в соответствующем комбинаторном классе не зависит от размера и количества нечетных циклов, возникающих в перестановке. Фактически мы можем доказать, что все инварианты нечетных циклов подчиняются простой рекуррентности, которую мы выведем. Во-первых, вот еще несколько примеров инвариантов нечетных циклов.

Перестановки, в которых сумма длин четных циклов равна шести

Этот класс имеет спецификацию

и производящая функция

Первые несколько значений:

Перестановки, в которых все четные циклы имеют одинаковую длину

Этот класс имеет спецификацию

и производящая функция

Здесь есть смысловой нюанс. Мы могли бы рассматривать перестановки, не содержащие четных циклов, как принадлежащие этому классу, поскольку ноль даже. Первые несколько значений:

Перестановки, в которых максимальная длина четного цикла равна четырем

Этот класс имеет спецификацию

и производящая функция

Первые несколько значений:

Повторение

Внимательно наблюдайте, как построены спецификации компонента четного цикла. Лучше всего думать о них как о деревьях синтаксического анализа. Эти деревья имеют три уровня. Узлы на самом низком уровне представляют собой суммы произведений циклов четной длины одноэлементного элемента. . Узлы на среднем уровне представляют собой ограничения оператора множества. Наконец, узел на верхнем уровне суммирует продукты взносов среднего уровня. Обратите внимание, что ограничения оператора множества, применяемые к производящей функции, которая является четной, сохранят эту особенность, то есть создадут другую четную производящую функцию. Но все входные данные для операторов множества четны, поскольку они возникают из циклов четной длины. В результате все задействованные производящие функции имеют вид

куда является четной функцией. Это означает, что

тоже четный, а значит

Сдача и извлекая коэффициенты, находим, что

что дает повторение

Проблема из конкурса Putnam 2005 г.

Ссылка на Конкурс Патнэма сайт появится в разделе внешняя ссылка Задача требует доказательства того, что

где сумма по всем перестановки , это знак , т.е. если даже и если странно, и количество неподвижных точек .

Теперь знак дан кем-то

где продукт проходит все циклы c из , как объяснено, например, на странице на четные и нечетные перестановки.

Поэтому мы рассматриваем комбинаторный класс

куда отмечает единицу минус длительность вспомогательного цикла, и отмечает фиксированные точки. Переходя к производящим функциям, получаем

или же

Теперь у нас есть

и, следовательно, желаемое количество дается

Выполняя расчет, получаем

или же

Вычитая коэффициенты, находим, что коэффициент при равно нулю, константа равна единице, что не соответствует формуле (должно быть равно нулю). За положительный, однако получаем

или же

что и есть желаемый результат.

Интересно отметить, что может использоваться для оценки следующих детерминант из матрица:

куда . Напомним формулу для определителя:

Теперь значение продукта справа для перестановки является ,куда ж количество неподвижных точек . Следовательно

что дает

и наконец

Разница между количеством циклов в четных и нечетных перестановках

Здесь мы стремимся показать, что это различие определяется выражением

Напомним, что знак перестановки дан кем-то

где продукт колеблется по циклам c из дизъюнктного цикла композиции .

Отсюда следует, что комбинаторные виды который отражает знаки, а количество циклов набора перестановок определяется выражением

где мы использовали отмечать знаки и для подсчета цикла.

Переходя к производящим функциям, мы имеем

Это упрощает

который

Теперь две производящие функции и четных и нечетных перестановок по количеству циклов задаются

и

Нам требуется количество

который

Наконец, извлекая коэффициенты из этой производящей функции, получаем

который

что в свою очередь

Это завершает доказательство.

Смотрите также

Рекомендации

  1. ^ а б Чоула, С.; Герштейн, И.; Мур, В. К. (1951), "О рекурсиях, связанных с симметрическими группами. I", Канадский математический журнал, 3: 328–334, Дои:10.4153 / CJM-1951-038-3, МИСТЕР  0041849
  2. ^ Го, Уильям M.Y .; Шмутц, Эрик (1991). «Ожидаемый порядок случайной перестановки». Бюллетень Лондонского математического общества. 23 (1): 34–42. Дои:10.1112 / blms / 23.1.34. Архивировано из оригинал 25 февраля 2020 г. Альтернативный URL

внешняя ссылка

100 заключенных