КАК ДОСТОВЕРНО ОПРЕДЕЛИТЬ ПОБЕДИТЕЛЯ ТЕННИСНОГО МАТЧА.
Вид зависимости распределения вероятностей побед в теннисном матче от общего уровня игры("скилла") и текущей формы теннисистов.

Итак, от чего зависит результат матча? Безусловно, в большинстве матча определяющими являются два параметра: уровень игры (у) и форма(ф) противостоящих теннисистов. Силу (с) каждого из соперников в отдельности можно сосчитать, перемножив эти параметры:
с1=у1*ф1
с2=у2*ф2


Уровень игры.
Вроде бы понятно, что это такое. Это то, как теннисист играет, хорошо или плохо. Но как оценить это численно? Я предлагаю такой подход: рассматривать уровень игры, как произведение максимально достигаемого результата в карьере (макс) и среднего результата за последний сезон(год).
Максимальный результат, находиться легко: вводим таблицу с цифровыми значениями для всех стадий турниров разных категорий (БШ, Мастерсы, IS, челы и фьючерсы), и стадия, которую достигал теннисист в своей карьере, имеющая наибольший вес и является искомой величиной. Но следует отметить, что имеется обратная зависимость от времени, т.е. если достижения были достаточно давно, то их математический вес уменьшается. Имеется и возрастная особенность: для игроков молодых (менее 2х лет в проф. теннисе) необходимо сделать скидку на их перспективность и увеличить этот параметр на 1-2 пункта.

Средний результат за сезон(год) тоже легко считается с помощью той же таблицы: складываете результаты за все турниры и делите на их количество.

В итоге, вводом лишь одной весовой таблицы, получаем определения уровня игры любого теннисиста, не зависимо от того, на турнирах какого уровня он выступает.

Текущая форма.

Текущая форма, это параметр показывающий насколько хорошо теннисист играет в данный момент времени. Оценить её можно так: берем последнюю серию матчей теннисиста (либо последние хх матчей, либо все матчи за последние хх дней) и считаем так: берем начальное значение за 1(или за уже посчитанное на тот момент значение), рассчитываем уровень игры всех оппонентов. Основной вклад в форму вносят победы над игроками с более высоким уровнем (повышение) и поражения от игроков с более низким (понижения), победы над более слабыми и поражения от более сильных влияют намного менее заметно, причем некоторые победы могут и уменьшать форму, а поражения увеличивать.
К сожалению, общий вид этих зависимостей я не могу оценить, все очень сильно зависит от конкретных ситуаций.

Хочется ещё отметить, что на практике для сильных игроков форма в основном находится в состоянии <1, и редко становится существенно >1, для игроков же низкого уровня все наоборот, принятие формой большого значения - не редкость.

Влияние уровня и формы на вероятность исхода матча.

Чтобы посчитать вероятности победы первого и второго теннисиста, необходимо посчитать два числовых фактора (чф) для первого и для второго теннисистов, а затем нормировать их на единицу. Т.е.
п1= чф1/(чф1+чф2)
п2= чф2/(чф1+чф2),

где п1 и п2 вероятности в %.

Будет искать чф в следующем виде: чф(с1,с2,у1,у2,ф1,ф2)=чф01(с1,с2)*чф02(у1,у2)*чф03 (ф1,ф2)

Очевидно, что наибольшее влияние на чф оказывает отношение силы теннисистов друг к другу, причем зависимость сильно смахивает на линейную, т.к. даже небольшое различие вызывает существенную разность в %. Т.е.
чф01[1]~(с1/с2)=(у1*ф1)/(у2*ф2)
чф01[2]~(с2/с1)=(у2*ф2)/(у1*ф1)


Также чф имеет зависимость отдельно от отношения уровней обоих теннисистов, причем эта зависимость чувствуется только при большом различии, а при незначительных и средних отличиях этот множитель ~=1. Прикидочно, это выглядит где-то так:
чф02[1]~sqrt((у1/у2)^(у1/у2))
чф02[2]~sqrt((у1/у2)^(у1/у2))


Зависимость от отношения текущих форм примерно такая же, и у уровней, но ещё более сглаженная, что-то типа:
чф03[1]~sqrt(sqrt((ф1/ф2)^(ф1/ф2)))
чф03[2]~sqrt(sqrt((ф1/ф2)^(ф1/ф2)))


В итоге получили следующую формулу для вычисления процентовки п1/п2.

п1=((у1*ф1)/(у2*ф2)*sqrt((у1/у2)^(у1/у2))*sqrt(sqrt((ф1/ф2)^(ф1/ф2))))
/
((у1*ф1)/(у2*ф2)*sqrt((у1/у2)^(у1/у2))*sqrt(sqrt((ф1/ф2)^(ф1/ф2))) + (у2*ф2)/(у1*ф1)*sqrt((у1/у2)^(у1/у2))*sqrt(sqrt((ф1/ф2)^(ф1/ф2))))

и

п2=1-п1


Допущения при анализе:
1. Никак не учитано влияние различных покрытий и их смены. (Считалось, что теннисисты все время играют на одном и том же покрытии).
2. Не учитывались факторы напрямую не связанные с теннисистами, такие как родные трибуны, сверх мотивированность или наоборот отсутствие мотивации.