Czy wygrywać na zakładach bukmacherskich używając matematyki?
Ordinal logistic regression (zwykła regresja logistyczna) to modelowanie statystyczne oparte na danych historycznych. Modelowania tego używa się, gdy istnieje kilka standaryzowanych rezultatów, czyli inaczej wyników procesu, gdzie nie istnieje żadna naturalna kolejność wyników. Przykładem mogą być zbiory odpowiedzi: pierwsze miejsce, drugie miejsce, trzecie miejsce lub bardzo mi się podoba, podoba mi się, nie podoba mi się, bardzo mi się nie podoba.
Jak wygrywać na zakładach bukmacherskich?
Wyścigi konne są klasycznym przykładem rynku doskonale konkurencyjnego. Wszyscy uczestnicy gry mają dostęp do tych samych informacji w tym samym czasie. Zdarzają się ludzie lepiej poinformowani (tzw. insiders), lecz stanowią bardzo niewielki odsetek populacji.
W modelu doskonałej konkurencji przyjmuje się następujące założenia:
- wielu kupujących i sprzedających – na rynku konkurencji doskonałej działa wielu kupujących i sprzedających, ale siła oddziaływania pojedynczego uczestnika rynku jest znikoma. Oznacza to, że żaden z nich nie ma wpływu na cenę, po jakiej transakcje są zawierane, czyli są oni cenobiorcami,
- identyczność (homogeniczność) produktu – wszystkie dobraoferowane na rynku doskonale konkurencyjnym przez wszystkich sprzedających są identyczne,
- swoboda wejścia na rynek i wyjścia z niego – na rynku doskonale konkurencyjnym nie ma żadnych instytucjonalnych lub technicznych barier utrudniających wejście zainteresowanym przedsiębiorcomna rynek lub wyjście z niego,
- doskonała informacja – wszyscy uczestnicy rynku doskonale konkurencyjnego mają pełną informację dotyczącą wszystkich aspektów prowadzonej działalności gospodarczej. Wikipedia: Aby wygrywać na zakładach bukmacherskich używając tych samych, dostępnych dla wszystkich informacji, trzeba te informacje lepiej przetwarzać. Typowi gracze nie korzystają z zaawansowanych narzędzi statystycznych, dlatego ich szanse na wygranie są podobne.
Użycie modelu ordinal logistic regression pozwala wykryć zależności i osiągnąć przewagę konkurencyjną nad innymi graczami.
Organizacja zakładów bukmacherskich na wyścigach konnych
Gracze obstawiają, kto wygra gonitwę. Komputer sumuje wszystkie zakłady dla poszczególnych koni, przetwarza dane i określa, jaka jest stopa wygranej.
Załóżmy, że większość graczy obstawia „pewniaka”. Totalizator informuje, że race odds (stopa wygranej) wynosi 3,52. Oznacza to, że jeżeli „pewniak” wygra, gracze, którzy na niego stawiali z każdej złotówki otrzymają 3,52 zł (czyli zyskują 2,52 groszy).
Zakłady na koniach, w które nikt nie wierzy, zyskują znacznie większy wskaźnik race odds. Dzieje się tak, ponieważ ryzyko przegranej jest bardzo wysokie. W przypadku wygranej takiego konia, zwycięskim graczom płacą ci, którzy postawili na pewniaka i przegrali.
Gonitwy koni są przykładem doskonale konkurencyjnego rynku gdzie wszyscy gracze mają te same informacje w tym samym czasie. Ryzyko gry jest kompensowane przez premie za ryzyko. Zgodnie z zasadą Markowitza na rynku doskonale konkurencyjnym gracze intuicyjnie będą unikali ryzyka pomimo osiągania niższych premii.
Aby wygrywać na zakładach bukmacherskich trzeba przeanalizować historię co najmniej ostatnich 100 gonitw wszystkich koni a następnie wytypować te konie, które są najbardziej przewidywalne. Czym bardziej koń jest przewidywalny tym większa jest szansa minimalizacji ryzyka przegranej. Teoretycznie zwiększenie o kilkanaście procent szansy trafienia może przynieść fortunę. Teoretycznie można to osiągnąć stosując model ordinal logistic regression.
Model ordinal logistic regression w Minitab 16
Historyczne wyniki gonitw można łatwo znaleźć w Internecine w formie gotowej do zaimplementowania do programu Minitam 16. W tym wpisie zajmę się analizą efektywności rynku konkurencyjnego dla klaczy Fanfara. Dane historyczne pokazują 300 biegów z udziałem tego konia z ostatnich dwóch lat. Najważniejsza jest informacja o wysokości stopy zwrotu RaceOdds oraz jej związku z rezultatami biegów. Gdy gracze nie wierzyli, że koń wygra wskaźnik zwrotu był wysoki. Gdy wskaźnik zwrotu był niski gracze liczyli na wygraną tego konia.
Korelacja stopy zwrotu RaceOdds z wynikami konia Fanfara umożliwia budowę modelu regresji. Poniżej znajdują się średnie RaceOdds dla każdego miejsca w wyścigach. Widać też, że odchylenie standardowe było najmniejsze dla pierwszych trzech miejsc – gracze grali na „pewniaka”.
Zadanie tej analizy sprowadza się do zbadania, czy model ordinal logistic regression dla konia Fanfara jest efektywny. Innymi słowy celem jest sprawdzenie na ile koń jest przewidywalny.
Pierwsza część wyników informuje o rezultatach konia. Koń wygrał 35 razy, trzecie miejsce osiągnął 44 razy zaś ostatnie miejsce 38 razy. Należy pamiętać, że od pozycji konia zależą inne konie, które biorą udział w wyścigu. Koń może być pewniakiem wśród marnych koni, lub przegranym wśród mistrzów.
Wartość przyjętego w badaniu współczynnika ufności wynosi p = 95%, czyli α = 0.05.
Wartość p- value dla RaceOdds jest mniejsze od współczynnika α, co oznacza, że istnieje istotna zależność pomiędzy wynikami gonitw a stopą zwrotu z zakładów.
RaceOdds jest predyktorem, inaczej zmienną opisującą w modelu. Jest jedynym predyktorem modelu, dlatego P-Value dla całego modelu i dla RaceOdds jest jednakowa.
Model ordinal logistic regression dla konia Fanfara składa się z 7 oddzielnych równań, ponieważ jest 8 odpowiedzi. Dla każdego równana występuje ta sama zmienna opisująca RaceOdds ze współczynnikiem -0,0330194. Ujemny współczynnik RaceOdds (-0,0330194) oznacza, że im wyższy wskaźnik RaceOdds, tym mniejsze prawdopodobieństwo, że koń wygra wyścig.
Poziom dopasowania modelu
Kolejnym ważnym elementem analizy jest poziom dopasowania modelu do danych. Tym lepszy jest model im dokładniej tłumaczy proces. Dobroć modeli ordinal logistic regression sprawdza się za pomocą testów Pearson i Deviance. Niska wartość p wskazuje, że przewidywane w modelu prawdopodobieństwa odbiegają od obserwowanych zdarzeń empirycznych.
Model dla konia Fanfara daje wysokie wartości p-value dla testu Deviance. Niestety test Persona dał niski wynik p jest on jednak wyższy od wartości współczynnika α = 0.05. Aby wygrywać na zakładach bukmacherskich trzeba znaleźć takiego konia, dla którego testy dobroci będą wskazywały bardzo wysoki poziom dopasowania modelu.
Miary asocjacji
Miary asocjacji wskazują na związek między obserwowanymi odpowiedziami a przewidywanymi prawdopodobieństwami.
Aby ustalić, czy pary są zgodne lub niezgodne, Minitab oblicza skumulowane prawdopodobieństwa każdej obserwacji i porównuje te wartości dla każdej pary obserwacji.
Do testowania asocjacji odpowiedzi stosuje się trzy testy.
Somers 'D - Pokazuje ile więcej zgodnych niż niezgodne par istnieje podzielone przez całkowitą liczbę par.
Goodman-Kruskal Gamma - Pokazuje ile jest więcej zgodnych niż niezgodnych par podzielone przez całkowitą liczbę par z wyłączeniem remisów.
Tau-a Kendalla Pokazuje, ile jest więcej zgodnych niż niezgodnych par podzielonych przez całkowitą liczbę par obserwacji, w tym pary o tej samej wartości odpowiedzi.
Czym wyższa wartość dla testów Somers 'D, Goodman-Kruskal Gamma i Tau-a Kendalla, tym model ma lepsze zdolności predykcyjne.
Dla konia Fanfara model posiada wysokie zdolności predykcyjne, ponieważ 65,9% par było zgodnych. Oznacza to występowanie wyższego prawdopodobieństwa, że pary będą zgodne, co prowadzi do wniosku ze model ma dobre właściwości predykcyjne. Wyniki testów Somers 'D, Goodman-Kruskal Gamma i Tau-a Kendalla są bardzo podobne. Informują one, że występuje przewaga par zgodnych.
Aby wygrywać na zakładach bukmacherskich trzeba uzyskać przewagę konkurencyjną. Aby uzyskać przewagę konkurencyjną trzeba lepiej wykorzystywać ogólnodostępne informacje. Trzeba stawiać na tego konia, który jest bardziej przewidywalny. Na rynku doskonale konkurencyjnym przewagę można osiągnąć minimalizując ryzyko. Minimalizacja ryzyka jest możliwa poprzez minimalizacje zmienności.Należy zebrać historyczne dane o wszystkich koniach, przetworzyć je za pomocą modelu ordinal logistic regression a następnie wytypować konie, które posiadają najlepsze modele.
Pozostaje tylko grać i obstawiać wytypowane konie. Jeżeli inni gracze obstawiają zwycięstwo tych koni, wystąpi wyższe prawdopodobieństwo wygranej. Taka metoda teoretycznie prowadzić będzie do wyższej efektywności gry.