Żeby wygrać trzeba grać

Żeby wygrać trzeba grać

Tak, to hasło reklamowe Lotto. Tak, uważam loterie i gry losowe za podatek od bycia matematycznym analfabetą. Jednocześnie hasło to okazuje się mieć znacznie więcej sensu, niż mogłoby się wydawać. Jak inaczej określić przesłanie tych czterech celnie dobranych słów, jeśli nie jako przedstawienie Prawa Wielkich Liczb, które ma znacznie więcej zastosowań praktycznych, niż mogłoby wynikać ze wzoru.

Krótkie wyjaśnienie dla osób, których zdolności matematyczne ograniczają się do dzielenia rachunku za pizzę: jest to twierdzenie z zakresu statystyki mówiące, że im więcej razy testujemy prawdopodobieństwo, tym bardziej rozkład procentowy wyników (czyli statystyka) będzie przypominać rozkład prawdopodobieństwa. Przy rzucie monetą jest 50% szans na to, że wypadnie orzeł, 50% szans na reszkę – czyli przy 100 rzutach monetą połowa powinna być reszką. Rzuciłem cztery razy (Komisja Kontroli Gier i Zakładów w istocie mojego kota, agamy i Roomby poświadcza prawidłowość losowania) – reszka, reszka, orzeł, reszka. Wyliczając statystykę z rzutów okazuje się, że 75% wyników to reszka, a 25% to orzeł – różni się znacznie od 50-50.

Dla odmiany wygenerowałem komputerowo 10 000 000 testów „orzeł czy reszka” (takie komputerowe rzucanie monetą) i wynik jest następujący: 5000366 razy wypadł orzeł, 4999634 razy wypadła reszka – mamy rozkład 50.00366% do 49.99634% – zaokrąglając do dwóch miejsc po przecinku jest oczekiwane 50-50. Wniosek? Jeśli jest na coś określona procentowa szansa, przy małej liczbie prób okoliczności i zmienność mogą przeważać nad statystyką. W badaniach statystycznych takie sytuacje określa się mianem „małej próby badawczej”, choć częściej spotykasz się z określeniami „szczęście” lub „pech”.

Matematyka stosowana, czyli wykorzystanie Prawa Wielkich Liczb

Analizowanie prawdopodobieństwa prawdopodobieństwa nie ma wielu praktycznych zastosowań, przynajmniej dopóki nie przeprowadzacie obliczeń statystycznych dla rozrywki w wolnych chwilach (matematycy są dziwni). Jednak zwykłe pamiętanie, że w miarę wzrostu ilości prób rozkład wyników będzie bliższy wartościom prawdopodobieństwa może – i powinien – wpływać na niektóre decyzje i działania.

Sztandarowy przykład to szukanie drugiej połówki. Załóżmy, że powiedzenie „jedna osoba na milion” jest prawdziwe (w praktyce szansa poznania osoby, która będzie uznana za „jedną na milion” jest jak 1 do około 1700) – jeśli poznasz w swoim życiu dziesięć osób, jest 0.001% szansy, że wśród nich będzie ta jedna na milion osoba. Możesz trafić za pierwszym razem? Możesz. Możesz wcale nie trafić? Również. Gdybym miał obstawiać, w takiej sytuacji założyłbym, że nie trafisz. Jeśli jednak w ciągu życia poznasz (przynajmniej pobieżnie) 15000 osób, szansa na trafienie tej wyjątkowej osoby wynosi już 1.49%. Jeśli przeprowadzimy te same obliczenia dla szansy 1:1700, wyniki to odpowiednio 0.59% i 99.99% – różnica między „prawie na pewno nie poznam wyjątkowej osoby” a „prawie na pewno poznam wyjątkową osobę”. Odpowiedź na pytanie czy warto pozostawiam każdemu we własnym zakresie.

Podobnie ma się rzecz w przypadku szukania pracy – jeśli masz przygotowane generyczne CV i bardzo nie chcesz go dostosowywać do ogłoszenia (bo… nie wiem, bo masz ukończoną szkołę, a jedyne doświadczenie to zbieranie truskawek?), wysłanie go do większej ilości firm zwiększy ilość rozmów na jakie dostaniesz zaproszenie, a dzięki temu zwiększy szansę dostania pracy. Analogiczna zasada występuje przy wszystkich próbach, dla których poprzednie podejścia nie wpływają na szansę sukcesu w kolejnych – jeśli wpływają pozytywnie (bo czegoś się uczysz za każdym razem), efekt gonienia statystyki jest jeszcze silniejszy.

Testy przesiewowe

Jednak ze zwiększaniem ilości prób jest jeden zasadniczy problem – próby wymagają zasobów. W przypadku Lotto zasobami jest koszt kuponu i czas potrzebny na wysłanie, w przypadku poznawania nowych osób czas i uwaga, którą im poświęcamy, przy wysyłaniu CV pakiet danych i czas na wpisanie adresów e-mail (w pole BCC, oczywiście), przy innych zagadnieniach również mogą pojawiać się jakieś koszta. Pół biedy jeśli mamy do czynienia z testem o niskim koszcie lub możliwości łatwego powielenia kolejnych prób (jak z wysyłką hurtową CV), jednak jeśli inwestycja jest większa i trudno na dobrą sprawę określić jej koniec, stosowanie Prawa Wielkich Liczb może okazać się problematyczne.

drugapolowkaWracając do przykładu z drugą połówką (sprawdź jeszcze tutaj), kiedy tak naprawdę można określić, że „to nie to”? Po minucie, kwadransie, godzinie, dniu, roku? Nie wiem, czy jest określony precyzyjny czas, jednak wiem jak popularne jest dawanie „ostatniej szansy” po kilka, kilkanaście razy. Stop. Jeśli chcesz stosować Prawo Wielkich Liczb, czyli polujesz na coś o małym prawdopodobieństwie zaistnienia – tnij koszta jak najwcześniej. Coś nie pasuje? Tnij. Raczej nie? Tnij. Wątpliwości? Tnij. Im szybciej to zrobisz, tym lepiej.

Dobrą praktyką jest stosowanie w takim przypadku testów przesiewowych – określamy kryteria oznaczające „out” i filtrujemy kolejne próbki jak najszybciej za pomocą tych kryteriów. Do niemal wszystkiego, co traktuję statystycznie stosuję dość proste, ale wyraźne warunki kontynuacji testu. Rozważając opcję innej pracy – duża firma = duże nie. Poznając nowych ludzi – jeśli w kwadrans mnie nie zainteresują w jakiś sposób, out. Szukając lekarza – brak opinii, opinie negatywne lub zero publikacji oznacza „szukaj dalej”. W sytuacji, gdy dobrze muszę trafić raz, szkoda czasu na kontynuację testów niemal na pewno nieudanych.

A gdyby tak zwiększyć szansę?

Szansa ogólna trafienia na sukces to wypadowa szansy trafienia w jednym przypadku i ilości przypadków. Stosowanie Prawa Wielkich Liczb to manipulowanie ilością przypadków jakie są testowane. Oczywiście można też manipulować szansą trafienia przy jednym teście, co również zwiększa prawdopodobieństwo sukcesu. Jako że wypadowa szansa jest iloczynem, podwojenie ilości testów jest równie skuteczne jak podwojenie szansy na sukces – co jest prostsze, zależy od sytuacji. Jednak temat zwiększania szansy dla pojedynczego testu (czyli nauki, rozwoju, ćwiczeń, treningu i innych takich) jest dość obszerny – zostawiam to na inną okazję.

Żeby w końcu wygrać, trzeba dużo grać.