Do rzeczy. Konieczność większej automatyzacji procesów na stronie wymusiła pewne zmiany w wycenie tras, co bezpośrednio przełożyło się na kosmetyczne zmiany w rankingu. Ranking się zmienił, ale spokojnie, mocni nadal są mocni, a reszta tam gdzie była... czyli w sumie nic się nie zmieniło, kosmetyka!
Nowy algorytm wyceny tras
Zacznijmy od tego, że przy okazji prac nad mapami (które chyba się nie zakończą), zmianach w dziale Treningi (aktywności biegowe) oraz zmianach w rozpiskach międzyczasów (możliwość rozpiski na dowolnej trasie z pliku na dniach), powstał nowy algorytm wyceny trasy. Nowy to może za dużo powiedziane, delikatnie usprawniony o zebrane doświadczenia.
Główną zmianą w wycenach tras jest fakt estymacji przewyższeń przy pomocy Google Elevation API (dalej GE). W poprzedniej wersji, dokładność przewyższeń zależała od dokładności urządzenia jakim trasa była rejestrowana (zegarki z barometrem czy bez, trasy rysowane po mapach itd.), było przy tym bardzo dużo zachodu, trzeba było porównać kilka tracków, wybrać ten "raczej dobry", chyba o tym kiedyś gdzieś pisałem, nie ma co powielać. Teraz wystarczy nam obrys trasy z punktami geolokalizacji, a przewyższenia przybliżymy wspomagając się płatnym GE (tak, to API jest płatne, dziękuję więc za wykupywanie Premium). Poprawiony algorytm też lepiej radzi sobie z terenami crossowymi, nie przeszacowuje ich. Wycena trudności trasy też lepiej uwzględnia emocje na zbiegach. Reasumując obliczenia są teraz bardziej precyzyjne i co najważniejsze jednolite na całym zbiorze tras.
Żeby sprawiedliwości stało się zadość (w stosunku do tras dodawanych w przyszłości), wszystkie trasy zostały ponownie przeliczone - dystans i przewyższenia. Oto procentowe zmiany do tego co było (w stosunku do obliczonego odpowiednika "dystansu płaskiego" o którym mowa w FAQ #5 i który jest podstawą algorytmu RMT):
Ogólnie 96% tras okazało się przeszacowanych i tylko 4% niedoszacowanych (co nie oznacza, że punkty były źle wyliczone, mamy przecież korektę). Statystyka raczej spodziewana, biorąc pod uwagę. że nowy algorytm wyceny teraz mocniej uwzględnia zbiegi pomniejszając finalny dystans płaski.
Jak widać jakiś dramatycznych zmian nie ma. Aczkolwiek powyżej 5% to już sporo, w liczbach bezwzględnych dla 100 km to 5 km...
Wyrównanie automatycznie uwzględnianie w algorytmie oceny zawodów
Druga zmiana, "współczynnik wyrównania" w algorytmie wyceny zawodów. W starej wersji na podstawie statystyki startów z ostatniego roku i sugestii algorytmu, decydowałem czy wyrównanie uwzględnić czy nie. Opisywałem to dokładnie na blogu, to było problematyczne, czasochłonne, nudne, no i przede wszystkim generowało domysły "czy znów za mało mi nie dodał". Cała ta "sugestia wyrównania" nie była specjalnie dopracowana, dlatego też była jedynie sugestią, więc trzeba ją było kontrolować. Obecnie udało mi się tą "sugestię wyrównania" dość dobrze dopracować i cały proces myślowy opisywany na blogu uwzględnić w algorytmie bez potrzeby dodatkowej kontroli. W efekcie można było przeliczyć wszystko automatycznie od nowa w kilka godzin. To też miało miejsce 1. lipca pod kryptonimem Panda.
Dane historyczne potrzebne do wyceny zawodów składają się obecnie z rankingu (formy z ostatniego roku) samych zawodników, a nie jak wcześniej ogólnego zbioru wszystkich startów zawodników, których porównywaliśmy. To spowodowało, że na wycenę nie rzutują już wyniki osób, które startują nieporównywalnie częściej od innych. Wniosek, nie rzutują też starty tzw. treningowe i biegi życia. Również, w zależności co podziała korzyść punktacji, wybieramy medianę lub średnią startów historycznych. Należy też nadmienić, że oceniając zawody np. w klasie RMT4, szukamy danych historycznych co najmniej w tej samej klasie, a nie jak wcześniej również w rankingu ogólnym co mogło zaburzać wycenę tras długich.
Wyliczając ewentualne wyrównanie, algorytm teraz też bardziej docenia wysiłek zawodników. Jeśli statystycznie wycena jest niższa niż ostatnie wskaźniki zawodników to algorytm zawsze wyrówna do tego średniego poziomu (bo śnieg, bo błoto, bo ciężki zbieg po kamieniach). Jeśli wycena zawodów jest przeszacowana o więcej niż +5%, to obniży ją do akceptowalnych +5%. Czyli końcowa wycena zawsze mieści się w przedziale 0/+5%,, a nie jak wcześniej -5%/+5%. Szaleństwo!
Zielone kropeczki
Przy każdych zawodach pojawia się teraz kolorowa kropka z dymkiem (na pewno dinozaury przy laptopach mogą na nią najechać myszką):
Zawody mogą zostać zweryfikowane jedynie jeśli posiadamy już jakieś dane historyczne, które potwierdzą nam prawdopodobieństwo obliczeń na ocenianej trasie. Nie trudno sobie wyobrazić, że z takim podejściem, żadna trasa nie powinna być zweryfikowana bo pierwsza nie mogła być zweryfikowana. Dlatego przy ponownym przeliczaniu rankingu pierwsze "rozruchowe" zawody przeprowadzone w miesiącach niezimowych były traktowane jako warunkowo zatwierdzone i po przeliczeniu wszystkich zawodów ponownie weryfikowane. Dlatego też trasy z lat 2016/2017 rzadko świecą na "zielono", natomiast czym bliżej czasów współczesnych tym wyceny stają się bardziej precyzyjne. Dodatkowo kilka "raczej pewnych" zagranicznych tras będzie wstępnie i tymczasowo ręcznie zatwierdzona, aby zagraniczna elita nie była poszkodowana przez to podejście, ale wydaje mi się, że to i tak bez znaczenia dla Kiliana, bo chyba tu nie zagląda.
Zawody oznaczone "czerwoną kropką" nie są uwzględniane w oficjalnym rankingu. Eliminacja niepewnych wyników z rankingu przyczyni są do jego jeszcze większej precyzji.
1000 RMT to rekord świata
Jeszcze jedna zmiana, wcześniej granica rekordu świata była ustalona na 950 RMT. Nie pamiętam czemu bałem się 1000 RMT, może przez 4 cyfry, było, minęło i granicę rekordu przesuwamy na 1000 RMT. Skala się więc poszerza, teoretycznie rankingi powinny być nieco wyższe niż poprzednie. Tylko teoretycznie, bo to co tu dodałem, to zabrałem doszacowaniem tras, więc summa summarum powinno wyjść na zero i tak też w większości przypadków chyba jest. W związku z tym zmieniły się (raczej uprościły) nazwy poziomów zaawansowania biegacza, można zajrzeć do FAQ #14 po szczegóły.
Te wszystkie dość istotne zmiany, spowodowały, że dla spokoju ducha, wszystkie zawody trzeba było jeszcze raz automatycznie przeliczyć. Dokonało się to w dokładnie takiej samej kolejności w jakiej zawody pojawiały się na stronie. Efekt jest taki, że zmiany w punktacji są kosmetyczne. Dobra wiadomość, jeśli komuś urosło, to już wie, że wredny admin specjalnie mu wcześniej zaniżał, a jeśli komuś spadło, to cóż, chyba poprzedni ranking miał generowany po znajomości!
Wiem, dużo szczegółów bez ładu i składu, ale nie potrafię inaczej. Zresztą ostrzegałem... Wpisujcie miasta, które doczytały do końca 😉