De URS rating, een alternatief voor de FIDE rating
Recent deden Ethan Chua (U14), Noah Ritzerveld (U12) en Bram ten Dam (U10) mee aan de jeugd WK’s. Dimitri Reinderman besteedde al eerder aandacht aan hun prestaties op Schaaksite: www.schaaksite.nl/2024/11/26/ratingwinnende-en-verliezende-landen-op-het-wk-jeugd-en-kadetten-en-de-oorzaak/. Hij nam onder meer een link op naar een interessant artikel over ratings van Vlad Ghita: vladchess.substack.com/p/fide-rating-changes-are-they-working.
In dit artikel verwijst Vlad Ghita onder andere naar het Universal Rating System (URS, universalrating.com). De URS is een relatief nieuwe rating, ontwikkeld door Amerikaanse wetenschappers, met steun van de Grand Chess Tour, de Kasparov Chess Foundation en de Saint Louis Chess Club.
De URS hanteert een andere systematiek dan de FIDE rating, en leidt tot andere ratings.
De URS berekent iteratief voor alle spelers tegelijk een ‘performance rating’. Daarbij gebruikt de URS de resultaten van alle partijen van de laatste paar jaar, inclusief rapid en blitz partijen. Recente partijen met het klassieke speeltempo tellen zwaarder mee, dan oudere partijen en rapid en blitz partijen. De URS systematiek zou tot ratings moeten leiden, die een betere voorspeller zijn van de resultaten van toekomstige partijen. Meer achtergrond en details mbt de systematiek is beschikbaar op de URS rating site.
Het gemiddelde verschil tussen de URS rating en de FIDE rating is voor elk land anders. Dit verschil lijkt volgens het artikel van Vlad Ghita onder andere afhankelijk te zijn van het percentage jeugdspelers met een FIDE-rating in een land. Voor de ongeveer 4,000 actieve Nederlandse schakers met een FIDE-rating geldt dat onze URS-rating gemiddeld 126 punten lager is dan onze FIDE rating (zie grafiek).
Bron: Ratinglijsten FIDE en URS november 2024
Onder andere de volgende landen vallen op: India (+222), Vietnam (+205), Oezbekistan (+191), Kazachstan (+167) en China (+96). Voor Denemarken (-162) en Oostenrijk (-152) is het gemiddelde verschil tussen de URS rating en de FIDE rating groter dan voor Nederland.
Concreet voorbeeld: als het FIDE rating verschil tussen een speler uit India en een speler uit Nederland ongeveer 350 (222+126) bedraagt, dan zijn deze twee spelers volgens de URS rating systematiek waarschijnlijk ongeveer even sterk.
Het is interessant om de prestaties van de drie Nederlandse deelnemers aan de recente jeugd WK’s in de context van zowel de FIDE ratings als de URS ratings te plaatsen.
De FIDE en de URS ratings, en de posities in de startranglijst, obv zowel de FIDE als de URS ratings, vergeleken met de positie in de eindstand:
FIDE rating | URS rating | Startpositie FIDE | Startpositie URS | Positie eindstand | |
Ethan | 2137 | 2035 | 18 | 42 | 53 |
Noah | 2285 | 2138 | 3 | 29 | 55 |
Bram | 2012 | 1933 | 14 | 39 | 79 |
De score van Ethan vergeleken met zijn verwachte score obv zowel de FIDE als de URS ratings:
nov ’24 rating | nov ’24 rating | Verwachte score | |||||||
Rnd | Wit | FIDE | URS | Zwart | FIDE | URS | Score | FIDE | URS |
1 | Religa, Jakub | 1743 | 1869 | Chua, Ethan | 2137 | 2035 | 1 | 0,92 | 0,72 |
2 | Chua, Ethan | 2137 | 2035 | Calcada, Lucas | 1961 | 2140 | 0,5 | 0,73 | 0,36 |
3 | Mesic, Ado | 1922 | 1884 | Chua, Ethan | 2137 | 2035 | 1 | 0,77 | 0,70 |
4 | Chua, Ethan | 2137 | 2035 | Haug, Havard | 2352 | 2376 | 0,5 | 0,23 | 0,12 |
5 | Battistelli, Fausto | 2025 | 2016 | Chua, Ethan | 2137 | 2035 | 0,5 | 0,65 | 0,53 |
6 | Chua, Ethan | 2137 | 2035 | Omarsson, Josef | 2047 | 1894 | 0,5 | 0,62 | 0,69 |
7 | Sprincean, Lukas | 1891 | 2059 | Chua, Ethan | 2137 | 2035 | 0 | 0,81 | 0,47 |
8 | Chua, Ethan | 2137 | 2035 | Bozorov, Javohir | 2012 | 2231 | 0 | 0,67 | 0,25 |
9 | Durovka, Marek | 1779 | 1896 | Chua, Ethan | 2137 | 2035 | 1 | 0,89 | 0,69 |
10 | Chua, Ethan | 2137 | 2035 | Das, Aditeya | 1961 | 2071 | 0 | 0,73 | 0,45 |
11 | Flesch, Lucas | 1766 | 1957 | Chua, Ethan | 2137 | 2035 | 0,5 | 0,90 | 0,61 |
5,5 | 7,9 | 5,6 |
De score van Noah vergeleken met zijn verwachte score obv zowel de FIDE als de URS ratings:
nov ’24 rating | nov ’24 rating | Verwachte score | |||||||
Rnd | Wit | FIDE | URS | Zwart | FIDE | URS | Score | FIDE | URS |
1 | Ritzerfeld, Noah | 2285 | 2138 | Xia, Jinnan | 1850 | 2113 | 0,5 | 0,94 | 0,53 |
2 | Dauren, Darmen | 1820 | 2092 | Ritzerfeld, Noah | 2285 | 2138 | 0 | 0,95 | 0,56 |
3 | Mintz, Nathan | 1633 | 1707 | Ritzerfeld, Noah | 2285 | 2138 | 1 | 0,99 | 0,93 |
4 | Ritzerfeld, Noah | 2285 | 2138 | Sason, Noam | 2017 | 2017 | 1 | 0,83 | 0,66 |
5 | Rueda Ahumada, G | 1928 | 2057 | Ritzerfeld, Noah | 2285 | 2138 | 0,5 | 0,89 | 0,61 |
6 | Ritzerfeld, Noah | 2285 | 2138 | Skytte, Robert | 1925 | 1770 | 0,5 | 0,90 | 0,90 |
7 | Yu, Zhe | 1697 | 1962 | Ritzerfeld, Noah | 2285 | 2138 | 0 | 0,98 | 0,73 |
8 | Ritzerfeld, Noah | 2285 | 2138 | Fadeev, Justin | 1878 | 1896 | 1 | 0,92 | 0,80 |
9 | Matejka, Simon | 1924 | 1887 | Ritzerfeld, Noah | 2285 | 2138 | 0,5 | 0,90 | 0,81 |
10 | Ritzerfeld, Noah | 2285 | 2138 | Hallmundarson, B | 1914 | 1814 | 1 | 0,90 | 0,87 |
11 | Ritzerfeld, Noah | 2285 | 2138 | Nguyen, Khoi | 1994 | 2023 | 0 | 0,85 | 0,66 |
6 | 10,0 | 8,1 |
De score van Bram vergeleken met zijn verwachte score obv zowel de FIDE als de URS ratings:
nov ’24 rating | nov ’24 rating | Verwachte score | |||||||
Rnd | Wit | FIDE | URS | Zwart | FIDE | URS | Score | FIDE | URS |
1 | Friscic, Jakov | 1685 | 1774 | ten Dam, Bram | 2012 | 1933 | 1 | 0,87 | 0,71 |
2 | ten Dam, Bram | 2012 | 1933 | Neuschild, Marius | 1786 | 1811 | 1 | 0,79 | 0,66 |
3 | Tulegen, Ramazan | 1818 | 1977 | ten Dam, Bram | 2012 | 1933 | 0 | 0,75 | 0,44 |
4 | ten Dam, Bram | 2012 | 1933 | Azimov, Yasin | 1759 | 1974 | 0 | 0,81 | 0,44 |
5 | Aghoyan, Gevorg | 1682 | 1764 | ten Dam, Bram | 2012 | 1933 | 1 | 0,88 | 0,72 |
6 | ten Dam, Bram | 2012 | 1933 | Kadyr, Aldiyar | 1759 | 1989 | 0,5 | 0,81 | 0,42 |
7 | Liu, Liam | 1783 | 1787 | ten Dam, Bram | 2012 | 1933 | 0 | 0,79 | 0,70 |
8 | Vedrickas, Vytis | 1642 | 1778 | ten Dam, Bram | 2012 | 1933 | 1 | 0,90 | 0,71 |
9 | ten Dam, Bram | 2012 | 1933 | Zhang, Oscar | 1817 | 1819 | 0 | 0,75 | 0,65 |
10 | ten Dam, Bram | 2012 | 1933 | Lenkov, Stanislav | 1693 | 1816 | 1 | 0,87 | 0,66 |
11 | Ramesan, Raunak | 1802 | 1850 | ten Dam, Bram | 2012 | 1933 | 0 | 0,77 | 0,61 |
5,5 | 9,0 | 6,7 |
Bron: Chess-results.com en ratinglijsten FIDE en URS november 2024
Uit deze tabellen blijkt dat de URS ratings voor de drie jeugdspelers bij deze jeugd WK’s een betere ‘voorspeller’ van het aantal punten zijn dan de FIDE ratings. Obv de URS ratings scoorde Ethan ongeveer het verwachte aantal punten, en voor Noah en Bram is het verschil met het verwachte aantal punten kleiner dan obv de FIDE ratings.
Het gemiddelde verschil, voor alle actieve Nederlandse schakers met een FIDE rating, tussen de URS rating en de FIDE rating is -126. Dat gemiddelde verschilt wel per geboortejaar (de eerste grafiek), en per rating categorie (de tweede grafiek).
Bron: Ratinglijsten FIDE en URS november 2024
In de rating categorie 2701 – 2800 hebben we één speler, Anish Giri. Zowel zijn FIDE rating als zijn URS rating is 2733 op de november 2024 ratinglijsten. Dat verschil is dus 0, en daardoor verschijnt deze rating categorie niet in de grafiek.
Onder andere bij toernooien (rating categorieën, startranglijsten, indelingen) kan de URS rating een alternatief zijn voor de FIDE rating.
Veel statistieken, mij intrigeert bovenal de quote: “ De URS hanteert een andere systematiek dan de FIDE rating, en leidt tot andere ratings.”.
Meer wordt er niet over gezegd. Ik zou heel graag een uitleg gelezen hebben wat die andere systematiek dan is. Wat is het wezenlijke verschil tussen Fide ratings en URS?
Een poging, zonder het te technisch te willen maken:
Er zijn 2 grote verschillen:
1) De weging van de uitslag van de partij is mede afhankelijk van hoe lang het geleden is dat die partij gespeeld werd.
Iemand die een stijgende lijn vertoont zal daardoor harder stijgen, zelfde met dalen. Uitzonderlijke resultaten worden na verloop van tijd steeds minder belangrijk.
Leuke bijkomstigheid: Iemand die lang niet gespeeld heeft, maar nu weer eens een partij speelt, wordt harder afgerekend op dat laatste resultaat.
2) De nieuwe rating wordt gebruikt om dezelfde berekening nog een keer te doen ( en nog en nog, totdat het een beetje stabiel is.)
Dit heeft meerdere gevolgen.
Stel:Ik benbeginner en heb 1000, jij 2000. Ik win. Berekening: Ik krijg 1200 rating en jij 1950. Nou starten we die berekening nog een keer, maar met mijn 1200. Jij verliest nu iets minder, want je hebt nu van een 1200 speler verloren ipv van een 1000 speler. en ik krijg er nog wat extra bij. ( om een stabiliteit te bevorderen rekenen dit soort systemen meestal met een toegevoegd, verzonnen resultaat. Bv, je hebt vandaag een remise tegen een 1700 gespeeld en/of een remise tegen jezelf)
Wat dit ook oplost zijn de “rating-vijvers”. Stel iemand speelt 9 vd 10 keer tegen een regionale groep en maar 1x erbuiten. Ook al is dat allemaal Fide rating, kan het dan lang duren voordat die ratingen elkaar gebalanceerd hebben. Doordat je de berekening herhaalt, spoelen ratingpunten makkelijker in en uit die vijvertjes.
Dat laatste is eigenlijk een basisidee: Rating is te afhankelijk van de groep waarin je speelt (en de tijdscontrole)
Nederlandse jeugd speelt relatief veel Fide tegen “oude” mannen, wat gemiddeld meer punten oplevert, maar minder tegen jeugd ( wat vaak rating kost, kijk zelfs al naar de NK’s) Aziatische jeugd speelt relatief veel tegen Aziatische jeugd.
Op EK en WK jeugd doen geen oude mannen mee, waardoor er een andere groep ontstaat dan die waarop de rating voor de Nederlands jeugd is gebaseerd.
Door de herhalende berekening (en alle andere tijdscontroles erbij te gooien) wordt de ratingsoep veel beter geroerd.
Kleine aanvulling mbt de stabiliteit: Op het moment dat jouw rating omlaag is gegaan van 2000 naar 1950, worden jouw resultaten ook opnieuw berekend. En waar voorheen gerekend werd met jouw 2000 rating, zul je nu een hoger resultaat scoren ( door je 1950) en er weer rating bijkrijgen.
Ik heb een korte beschrijving van de URS systematiek toegevoegd, meer achtergrond en details zijn beschikbaar op de site van de URS.
Soms lijkt het dat ratings nu bijna belangrijker worden dan het schaken zelf. Steeds meer ratings, nu zelfs voor snelschaken, voor steeds meer schakers, zelfs kinderen, steeds vaker berekend. Hebben andere individuele sporten, zoals tennis, dit ook?
Helpt dit echt? Misschien waren de tijden van FIDE ELO allen voor internationale spelers met 2200+ of zo, twee keer per jaar, zo slecht nog niet voor het algemene schaakplezier.
Wel interessant dat Gukesh en Ding bijna dezelfde URS-rating hebben, terwijl hun FIDE-ratings 55 punten verschillen. In dit geval zijn de recente resultaten blijkbaar meer van invloed op de FIDE-ratings?
Mooie tabelletjes! 🙂
Wat ik me afvroeg: ik neem aan dat het URS systeem op precies dezelfde data (resultaten partijen) gebaseerd is als het FIDE systeem (anders zijn het immers appels en peren). Als concurrent van de FIDE, trekt URS die data dus uit het FIDE systeem. Nou ja, ‘concurrent’, het FIDE systeem zal niet zomaar uit te bannen is.
Grappig. Onze bekermatch Leenes-Pellikaan is Fide 2049-1984, KNSB 2036-1990, en gek genoeg URS 1867-1907. Uitslag 1-3. Maar nu de hamvraag: ben je het zelf meer eens met je fide/knsb-rating, of met je urs-rating?!
Die URS biedt ook kansen voor organisatoren van gesloten normentoernooien voor het samenstellen van een optimaal deelnemersveld.