De URS rating, een alternatief voor de FIDE rating

EK/WK jeugd/junioren , Nieuws 1 december 2024 22:00 Robert Leenes 9

Recent deden Ethan Chua (U14), Noah Ritzerveld (U12) en Bram ten Dam (U10) mee aan de jeugd WK’s. Dimitri Reinderman besteedde al eerder aandacht aan hun prestaties op Schaaksite: https://www.schaaksite.nl/2024/11/26/ratingwinnende-en-verliezende-landen-op-het-wk-jeugd-en-kadetten-en-de-oorzaak/. Hij nam onder meer een link op naar een interessant artikel over ratings van Vlad Ghita: https://vladchess.substack.com/p/fide-rating-changes-are-they-working.

In dit artikel verwijst Vlad Ghita onder andere naar het Universal Rating System (URS, http://universalrating.com). De URS is een relatief nieuwe rating, ontwikkeld door Amerikaanse wetenschappers, met steun van de Grand Chess Tour, de Kasparov Chess Foundation en de Saint Louis Chess Club.

De URS hanteert een andere systematiek dan de FIDE rating, en leidt tot andere ratings.

De URS berekent iteratief voor alle spelers tegelijk een ‘performance rating’. Daarbij gebruikt de URS de resultaten van alle partijen van de laatste paar jaar, inclusief rapid en blitz partijen. Recente partijen met het klassieke speeltempo tellen zwaarder mee, dan oudere partijen en rapid en blitz partijen. De URS systematiek zou tot ratings moeten leiden, die een betere voorspeller zijn van de resultaten van toekomstige partijen. Meer achtergrond en details mbt de systematiek is beschikbaar op de URS rating site.

Het gemiddelde verschil tussen de URS rating en de FIDE rating is voor elk land anders. Dit verschil lijkt volgens het artikel van Vlad Ghita onder andere afhankelijk te zijn van het percentage jeugdspelers met een FIDE-rating in een land. Voor de ongeveer 4,000 actieve Nederlandse schakers met een FIDE-rating geldt dat onze URS-rating gemiddeld 126 punten lager is dan onze FIDE rating (zie grafiek).

Bron: Ratinglijsten FIDE en URS november 2024

Onder andere de volgende landen vallen op: India (+222), Vietnam (+205), Oezbekistan (+191), Kazachstan (+167) en China (+96). Voor Denemarken (-162) en Oostenrijk (-152) is het gemiddelde verschil tussen de URS rating en de FIDE rating groter dan voor Nederland.

Concreet voorbeeld: als het FIDE rating verschil tussen een speler uit India en een speler uit Nederland ongeveer 350 (222+126) bedraagt, dan zijn deze twee spelers volgens de URS rating systematiek waarschijnlijk ongeveer even sterk.

Het is interessant om de prestaties van de drie Nederlandse deelnemers aan de recente jeugd WK’s in de context van zowel de FIDE ratings als de URS ratings te plaatsen.

De FIDE en de URS ratings, en de posities in de startranglijst, obv zowel de FIDE als de URS ratings, vergeleken met de positie in de eindstand:

	FIDE rating	URS rating	Startpositie FIDE	Startpositie URS	Positie eindstand
Ethan	2137	2035	18	42	53
Noah	2285	2138	3	29	55
Bram	2012	1933	14	39	79

De score van Ethan vergeleken met zijn verwachte score obv zowel de FIDE als de URS ratings:

		nov ’24 rating			nov ’24 rating			Verwachte score
Rnd	Wit	FIDE	URS	Zwart	FIDE	URS	Score	FIDE	URS
1	Religa, Jakub	1743	1869	Chua, Ethan	2137	2035	1	0,92	0,72
2	Chua, Ethan	2137	2035	Calcada, Lucas	1961	2140	0,5	0,73	0,36
3	Mesic, Ado	1922	1884	Chua, Ethan	2137	2035	1	0,77	0,70
4	Chua, Ethan	2137	2035	Haug, Havard	2352	2376	0,5	0,23	0,12
5	Battistelli, Fausto	2025	2016	Chua, Ethan	2137	2035	0,5	0,65	0,53
6	Chua, Ethan	2137	2035	Omarsson, Josef	2047	1894	0,5	0,62	0,69
7	Sprincean, Lukas	1891	2059	Chua, Ethan	2137	2035	0	0,81	0,47
8	Chua, Ethan	2137	2035	Bozorov, Javohir	2012	2231	0	0,67	0,25
9	Durovka, Marek	1779	1896	Chua, Ethan	2137	2035	1	0,89	0,69
10	Chua, Ethan	2137	2035	Das, Aditeya	1961	2071	0	0,73	0,45
11	Flesch, Lucas	1766	1957	Chua, Ethan	2137	2035	0,5	0,90	0,61
							5,5	7,9	5,6

De score van Noah vergeleken met zijn verwachte score obv zowel de FIDE als de URS ratings:

		nov ’24 rating			nov ’24 rating			Verwachte score
Rnd	Wit	FIDE	URS	Zwart	FIDE	URS	Score	FIDE	URS
1	Ritzerfeld, Noah	2285	2138	Xia, Jinnan	1850	2113	0,5	0,94	0,53
2	Dauren, Darmen	1820	2092	Ritzerfeld, Noah	2285	2138	0	0,95	0,56
3	Mintz, Nathan	1633	1707	Ritzerfeld, Noah	2285	2138	1	0,99	0,93
4	Ritzerfeld, Noah	2285	2138	Sason, Noam	2017	2017	1	0,83	0,66
5	Rueda Ahumada, G	1928	2057	Ritzerfeld, Noah	2285	2138	0,5	0,89	0,61
6	Ritzerfeld, Noah	2285	2138	Skytte, Robert	1925	1770	0,5	0,90	0,90
7	Yu, Zhe	1697	1962	Ritzerfeld, Noah	2285	2138	0	0,98	0,73
8	Ritzerfeld, Noah	2285	2138	Fadeev, Justin	1878	1896	1	0,92	0,80
9	Matejka, Simon	1924	1887	Ritzerfeld, Noah	2285	2138	0,5	0,90	0,81
10	Ritzerfeld, Noah	2285	2138	Hallmundarson, B	1914	1814	1	0,90	0,87
11	Ritzerfeld, Noah	2285	2138	Nguyen, Khoi	1994	2023	0	0,85	0,66
							6	10,0	8,1

De score van Bram vergeleken met zijn verwachte score obv zowel de FIDE als de URS ratings:

		nov ’24 rating			nov ’24 rating			Verwachte score
Rnd	Wit	FIDE	URS	Zwart	FIDE	URS	Score	FIDE	URS
1	Friscic, Jakov	1685	1774	ten Dam, Bram	2012	1933	1	0,87	0,71
2	ten Dam, Bram	2012	1933	Neuschild, Marius	1786	1811	1	0,79	0,66
3	Tulegen, Ramazan	1818	1977	ten Dam, Bram	2012	1933	0	0,75	0,44
4	ten Dam, Bram	2012	1933	Azimov, Yasin	1759	1974	0	0,81	0,44
5	Aghoyan, Gevorg	1682	1764	ten Dam, Bram	2012	1933	1	0,88	0,72
6	ten Dam, Bram	2012	1933	Kadyr, Aldiyar	1759	1989	0,5	0,81	0,42
7	Liu, Liam	1783	1787	ten Dam, Bram	2012	1933	0	0,79	0,70
8	Vedrickas, Vytis	1642	1778	ten Dam, Bram	2012	1933	1	0,90	0,71
9	ten Dam, Bram	2012	1933	Zhang, Oscar	1817	1819	0	0,75	0,65
10	ten Dam, Bram	2012	1933	Lenkov, Stanislav	1693	1816	1	0,87	0,66
11	Ramesan, Raunak	1802	1850	ten Dam, Bram	2012	1933	0	0,77	0,61
							5,5	9,0	6,7

Bron: Chess-results.com en ratinglijsten FIDE en URS november 2024

Uit deze tabellen blijkt dat de URS ratings voor de drie jeugdspelers bij deze jeugd WK’s een betere ‘voorspeller’ van het aantal punten zijn dan de FIDE ratings. Obv de URS ratings scoorde Ethan ongeveer het verwachte aantal punten, en voor Noah en Bram is het verschil met het verwachte aantal punten kleiner dan obv de FIDE ratings.

Het gemiddelde verschil, voor alle actieve Nederlandse schakers met een FIDE rating, tussen de URS rating en de FIDE rating is -126. Dat gemiddelde verschilt wel per geboortejaar (de eerste grafiek), en per rating categorie (de tweede grafiek).

Bron: Ratinglijsten FIDE en URS november 2024

In de rating categorie 2701 – 2800 hebben we één speler, Anish Giri. Zowel zijn FIDE rating als zijn URS rating is 2733 op de november 2024 ratinglijsten. Dat verschil is dus 0, en daardoor verschijnt deze rating categorie niet in de grafiek.

Onder andere bij toernooien (rating categorieën, startranglijsten, indelingen) kan de URS rating een alternatief zijn voor de FIDE rating.

Tony Werten 02 december 2024

Een poging, zonder het te technisch te willen maken:

Er zijn 2 grote verschillen:

1) De weging van de uitslag van de partij is mede afhankelijk van hoe lang het geleden is dat die partij gespeeld werd.

Iemand die een stijgende lijn vertoont zal daardoor harder stijgen, zelfde met dalen. Uitzonderlijke resultaten worden na verloop van tijd steeds minder belangrijk.

Leuke bijkomstigheid: Iemand die lang niet gespeeld heeft, maar nu weer eens een partij speelt, wordt harder afgerekend op dat laatste resultaat.

2) De nieuwe rating wordt gebruikt om dezelfde berekening nog een keer te doen ( en nog en nog, totdat het een beetje stabiel is.)

Dit heeft meerdere gevolgen.

Stel:Ik benbeginner en heb 1000, jij 2000. Ik win. Berekening: Ik krijg 1200 rating en jij 1950. Nou starten we die berekening nog een keer, maar met mijn 1200. Jij verliest nu iets minder, want je hebt nu van een 1200 speler verloren ipv van een 1000 speler. en ik krijg er nog wat extra bij. ( om een stabiliteit te bevorderen rekenen dit soort systemen meestal met een toegevoegd, verzonnen resultaat. Bv, je hebt vandaag een remise tegen een 1700 gespeeld en/of een remise tegen jezelf)

Wat dit ook oplost zijn de “rating-vijvers”. Stel iemand speelt 9 vd 10 keer tegen een regionale groep en maar 1x erbuiten. Ook al is dat allemaal Fide rating, kan het dan lang duren voordat die ratingen elkaar gebalanceerd hebben. Doordat je de berekening herhaalt, spoelen ratingpunten makkelijker in en uit die vijvertjes.

Dat laatste is eigenlijk een basisidee: Rating is te afhankelijk van de groep waarin je speelt (en de tijdscontrole)
Nederlandse jeugd speelt relatief veel Fide tegen “oude” mannen, wat gemiddeld meer punten oplevert, maar minder tegen jeugd ( wat vaak rating kost, kijk zelfs al naar de NK’s) Aziatische jeugd speelt relatief veel tegen Aziatische jeugd.
Op EK en WK jeugd doen geen oude mannen mee, waardoor er een andere groep ontstaat dan die waarop de rating voor de Nederlands jeugd is gebaseerd.

Door de herhalende berekening (en alle andere tijdscontroles erbij te gooien) wordt de ratingsoep veel beter geroerd.

9 Reacties

Zuid Limburg 02 december 2024

Veel statistieken, mij intrigeert bovenal de quote: “ De URS hanteert een andere systematiek dan de FIDE rating, en leidt tot andere ratings.”.

Meer wordt er niet over gezegd. Ik zou heel graag een uitleg gelezen hebben wat die andere systematiek dan is. Wat is het wezenlijke verschil tussen Fide ratings en URS?
Login om te reageren
- Tony Werten 02 december 2024
  
  Een poging, zonder het te technisch te willen maken:
  
  Er zijn 2 grote verschillen:
  
  1) De weging van de uitslag van de partij is mede afhankelijk van hoe lang het geleden is dat die partij gespeeld werd.
  
  Iemand die een stijgende lijn vertoont zal daardoor harder stijgen, zelfde met dalen. Uitzonderlijke resultaten worden na verloop van tijd steeds minder belangrijk.
  
  Leuke bijkomstigheid: Iemand die lang niet gespeeld heeft, maar nu weer eens een partij speelt, wordt harder afgerekend op dat laatste resultaat.
  
  2) De nieuwe rating wordt gebruikt om dezelfde berekening nog een keer te doen ( en nog en nog, totdat het een beetje stabiel is.)
  
  Dit heeft meerdere gevolgen.
  
  Stel:Ik benbeginner en heb 1000, jij 2000. Ik win. Berekening: Ik krijg 1200 rating en jij 1950. Nou starten we die berekening nog een keer, maar met mijn 1200. Jij verliest nu iets minder, want je hebt nu van een 1200 speler verloren ipv van een 1000 speler. en ik krijg er nog wat extra bij. ( om een stabiliteit te bevorderen rekenen dit soort systemen meestal met een toegevoegd, verzonnen resultaat. Bv, je hebt vandaag een remise tegen een 1700 gespeeld en/of een remise tegen jezelf)
  
  Wat dit ook oplost zijn de “rating-vijvers”. Stel iemand speelt 9 vd 10 keer tegen een regionale groep en maar 1x erbuiten. Ook al is dat allemaal Fide rating, kan het dan lang duren voordat die ratingen elkaar gebalanceerd hebben. Doordat je de berekening herhaalt, spoelen ratingpunten makkelijker in en uit die vijvertjes.
  
  Dat laatste is eigenlijk een basisidee: Rating is te afhankelijk van de groep waarin je speelt (en de tijdscontrole)
  Nederlandse jeugd speelt relatief veel Fide tegen “oude” mannen, wat gemiddeld meer punten oplevert, maar minder tegen jeugd ( wat vaak rating kost, kijk zelfs al naar de NK’s) Aziatische jeugd speelt relatief veel tegen Aziatische jeugd.
  Op EK en WK jeugd doen geen oude mannen mee, waardoor er een andere groep ontstaat dan die waarop de rating voor de Nederlands jeugd is gebaseerd.
  
  Door de herhalende berekening (en alle andere tijdscontroles erbij te gooien) wordt de ratingsoep veel beter geroerd.
  Login om te reageren
  - Tony Werten 02 december 2024
    
    Kleine aanvulling mbt de stabiliteit: Op het moment dat jouw rating omlaag is gegaan van 2000 naar 1950, worden jouw resultaten ook opnieuw berekend. En waar voorheen gerekend werd met jouw 2000 rating, zul je nu een hoger resultaat scoren ( door je 1950) en er weer rating bijkrijgen.
    Login om te reageren
Robert Leenes 02 december 2024

Ik heb een korte beschrijving van de URS systematiek toegevoegd, meer achtergrond en details zijn beschikbaar op de site van de URS.
Login om te reageren
Grootprutser 02 december 2024

Soms lijkt het dat ratings nu bijna belangrijker worden dan het schaken zelf. Steeds meer ratings, nu zelfs voor snelschaken, voor steeds meer schakers, zelfs kinderen, steeds vaker berekend. Hebben andere individuele sporten, zoals tennis, dit ook?

Helpt dit echt? Misschien waren de tijden van FIDE ELO allen voor internationale spelers met 2200+ of zo, twee keer per jaar, zo slecht nog niet voor het algemene schaakplezier.
Login om te reageren
Dimitri Reinderman 02 december 2024

Wel interessant dat Gukesh en Ding bijna dezelfde URS-rating hebben, terwijl hun FIDE-ratings 55 punten verschillen. In dit geval zijn de recente resultaten blijkbaar meer van invloed op de FIDE-ratings?
Login om te reageren
sake jan de boer 02 december 2024

Mooie tabelletjes! 🙂

Wat ik me afvroeg: ik neem aan dat het URS systeem op precies dezelfde data (resultaten partijen) gebaseerd is als het FIDE systeem (anders zijn het immers appels en peren). Als concurrent van de FIDE, trekt URS die data dus uit het FIDE systeem. Nou ja, ‘concurrent’, het FIDE systeem zal niet zomaar uit te bannen is.
Login om te reageren
Govert Pellikaan 03 december 2024

Grappig. Onze bekermatch Leenes-Pellikaan is Fide 2049-1984, KNSB 2036-1990, en gek genoeg URS 1867-1907. Uitslag 1-3. Maar nu de hamvraag: ben je het zelf meer eens met je fide/knsb-rating, of met je urs-rating?!
Login om te reageren
Raoul Lemmen 03 december 2024

Die URS biedt ook kansen voor organisatoren van gesloten normentoernooien voor het samenstellen van een optimaal deelnemersveld.
Login om te reageren