Kan ‘Giraffe’ leren schaken?
Het eeuwenoude en koninklijke schaakspel is een fascinerend onderwerp voor wetenschappelijk onderzoek. Een soort ‘heilige graal’ voor onderzoekers. Voor verschillende vakgebieden is het schaakspel interessant zoals (kunstmatige)intelligentie, psychologie, speltheorie, wiskunde en computerkunde. Nu de machine de mens heeft verslagen en de schaakcomputers sterker zijn dan de wereldkampioen leek een voorlopig eindpunt bereikt. Niets is minder waar. In september 2015 verraste een Canadese schaker en student computerkunde de wereld met een geheel nieuwe en radicaal andere benadering van het computerschaak. Grensverleggend! Even was hij wereldberoemd en kreeg hij veel publiciteit totdat verrassende wendingen zich voordeden. Ging dit baanbrekende nieuws geruisluis aan de Nederlandse schaakwereld voorbij?
Een ‘must-read’ voor schakers en (schakende) studenten aan onze (technische) hogescholen en universiteiten! Een uitdaging?
Schaakwonderkinderen
Recent zond de Belgische tv de documentaire ‘De Polgár-variant’ uit. Het ging over de opvoeding en opleiding van de drie Polgár-zusjes in het communistische Hongarije. Drie schaakwonderkinderen, waarvan Judit de beste werd.
Op 13-jarige leeftijd speelde Judit Polgár, de jongste van de drie zusjes al op meesterniveau met een Elo rating boven 2300. Judit was toen niet de enige met dit niveau. Ook de in Londen geboren Demis Hassabis was een uitzonderlijk jeugdtalent. Hij was enkele dagen jonger dan Judit en hij had ook een rating van rond de 2300. Demis bezettte de tweede plaats achter Judit op de wereldranglijst junioren onder veertien jaar! Judit maakte carrière in de schaaksport, Demis ging werken en studeren, richtte een bedrijf op en kreeg na overname een topjob.
Google DeepMind en AlphaGo
Demis Hassabis begon zijn carrière bij een computergame bedrijf. Daarna besloot hij computerwetenschappen te gaan studeren aan het Queens College in Cambridge en gaf hij enkele jaren leiding aan technologiebedrijven. Vervolgens ging hij terug naar de Londense universiteit, deed verder onderzoek op het gebied van neurowetenschappen en kunstmatige intelligentie. En promoveerde.
In 2010 richtte hij met andere wetenschappers het bedrijf DeepMind op met steun van vooraanstaande technologie-iconen en grote investeerders. In 2014 werd overgenomen door Google. Dit was de grootste Europese overname van Google die hiervoor het lieve sommetje van ca. 600 miljoen euro betaalde. Demis Hassabis is nu de algemeen directeur van Google DeepMind. Demis kreeg wereldwijde bekendheid toen het computerprogramma AlphaGo eerst de Europees kampioen Go met 5-0 versloeg en daarna de wereldtopper Lee Sedol met 4-1. Niemand had verwacht dat een computer nu al zo’n prestatie zou kunnen leveren. Ook professor Jaap van den Herik dacht dat dit pas over tien jaar zou kunnen.
Brainless Chess
De Canadees Matthew Lai, schaakliefhebber en student, begon zich al vroeg te interesseren voor computerschaak. Hij ontwikkelde tijdens zijn ‘high-school’ periode het computerschaakprogramma Brainless Chess. Dit was geen bijzonder programma, een van de vele die door amateurs ontwikkeld werden in die tijd. In 2008 stopte Lai met de ontwikkeling van het programma na samengewerkt te hebben met Wieland Belka (ingenieur, IM Correspondentieschaak en programmeur) en Pawel Koziol (programmeur). Matthew ging studeren aan de Universiteit van British Columbia. (In 2010 deed Wieland met het programma nog mee aan een internationaal toernooi en eindigde in de onderste regionen. Ook zijn eigen programma Eichörnchen deed mee en presteerde iets beter.)
Aan de Universiteit van British Colombia behaalde hij in 2013 zijn ‘Bachelors Electric Engineering’ en aan het Imperial College London behaalde hij in 2015 de graad ‘Master of Science’ (in ‘advanced computing’). Tijdens zijn computerstudie ging zijn aandacht o.m. uit naar de toepassing van kunstmatige intelligentie en zelflerende machines. Hij werkte aan een project waar robots tegen elkaar voetbalden en hij vond het een uitdaging voor zijn afstudeeropdracht weer iets met schaken te doen. Schaken is een van de meest onderzochte onderwerpen bij kunstmatige intelligentie. Duizenden artikelen zijn er sinds 1950 verschenen over schaken met de computer. En er zijn sindsdien honderden schaakprogramma’s gemaakt, ook door Nederlanders!
Matthew zag nieuwe mogelijkheden om een schaakprogramma te ontwikkelen dat niet primair gebaseerd is op de brute rekenkracht van de computer, zoals bij IBM’s Deep Blue, maar werkt met neurale netwerken en kunstmatige intelligentie. Het nieuwe schaakprogramma moest zelflerend worden. Programma’s op basis van brute rekenkracht met handmatig ingebrachte schaakkennis waren er al genoeg vond hij. Daaraan kon hij niets meer toevoegen, dat moesten we maar overlaten aan Stockfish en Komodo.
Giraffe
In een aantal maanden heeft hij zijn afstudeeropdracht voltooid en behaalde hij zijn graad ‘Master of Science (advanced computing). Voor zijn afstudeeropdracht maakte hij het schaakprogramma Giraffe, documenteerde het en testte het o.m. op ICC. Met uiteindelijk zeer verbluffende resultaten. Alles was openbaar en vrij toegankelijk (Open Source). Zijn scriptie publiceerde hij ook op een wetenschappelijke openbare site. Verrassend genoeg werd dit snel opgepakt door het toonaangevende Amerikaanse Massachusetts Institute of Technology (MIT) . Het hek was daarna van de dam.
MIT Technology Review kopte in september/oktober 2015:
Machine leert zichzelf in 72 uur schaken en speelt op internationaal meester niveau.
Voor het eerst speelt een machine als een mens door de stelling op het bord te beoordelen en niet door brute force alle mogelijke zetten te berekenen en te beoordelen. De eerste machine die als een mens schaakt.
Een computerrobot die schaakt als een mens? Ging dit nieuws geruisloos aan de Nederlandse schaakwereld voorbij?
Matthew Lai hierover:
‘Na de publicatie door MIT begon de roem die bijna vier weken duurde. Het verhaal van MIT werd internationaal door veel sites en tijdschriften overgenomen. (In Nederland bijvoorbeeld door het blad De Ingenieur.) Het gevolg hiervan was dat ik dagelijks veel e-mails kreeg die ik lang niet allemaal kon beantwoorden. Dat had ik niet verwacht. Na 4 weken trad de rust gelukkig weer in en hoefde ik mij niet meer schuldig te voelen voor het niet beantwoorden van e-mails.’
‘Wat een uitdaging zou het zijn als Giraffe op grootmeesterniveau zou kunnen spelen. Wel erg moeilijk, maar niet onmogelijk. Wat een uitdaging!’
‘Ik weet zeker dat mijn concept voor meer denksporten toepasbaar is. Wat met schaken kan, kan ook met dammen, bridge, go etc.’
Hij ging zich voorbereiden voor een terugkeer naar Canada, maar eerst wilde hij nog een aantal steden in Europa bezoeken. Het zouden Lissabon, Praag, Wenen en Boedapest worden. In Boedapest woont Judit Polgár met haar gezin en ook haar ouders.
Het project Giraffe stopt per direct
Na terugkeer van zijn backpackingreis door Europa meldde hij in januari aan familie, vrienden en volgers het volgende:
‘Met pijn in mijn hart moet ik meedelen dat ik per direct stop met mijn project Giraffe ondanks het vele plezier dat ik aan het project heb beleefd.
‘Ik ben in dienst getreden bij Google DeepMind en ik heb het gevoel dat mijn werk voor Giraffe te dicht bij het werk komt dat ik ga doen bij Google DeepMind. Ik mag voor Giraffe alleen kennis gebruiken die publiek beschikbaar is en dat is in de praktijk nog niet zo makkelijk. Door mijn werk krijg ik zoveel nieuwe kennis en technieken tot mijn beschikking dat het bijna onmogelijk is vast te stellen wat publiek is en wat bedrijfsgeheim. Ik zou ‘Giraffe’ aanzienlijk kunnen verbeteren maar dan is de kans groot dat ik de afspraken met Google DeepMind schend.’
‘Iedereen is vrij Giraffe op te pakken en er mee verder te gaan, ik hoop dat dit gebeurt want er ligt nog een mooie toekomst voor Giraffe in het verschiet.’
I got a job!
Matthew meldde over zijn baan bij Google DeepMind het volgende:
‘Natuurlijk had ik tijdens mijn studie kennis genomen van de activiteiten van Google DeepMind. Ik heb niet gesolliciteerd bij Google DeepMind omdat ik dacht dat dit enkele divisies te hoog was voor mij. Ik dacht dat zijn alleen studenten wilde hebben die al gepromoveerd waren. Een wetenschappelijk onderzoeker van Google DeepMind had mijn scriptie gezien en bracht mij in contact hun personeelsfunctionaris.’
‘Hangout-sessies met Google-medewerkers volgden. In totaal sprak ik 10 uur met medewerkers uit verschillende disciplines, ik moest de Google-quiz doen en ik had het genoegen een half uur te mogen spreken met een van de oprichters van DeepMind. Dat is niet voor iedereen weggelegd. Hij vertelde mij over een aantal ‘high-level ideas’ m.b.t. de toepassing van kunstmatige intelligentie en (zelf)lerende machines en de richting die Google DeepMind uit wil.’
‘Giraffe en mijn scriptie kwamen zijdelings aan de orde. Al snel kreeg ik een aantal interessante tips en kwamen onderwerpen en technieken aan de orde waaraan ik nog nooit had gedacht. Ik zou er zo mee aan de slag kunnen.’
‘Het waren aardige mensen en interessante gesprekken, maar over de inhoud van de gesprekken mag ik niets vertellen. Ook al was ik niet aangenomen dan had ik dit voor geen goud willen missen.’
‘Mijn plan was om niet terug te gaan naar Engeland, mijn spullen waren al in Canada. Ik ben gewend ‘last-minute’ beslissingen te nemen en zo’n kans bij Google DeepMind laat je niet lopen. Dus mijn spullen kunnen weer terug naar Londen en het voordeel is nu dat ik de kosten hiervoor niet zelf hoef te betalen.’
Kritische kanttekeningen
Moest ‘Giraffe’ het afleggen ten gunste van AlphaGo? Was ook deze kop niet te zwaar aangezet?
Op 21 januari berichtte Matthew Lai publiekelijk over zijn baan bij Google DeepMind. Op 27 januari publiceerde Google DeepMind over AlphaGo en de Go-matches die in de maanden daarna zouden volgen.
Natuurlijk kwamen er ook kritische kanttekeningen. Sommigen vonden de MIT-publicatie te zwaar aangezet, terwijl anderen twijfelden of Giraffe echt wel grensverleggend was. Ook de geheimzinnigheid kon niet ieders goedkeuring wegdragen, maar zo werkt dit nu eenmaal. Microsoft bouwt een reusachtig datacenter op de Agriport aan de A7 in Noord-Holland. Een project van ca. 2 miljard euro (excl. apparatuur). Microsoft wil hieraan geen enkele ruchtbaarheid geven en alle gecontracteerde partijen die betrokken zijn bij de bouw moesten voor vertrouwelijkheid tekenen.
Robotisering
Schaken en Go zijn natuurlijk maar baby-projectjes vergeleken met het echte werk, maar wel interessante schakels in het onderzoek. Google, Facebook, Microsoft, IBM, Samsung en vele andere grote multinationals investeren miljarden in onderzoek naar de zakelijke toepassing van kunstmatige intelligentie, zelflerende machines en big data. Zij rekruteren wereldwijd de knapste koppen. Want het gaat om geld en macht op de wereldmarkt. De digitale (kennis)revolutie is in aantocht.
In het blad THINK stond recent een artikel van Hidde Tangerman over het Robot-complex.
De intro luidde:
Worden robots slimmer dan wij? Vrienden of vijanden?
‘De meeste kunstmatige intelligentie-deskundigen denken dat het prima leven is met robots die slimmer zijn dan mensen. Superintelligente bots zouden zelfs zaken als de economische crisis en het klimaatprobleem onder de duim kunnen krijgen. Maar volgens een kwart van die wetenschappers wordt een wereld met superintelligente robots gevaarlijk als de machines zelfbewust worden.’
In het Algemeen Dagblad schreef Hanneke van Houwelingen deze week het artikel: Dokter Google, ik voel me niet lekker!
De intro luidde:
Google is allang veel meer dan een zoekmachine.
‘De nieuwe missie van de tech-reus : ons fitter maken en vertellen wat er aan scheelt als we ons niet lekker voelen. Maar waar bemoeit Google zich mee?’
Een van Google’s datacenters
En zo verschijnen er steeds meer publicaties. Dit is nog maar het begin. Tegelijkertijd zullen de discussies tussen voor- en tegenstanders van de nieuwe ontwikkelingen feller worden omdat er veel op het spel staat.
(Dit artikel is onderdeel van de serie Met Stalen zenuwen Grenzen verleggen, lees ook deel 1, deel 2, deel 3 en deel 4)