In de voetsporen van AlphaZero
´Symfonie van de randpion´ in een amateuruitvoering
In een partij in de onderlinge competitie probeerde ik in de voetsporen te treden van AlphaZero. Ik waagde mij aan een amateuruitvoering van de ‘Symfonie van de randpion’, zoals die partij inmiddels is gaan heten. Wat kan een clubschaker leren van de dimensie die dit revolutionaire AI-programma aan het schaken heeft toegevoegd? Op die vraag hoopte ik spelenderwijs een antwoord te krijgen. Helaas klinkt mijn symfonie hier en daar vals, maar fascinerend was het wel.
Computerschaak heeft me nooit echt geboeid maar ik heb de ontwikkelingen wel altijd geprobeerd te volgen. Onder de indruk ben ik al lang, geïnspireerd was ik echter nog nooit. Nu wel. De game changer in dit verband is AlphaZero. Het gelijknamige boek moet ik nog lezen maar een voorpublicatie in het magazine New in Chess fascineerde me mateloos. Het gaat om het hoofdstuk met de fraaie titel ‘Symfonie van de randpion’ (‘The rook’s pawn symphony’).
In die partij kwam de ruilvariant van het damegambiet op het bord, een populaire opening op clubniveau.
De variant behoort tot mijn repertoire met zwart. De aanpak van AlphaZero, een zelflerend monster, imponeerde mij en ik besloot het systeem ook zelf toe te passen, als ik de kans zou krijgen.
Die kans kreeg ik, sneller dan gedacht. Eigenlijk te snel, want ik had de partij eerst nog wel wat beter willen bestuderen. Vier zetten van AlphaZero waren me bijgebleven, maar niet precies de context waarin ze zijn gespeeld. Hieronder ter vergelijking de momenten waarop deze zetten in beide partijen op het bord komen. De omstandigheden wijken nogal af.
Net als AlphaZero speelde ik in het middenspel eerst ‘zomaar’ mijn h-pion op, alsof die enige bedreiging zou kunnen vormen. Muis brult naar olifant, sterker nog muis stapt helemaal alleen dapper op hem af.
In het vervolg ruilde ik na de verwachte witte opstoot b5 net als AlphaZero niet met mijn a-pion maar met mijn c-pion. Niet onbekend, maar standaard wordt met de a-pion geslagen. Vervolgens stuurde ik ook deze randpion naar voren, ogenschijnlijk in het kader van net zo’n zinloze operatie als de opmars van de andere randpion.
Mijn stukje AlphaZero-beleving onderging ik op de clubavond van HSG op donderdag 21 februari. Ik kreeg tijdens de partij het gevoel onderdeel te zijn van iets groots, iets magisch.
Of AlphaZero echt de game changer in het schaakspel zal zijn, zoals inmiddels door velen wordt verondersteld, dat moet natuurlijk nog blijken. De meeste kenners zijn het er wel over eens dat het programma anders speelt dan eerdere computers, in een aantrekkelijke intuïtieve aanvallende stijl.
Binnenkort zal er wellicht een nieuw schaakprogramma op de markt komen waarin het AlphaZero-algoritme is verwerkt. Als een nieuwe generatie hiermee opgroeit, kan bij wijze van spreken nieuw schaak-DNA ontstaan dat bijdraagt aan verhoging van het algemene schaakniveau. Net zoals dat eerder gebeurde met de komst van Fritz, inmiddels een respectabele grijsaard.
Natuurlijk trek je als kleine krabbelaar een te grote broek aan als je denkt zomaar even een Alphazerootje te kunnen doen op de clubavond. Maar ik kon de verleiding van de symfonische lokroep van …, h5 en …, a5 niet weerstaan.
Het werd een boeiend gevecht waarin beide spelers kansen hebben gehad en hun niveau (ongeveer 2100) wel hebben gehaald, denk ik. In hevige wederzijdse tijdnood profiteerde ik uiteindelijk van een ernstige fout van mijn tegenstander.
Ter inleiding vier momenten uit beide partijen. Maar eerst nog een schaaktechnische opmerking. Het ‘copyright’ in deze variant van de speelwijze met …, h6 en …, Ph5 ligt niet bij AlphaZero maar is een aanbeveling van moderne theoretici, zoals Nikolaos Ntirlis in zijn boek ‘Playing 1. d4 d5’. Dat AlphaZero, ongeprogrammeerd en zonder ‘boek’ en met een geschatte elorating van 3300+, deze zetten selecteert uit alle varianten die voorbijkomen, strekt deze openingsgidsen wellicht tot eer.
- Het h5-moment.
De witte stellingen vertonen duidelijk meer overeenkomsten dan de zwarte. Guido heeft zijn paard via f3 naar d2 gespeeld. Stockfish heeft gekozen voor een opstelling met Pge2. In beide gevallen wacht wit het juiste moment af van de te kiezen strategie, minoriteitsaanval of doorbraak in het centrum. Of dit verstandige flexibiliteit is of hinken op twee gedachten, dat oordeel laat ik graag aan de echte experts over. In mijn stelling staat een paard op b6 in plaats van op e6 waar ik mijn loper heb geparkeerd. De stelling van AlphaZero oogt harmonieus. In mijn symfonie klinken reeds de eerste valse noten. Het paard staat duidelijk beter op e6 dan op b6. Opvallend: mijn ´conventionele´ computer kiest in de computerpartij ook voor …, h5, maar verwerpt deze zet in mijn partij (overigens heeft mijn keuze geen grote invloed op de evaluatie).
2. Het Kh6-moment.
In de computerpartij is het nog niet gekomen tot de minoriteitsaanval, kenmerkend voor de Karlsbad-pionnenstructuur. Guido en ik zijn al een stuk verder gevorderd. Op h6 staat de zwarte koning relatief veilig. Het opzij stappen van de g-lijn dient ook voor toekomstige druk met een toren op g8. Mijn computer acht beide stellingen hier overigens redelijk in balans.
3. Het b5-moment.
Meestal neemt zwart hier één keer, en wel met de a-pion. Maar in de randpionsymfonie past een speciale rol voor de zwarte a-pion. Deze moet de samenwerking van de witte stukken gaan frustreren. Kans op promoveren is uitgesloten, maar de pion is straks wel een handenbinder. Als het zover is, concentreert zwart zich op de andere vleugel voor een aanval op de witte koning, dat is het idee van de georkestreerde aanval met twee randpionnen als stoorzenders.
4. Het g4-moment.
In het meesterwerk van AlphaZero is deze zet voorafgegaan door h4. Dit voorkomt wits antwoord in mijn partij, waarna er niets anders opzit dan de aanval voort te zetten met een pionoffer om de witte koningsstelling te verzwakken. Dit was mijn eigen vondst maar past wel in de geest van AlphaZero – en trouwens ook van mijn standaard computerprogramma. Toch ziet, vanuit het perspectief van zwart, het plaatje boven er beter uit (onder lijkt de chaos of pseudo-chaos groter en is de coördinatie van de zwarte stukken niet optimaal). Mijn computer geeft op beide borden zwart hier overigens een klein plusje.
De partijen.
Voor de liefhebbers: schaakcommentatoren bespreken een indrukwekkende andere partij van AlphaZero.
Lees ook: mijn interview met Jaap van den Herik, pionier computerschaak, waarin hij ook reageert op de verpletterende doorbraak van AlphaZero in het najaar van 2017.
Kunstmatige intelligentie: vloek of zegen?
Filmpje!
Het Game Changer-team heeft twee instructieve video’s gemaakt van de Karlsbad-pionnenstructuur. In deel 1 bespreken ze mijn – op de aanpak van AlphaZero van de Ruilvariant – geïnspireerde partij tegen Guido Wagenvoorde in de interne competitie van HSG!
Website HSG, 26 februari 2019
INTERESSANTE LINKS
SCHAKEN
hsghilversum.nl
KRANTEN
gooieneemlander.nl