Inhalen in de Formule 1 IV

Analyse
Een van de dingen die Formule 1-races de moeite van het kijken waard maken, zijn onvervalste inhaalacties. Helaas werd er jarenlang maar erg weinig ingehaald. De aerodynamica is de boosdoener, maar er spelen nog talloze andere factoren een rol, zoals ik in eerdere delen al had besproken.

Vanaf halverwege de jaren 80 tot halverwege de jaren 90 nam het aantal inhaalacties in de Formule 1 spectaculair af. Kwam dat door de steeds geavanceerder wordende aerodynamica? Kwam het door technologische hoogstandjes als de halfautomatische versnellingsbak die het de coureurs makkelijker maakten? Of waren de steeds bochtiger wordende circuits de hoofdschuldigen?

Om op die vragen antwoorden te vinden, moeten in een analyse de veranderingen van alle factoren die het aantal inhaalacties kunnen beïnvloeden over de tijd gekwantificeerd kunnen worden. Bij sommige factoren is dat makkelijk. Het aantal wagens dat van start gaat, is bijvoorbeeld zo’n factor. Maar hoe ga je aerodynamica in een getal uitdrukken? Het idee was daarom om het model alleen met factoren te voeden die wel gekwantificeerd konden worden, zodat het model de restterm (als het goed is de invloed van de aerodynamica) schat.

Het model modelleert het aantal inhaalacties per race (gedefinieerd als alle inhaalacties na de eerste ronde) aan de hand van voor de hand liggende controlevariabelen als jaar, circuit, het aantal wagens dat de eerste ronde overleeft en de betrouwbaarheid van de wagens. Deze variabelen behoeven geen toelichting en kunnen direct in het model worden opgenomen.

Menging
Moeilijker wordt het als controlevariabelen mee moeten worden die de menging van het veld na de eerste ronde aangeven, want hoe druk je die menging in een getal uit? Mijn idee was als volgt: vergelijk de positie van iedere coureur na de eerste ronde met zijn startplaats en tel de absolute verschillen van alle coureurs bij elkaar op. Vervolgens standaardiseerde ik het getal zodanig dat een maximale menging altijd het getal 1 opleverde.

Een getallenvoorbeeld: er zijn 10 coureurs, waarvan de snelsten achteraan liggen en de traagsten vooraan. De menging is dan dus maximaal. De koploper rijdt 9 plaatsen boven waar hij zou moeten rijden, de nummer 2 rijdt 7 plaatsen boven waar hij moet rijden, enzovoorts. De som van de afwijkingen is 50 en dat is het maximaal mogelijke voor 10 coureurs. Voor 20 coureurs is de som der afwijkingen maximaal 200, vier keer zoveel dus. De maximaal mogelijke spreiding neemt dus kwadratisch toe met het aantal coureurs. Om de spreiding te standaardiseren gebruik ik dus de formule:
Menging = 2 x som der afwijkingen / aantal coureurs²

De menging is dan dus een getal tussen de 0 en 1 en geeft aan hoeveel coureurs uit positie zijn, wat een sterke voorspellende kracht voor het aantal inhaalacties heeft.* In de analyse waar ik de afgelopen zomer mee bezig was, heb ik als startplaats overigens de verwachte startplaats gebruikt, gebaseerd op de startplaatsen over het gehele seizoen. Het idee was dat coureurs zich doorgaans rond dezelfde startplaats kwalificeren, en dat er op deze manier voor vreemde uitbijters gecorrigeerd wordt. In de Grand Prix van België in 1995 kwalificeerde Michael Schumacher zich bijvoorbeeld in een kwalificatie met wisselende weersomstandigheden slechts als 16e, terwijl hij zich meestal ergens in de top 3 kwalificeerde. De verwachte startplaats, die is gebaseerd op een trendlijn, corrigeert voor eenmalige uitbijters, en geeft dus een betere voorspelling van de snelheid van een coureur in de race. Schumacher werkte zich in de race op vanuit de achterhoede en won zelfs nog.

Het nadeel is wel dat de analyse onnauwkeurig wordt als de kwalificatieresultaten wel sterke veranderingen van race tot race laten zien, wat in recentere jaren (vooral 2008 en 2009) vaak gebeurde omdat de snelheidsverschillen zo klein waren. Zo kwalificeerden de Toyota’s van Jarno Trulli en Timo Glock zich in Bahrein 2009 op de eerste startrij, om een maand later in Monaco het veld voor zich uit te moeten jagen. Ik heb een oplossing voor het probleem bedacht, maar daarover ga ik een andere keer over vertellen.

In ieder geval is er nu dus een mengingsvariabele in de analyse. De mengingsvariabele is eventueel ook heel erg belangrijk om te begrijpen waardoor het aantal inhaalacties in de jaren 80 en 90 zo is afgenomen. Is dat gekomen doordat het veld minder gemengd was in het begin van de race? Daar is wel iets voor te zeggen, maar een gedegen analyse zal daar pas antwoord op kunnen geven.

* Een kwadratische specificatie is ook mogelijk. Dan is menging gelijk aan de wortel van 3 x som der kwadratische afwijkingen / aantal coureurs³.

Geef een reactie

Je e-mailadres wordt niet gepubliceerd. Vereiste velden zijn gemarkeerd met *