De aanleiding van dit verhaal is het artikel The myth of Europe’s Little Ice Age van de economen Kelly en Ó Gráda, dat verscheen op de economenwebsite VOX. Daarin stellen de schijvers dat de Kleine IJstijd, een koude periode tussen circa 1550 en circa 1850, een artefact zou zijn van het gebruik van voortschrijdende gemiddelden. Zouden ze gelijk hebben?
Intermezzo: random getallenseries en het Slutsky effect
In het volgende plaatje is een serie van 1000 willekeurige (random)
getallen tussen 1 en 100 getoond (bron: https://www.random.org/integers/).
In het plaatje valt geen structuur te zien, zoals je overigens ook zou mogen verwachten.
Hooguit lijken sommige puntjes wat samen te klitten, terwijl er elders leegtes te zien zijn. Maar dat is het gevolg van de willekeurige verdeling van die
getallen.
De
volgende vier plaatjes tonen voortschrijdende gemiddelden van deze random
getallen, uitgaande van 10, 30, 50 en 100 getallen. Voor degenen die daar niet
mee bekend zijn: een voortschrijdend gemiddelde is het gemiddelde van een
aantal voorgaande getallen. Voorbeeld: het 50 getals voortschrijdend gemiddelde
van het 150ste getal is het gemiddelde van de getallen 101 t/m 150.
In de
grafieken is iets opmerkelijks te zien, althans als je bedenkt dat ze gebaseerd
zijn op willekeurige getallen, namelijk dat er duidelijke golven in te zien
zijn. Bovendien, als je goed kijkt, zie je dat die golven langer worden naarmate de serielengte van het voortschrijdend gemiddelde langer is. Als je een golf definiert
als een piek met aan beide kanten een dal met een diepte
van minstens een kwart van de verticale schaal (pieken met een "poot" aan de zijkant ook meetgeteld), dan vind je het volgende
verband tussen golflengte en serielengte.
Het bijzondere van deze golven is dat ze niet echt zijn! Of beter, dat ze veroorzaakt worden door het gebruik van voortschrijdende gemiddelden. Vandaar ook dat je ziet dat hun golflengte groter wordt naarmate de lengte van het voortschrijdende gemiddelde groter wordt. Dat komt doordat het gebruik van voortschrijdende gemiddelden een afhankelijkheid introduceert: dicht bij elkaar gelegen waarden zijn op min of meer dezelfde getallen gebaseerd. Daardoor worden random fluctuaties gedempt, waarbij die demping sterker wordt naarmate de waarden dichter bij elkaar liggen, en de overlap dus groter is. Pas op afstanden van meer dan een serielengte, waar er geen overlap meer is, verdwijnt dit verband.
Dit opmerkelijke
verschijnsel van het opduiken van golfpatronen in grafieken van
voortschrijdende gemiddelden van series random getallen, waarbij de lengte van
die golven bovendien afhangt van de lengte van het gebruikte voortschrijdende gemiddelde,
wordt wel het Slutsky-effect genoemd, naar de
Russische wiskundige statisticus Eugen Slutsky.
Een vergelijking met Nederlandse klimaatgegevens
In de
volgende grafiek zijn gemiddelde jaartemperaturen voor Nederland in de periode
1300 – 2000 getoond, zoals vastgesteld door het KNMI (A millenium of weather, winds
and water in the low countries, Van engelen, Buisman en IJnsen). Het betreft deels metingen
(na circa 1700) en voor het overige schattingen op basis van allerhande
inderecte waarnemingen.
Wat
je ziet is dat deze gemiddelde jaartemperaturen een nogal willekeurig karakter
hebben, net als de random getallen hiervoor, zij het dat de waarnemingen zich lijken
te concentreren rond een gemiddelde waarde van circa 8,8 graden. Verder zijn er geen duidelijke patronen in te zien, hoewel de puntenwolk na circa 1900
enigszins naar boven lijkt af te buigen. En als je er van een afstandje naar
kijkt, dan lijkt de puntenwolk naar het midden toe enigszins "door te zakken".
In de
volgende vier plaatjes zijn voortschrijdende temperatuurgemiddelden getoond,
uitgaande van periodes van 10, 30, 50 en 100 jaar.
Ook
in deze grafieken zijn duidelijke golfpatronen te zien, vergelijkbaar met die
bij de random getallen. En net als bij de random getallen neemt de golflente
toe met de serielengte. Dat wordt bevestigd door de volgende grafiek, waarin
het verband is getoond tussen de lengte van het voortschrijdende gemiddelde en
de gemiddelde golflengte (beide in jaren). Hierbij is een golf opnieuw gedefinierd
als een piek met aan beide kanten een dal met een diepte
van minstens een kwart van de verticale schaal, waarbij pieken met een "poot" aan de zijkant ook zijn meegeteld.
Al
met al lijken de golven die zichtbaar zijn in de grafieken van de
jaartemperatuur nogal op de golven die te zien zijn in
de grafieken van het voorbeeld met willekeurige getallen. De lastig te
vermijden conclusie is dat ook deze golven tenminste voor een belangrijk deel artefacten zijn van de
berekening van de voortschrijdende temperatuurgemiddelden, net als bij het
voorbeeld met de random getallen.
De enige
patronen die niet goed bij de veronderstelling van een random verdeling lijken
te passen, zijn de patronen die ook al zichtbaar zijn in de grafiek van de ruwe gegevens: de opwaartse uitbraak na circa 1900 (duidelijk zichtbaar in alle
voortschrijdende gemiddelde grafieken), en het "doorzakken" van het midden van de puntenwolk (vooral in de 100-jaars grafiek duidelijk terug te zien).
De conclusie die je al met al wel uit dit verhaal kan trekken is dat je bij het gebruik van
voortschrijdende gemiddelden op basis van optisch nogal random aandoende
gegevens erg voorzichtig moet zijn met het verbinden van specifieke verklaringen
aan golfpatronen die in voortschrijdende gemiddelde grafieken zichtbaar zijn.
Het lijkt erop dat dit soort technieken hooguit bruikbaar is voor het
bevestigen van patronen die in grafieken met ruwe gegevens al zichtbaar
zijn.
Was de kleine ijsdijd een mythe?
Terug naar het artikel van Kelly en Ó Gráda, de aanleiding van dit verhaal. De twee schrijvers stellen op basis van in Nederland gemeten en geschatte gemiddelde jaarlijkse zomertemperaturen, dat de vermeende Kleine IJstijd een artefact is van het gebruik van voortschrijdende gemiddelden. Het Slutsky effect dus. Hebben ze gelijk?
Kelly en Ó Gráda baseerden zich alleen op zomertemperaturen, terwijl de analyse hiervoor is gebaseerd op gemiddelde jaartemperaturen. Daarin is de vermeende afkoeling in Kleine Ijstijd in de ruis van koudere en warmere jaren nauwelijks zichtbaar. Maar "door de oogharen heen" is ze wel te zien, wat wordt bevestigd door de 100-jaars voortschrijdend gemiddelde temperatuurgrafiek. Daarin is vanaf het begin (1300) een per saldo neergaande beweging zichtbaar, die na 1650 omslaat in een per saldo opgaande beweging.
Overigens komt dat grote patroon in die 100 jaars grafiek redelijk overeen met het resultaat van een natuurlijke "voortschrijdend gemiddelde generator", de lengte van de gletsjers in de Zwitserse Alpen, zoals nota bene aangehaald door Kelly en Ó Gráda zelf. Die gletsjes begonnen rond 1450 te groeien, bereikten een piek rond 1650, krompen vervolgens tot circa 1750, om tot circa 1850 opnieuw te groeien, waarna hernieuwde krimp inzette.
Kort gezegd: het lijkt erop dat er althans in Europa wel degelijk sprake was van zoiets al een kleine ijstijd. Maar het effect daarvan "verzuipt" in de veel sterkere ruis van de natuurlijke afwisseling van warmere en koudere jaren, zodat de mensen in die tijd er waarschijnlijk niet zo heel veel van gemerkt zullen hebben (behalve dan de mensen met een gletsjer in hun achtertuin).
©
Anton van de Haar, april 2015