Robuustheid van homogenisatie van KNMI onderzocht

We hebben hier het afgelopen jaar al twee keer aandacht besteed aan het kritische rapport van Dijkstra, Ruis, De Vos en Crok over de homogenisatie van temperatuurmetingen van De Bilt door het KNMI. Inmiddels heeft meteoroloog Ben Lankamp van Weerplaza de homogenisatie van het KNMI gereproduceerd. Hij heeft ook onderzocht hoe gevoelig de resultaten zijn voor gemaakte keuzes die door Dijkstra bekritiseerd werden. De invloed van die keuzes op het resultaat van de homogenisatie is klein. De gebruikte referentie heeft het meeste invloed: een combinatie van Nederlandse en Duitse stations levert een wat kleinere correctie op dan wanneer alleen Eelde wordt gebruikt.  Maar de keuze voor Eelde is een logische, op basis van meteorologische argumenten. De conclusie: de homogenisatie is reproduceerbaar en robuust. Hieronder licht Ben zijn analyse toe.

Gastblog van Ben Lankamp

In het voorjaar van 2019 verscheen het rapport ‘Het raadsel van de verdwenen hittegolven’, door Frans Dijkstra, Jan Ruis, Rob de Vos en Marcel Crok. Zij hebben de homogenisatie van de temperatuurgegevens in De Bilt, uitgevoerd door het KNMI in 2016, onderzocht en stellen dat deze ‘te rigoureus’ is uitgevoerd.

In navolging daarvan heb ik contact gehad met zowel de auteurs van het rapport als de auteur van de homogenisatie, Theo Brandsma, bij het KNMI. Mijn doel was allereerst om te kijken of de resultaten van het KNMI binnen acceptabele marges kunnen worden geproduceerd. Dit was namelijk de auteurs van het ‘hittegolvenrapport’ niet gelukt.

Vervolgens ben ik de belangrijkste kritiekpunten in dit rapport nagelopen om te kijken of die hout snijden. Mijn eigen uitgangspunt hierin was neutraal en zo goed als mogelijk objectief: mensen zijn niet feilloos, ook wetenschappers niet. De discussie moet je zo veel mogelijk aangaan en niet vermijden.

Noodzaak van homogeniseren

In het geval van een verandering in de meetapparatuur, de opstelling of complete verplaatsing naar een andere locatie, ontstaat er een breuk (inhomogeniteit) in de meetreeks. Hiervoor corrigeren heet ‘homogeniseren’ en dat is een normale procedure.

Ook buiten de klimatologie gebeurt dit regelmatig, bijvoorbeeld het Centraal Bureau voor de Statistiek ‘homogeniseert’ werkloosheidscijfers voor seizoenseffecten en past soms ook een correctie toe op historische cijfers, als actuele cijfers worden gebaseerd op een andere bron.

Niet elke breuk is zo groot dat daarvoor ook een correctie nodig is. De noodzaak van corrigeren kan statistisch worden getest met een breuktest (gebruikelijk is de Standard Normal Homogeneity Test, SNHT). Deze test wordt doorgaans uitgevoerd op de gemiddelde dagelijkse gang.

Omdat de meeste discussie omtrent de homogenisatie zich toespitst op de maximumtemperatuur, heb ik ervoor gekozen om SNHT uit te voeren op het verschil tussen de hoogste en laagste maximumtemperatuur in het jaar (de jaarlijkse reikwijdte).

Figuur 1: SNHT uitgevoerd op het jaarlijkse reikwijdte van de Tx van De Bilt. Blauwe stippellijn is de grens voor een breuk met betrouwbaarheidsniveau van 95%.

In de ongecorrigeerde meetreeks van De Bilt constateert de breuktest een hoogst significante breuk in 1951 (figuur 1), wat overeenkomt met het moment van de bekende aanpassingen. Hiermee wordt de bruikbaarheid van deze test aangetoond én de noodzaak voor homogenisatie.

Conclusie: door wijzigingen in de meetopstelling is een breuk ontstaan in de meetreeks van De Bilt. Om verantwoord te kunnen vergelijken tussen hedendaagse metingen en vroegere metingen, is daarom homogenisatie noodzakelijk. Dit is een algemeen bekende en geaccepteerde procedure in uiteenlopende wetenschappelijke disciplines.

NB: het bestaan van de breuken en de noodzaak van homogeniseren wordt door de auteurs van het hittegolvenrapport onderschreven.

Methode van homogeniseren

Om te homogeniseren kan gebruikt worden gemaakt van een klimatologisch zo representatief mogelijke andere meetlocatie waar onverstoord is gemeten (die dus homogeen is). De beste toepassing hiervan is het gebruik van parallelmetingen.

Er wordt daarbij enkele jaren achtereen gelijktijdig op zowel de oude als nieuwe wijze en/of op de twee locaties gemeten, zodat het verschil kan worden bepaald en daarmee de oude metingen worden gecorrigeerd.

In het geval van de meetreeks van De Bilt zijn er twee breuken kort na elkaar, allereerst een verandering in type meethut in september 1950 en vervolgens een verplaatsing van de thermometerhut in augustus 1951.

Voor de verandering van type meethut is parallel gemeten met het oude en nieuwe type hut in de periode 1946-1949, maar er is destijds nooit parallel gemeten op de oude en nieuwe meetlocatie. De reden hiervoor is onbekend, maar dat is mogelijk een kwestie van geld, tijd en materiaalgebrek geweest in de eerste jaren na de Tweede Wereldoorlog.

In de periode 2003-2005 is door het KNMI op vier verschillende locaties gelijktijdig gemeten om een indicatie te krijgen van de ordegrootte van temperatuurverschillen binnen een straal rond de huidige meetlocatie in De Bilt.

Daarbij is ook gemeten op een plek dicht bij de oorspronkelijke locatie pre-1951, maar nog altijd ca. 80 meter westelijker omdat de exacte plek neerkomt op de geasfalteerde binnenplaats voor de ingang van de nieuwbouw van het KNMI (Brandsma, 2019). Bovendien is de omgeving in vijftig jaar tijd ook nog eens flink veranderd.

Het gecombineerde effect van het andere type meethut én de verplaatsing, hoeft verder niet gelijk te zijn aan de som van de afzonderlijke veranderingen. Dat is zelfs onwaarschijnlijk, omdat denkbeeldig enkel de verplaatsing van de Pagodehut naar de meer open locatie, vermoedelijk deels ook de negatieve effecten van dit type hut (broei op warme dagen door onvoldoende ventilatie) had gemitigeerd.

Conclusie: beschikbare parallelmetingen geven zeer waarschijnlijk geen goed beeld van het (afzonderlijke) effect van de verplaatsing in 1951 en nog minder van het gecombineerde effect met de verandering in type meethut. De parallelmetingen zijn daarmee in beginsel ongeschikt om een volledige homogenisatie mee uit te voeren.

Reproductie van KNMI-methode

In een tijdbestek van ongeveer twee weken is de homogenisatie-methode van het KNMI nagebouwd in het statistisch pakket R. Dit pakket is ook gebruikt door het KNMI in de oorspronkelijke studie.

Het technisch rapport van het KNMI beschrijft de gehanteerde methode weliswaar grondig, maar een paar cruciale details ontbreken. Deze details hebben de auteurs van het hittegolvenrapport via e-mail van het KNMI gekregen.

De resultaten uit de reproductie komen in zeer grote mate met de ‘officiële’ cijfers overeen, de correlatiecoëfficiënt (R2) bedraagt 0,997 en de gemiddelde afwijking is 0,03 graden. Het aantal tropische dagen en hittegolven komt exact overeen.

Figuur 2: verschil in temperatuur (verticale as) per maand (horizontale as) tussen de periode voor 1950 en daarna. Elke grafiek toont een percentielwaarde, lopend van 5 (koudste dagen) tot 95 (heetste dagen). Om te homogeniseren wordt in de betreffende maand en voor het gevonden percentiel, de waarde in de grafiek van de oorspronkelijke meting afgetrokken.

In bovenstaande figuur is het verschil tussen de oude situatie (voor 1950) en de moderne opstelling weergegeven. Dit is een reproductie van figuur 16 uit de publicatie van Brandsma (2016).

Conclusie: het is mogelijk om, met behulp van de aanvullende informatie over uitgevoerde tussenstappen, de homogenisatie van het KNMI nagenoeg exact na te rekenen. Dit bevestigt dat de methodiek reproduceerbaar is en sluit ‘werkfouten’ uit.

Smoothing-parameters

In het hittegolvenrapport wordt uitgebreid geschreven over de keuze van het KNMI voor de parameters van de LOESS-smoothing. Voor zowel de smoothing over de percentielen als de maanden heeft het KNMI middels ‘expert judgement’ voor een venster van 0,6 gekozen.

Als alternatief is bekeken wat de resultaten zijn bij een venster van 0,5 voor de percentielen en 0,7 voor de maanden (variant 1), en het voorstel van de auteurs van het hittegolvenrapport, namelijk 0,75 voor beiden (variant 2).

Dit zijn de resultaten voor de periode 1 januari 1901 t/m 31 december 1950:

Smoothing Dagen Tx >30°C Hoogste temperatuur Aantal hittegolven
Ruwe metingen 164 36,8°C 23
KNMI (homogeen) 76 35,6°C 7
Basis (Eelde) 76 35,6°C 7
Variant 1 78 (+2) 35,6°C (=) 7 (=)
Variant 2 77 (+1) 35,4°C (-0,2°C) 7 (=)

Conclusie: de keuze voor andere redelijke parameters van de LOESS-smoothing heeft nauwelijks invloed op de eindresultaten.

Lengte van referentieperiode

Er is ook gekeken naar het verschil tussen het gebruik van 48 maanden in plaats van 56 maanden, waarbij de keuze voor de 48 maanden in nog eens twee varianten is uitgesplitst (t.w. heel kalenderjaar en zo dicht mogelijk op de breuken).

Als derde optie is aan weerszijden een periode van 5 jaar genomen, over hele kalenderjaren. De vierde optie is ook vijf jaar, maar zo kort mogelijk op de breuken.

Oude situatie Nieuwe situatie Lengte
Basis 1 jan. 1946 t/m 31 aug. 1950 1 jan. 1952 t/m 31 aug. 1956 56 maanden
Variant 1 1 jan. 1946 t/m 31 dec. 1949 1 jan. 1952 t/m 31 dec. 1955 48 maanden
Variant 2 1 sep.1946 t/m 31 aug. 1950 1 sep.1952 t/m 31 aug. 1956 48 maanden
Variant 3 1 jan. 1945 t/m 31 dec. 1949 1 jan. 1952 t/m 31 dec. 1956 60 maanden
Variant 4 1 sep.1945 t/m 31 aug. 1950 1 sep.1951 t/m 31 aug. 1956 60 maanden

Dit zijn de resultaten voor de periode 1 januari 1901 t/m 31 december 1950:

Referentiestations Dagen Tx >30°C Hoogste temperatuur Aantal hittegolven
Ruwe metingen 164 36,8°C 23
KNMI (homogeen) 76 35,6°C 7
Basis (Eelde) 76 35,6°C 7
Variant 1 87 (+11) 35,7°C (+0,1°C) 8 (+1)
Variant 2 79 (+3) 35,6°C (=) 7 (=)
Variant 3 84 (+8) 35,7°C (+0,1°C) 8 (+1)
Variant 4 76 (=) 35,6°C (=) 7 (=)

Conclusie: de lengte van de ‘overlapperiode’ en de positionering t.a.v. het kalenderjaar heeft enige invloed op de resultaten. Er valt daarin geen eenduidigheid te ontdekken. Het grootste effect wordt gevonden bij een kortere periode die gehele kalenderjaren omvat, het kleinste effect (nul) bij een langere periode die juist ten opzichte van het kalenderjaar verschoven is.

De keuze van het KNMI voor de bewuste periode van 56 maanden, in feite een soort (onbedoelde) middenweg tussen 4 en 5 jaar, geeft geen vertekening naar een bepaalde richting. Om die reden is de oorspronkelijke periode bij alle overige homogenisaties hierna aangehouden.

Keuze voor referentiereeks

Figuur 3: gemiddeld aantal tropische dagen per jaar in de periode 1981-2010. Merk op dat De Bilt en Eelde zich op dezelfde isopleet bevinden.

In Nederland zijn er vier kandidaat referentiereeksen: Den Helder, Eelde, Maastricht en Vlissingen. Het blijkt dat Eelde in de vijf jaar voorafgaand en volgend op de breuk (1946-1949 en 1952-1959) de grootste correlatie met De Bilt vertoont (R2 = 0.978), gevolgd door Vlissingen en Maastricht. Den Helder is hekkensluiter.

Wanneer we kijken naar de waardeverdelingen (cumulatieve verdeling), dan is er ook een betere overeenkomst tussen De Bilt en Eelde dan met Den Helder, Vlissingen en Maastricht, vooral bij de allerhoogste waarden.

Dat is ook logisch, als je kijkt naar de klimatologische verdeling van hete dagen in Nederland (figuur 3). Die wordt grotendeels bepaald door de afstand tot de Noordzee en terreingesteldheid (grondsoort en hoogte).

In klimatologische zin zijn Den Helder en Vlissingen laaggelegen, maritieme stations, De Bilt en Eelde zijn gemengd maritiem-continentaal en Maastricht vertoont een duidelijk continentaler klimaatregime. Dit geldt uiteraard in nog sterkere mate voor stations in Duitsland, ten oosten en zuidoosten van Nederland.

Waarom geen referentie op basis van meerdere stations?

Voor homogenisatie wordt bij voorkeur gebruik gemaakt van een composiet van meerdere referentiestations. Een belangrijke voorwaarde is daarbij wel dat de stations – vanuit klimatologisch oogpunt – goed vergelijkbaar zijn.

Daar steekt juist het bezwaar voor De Bilt: alle beschikbare kandidaten hebben een duidelijk afwijkend klimaatregime. Twee stations zijn zeer maritiem en Maastricht is te continentaal.

De voorkeur gaat daarom uit naar het gebruik van één referentiestation op een zo kort mogelijke afstand, met een vergelijkbaar klimaatregime en daardoor een zo groot mogelijke overeenkomst in temperaturen. De keuze valt dan logischerwijs op Eelde.

Gebruik van Duitse stations

Ondanks de klimatologische bezwaren tegen het gebruik van referentiestations nog verder landinwaarts, zeker als we ons beperken tot hete dagen, zijn er binnen een afstand van 250 km van De Bilt ook een aantal stations in Duitsland met langjarige metingen die potentieel kunnen dienen als referentiestation.

De kandidaten met beschikbare data vanaf 1 januari 1945 t/m 31 december 1956 zijn Aachen, Solingen-Hohenscheid, Köln-Stammheim en Bochum.

De SNHT is ook toegepast op de meetreeksen van deze stations, want de reeks van het referentiestation moet immers zelf homogeen zijn.

In de reeks van Aachen wordt een significante breuk gedetecteerd in 1947. Dat klopt min of meer met de metadata: het station is namelijk driemaal verplaatst in korte tijd: in september 1944, in april 1945 en vervolgens in april 1950.

De SNHT detecteert de breuk in de tijd dus ongeveer halverwege de laatste twee verplaatsingen.

In de reeksen van Solingen en Köln-Stammheim worden geen significante breuken gedetecteerd, wat overeenkomt met de metadata.

Solingen
Aachen
Köln-Stammheim
Figuur 4: SNHT testresultaten voor drie Duitse meetreeksen

Bochum is een reeks met twee grote onderbrekingen, waardoor de homogeniteit van de periode 1940-1959 niet kan worden geverifieerd. Dit station is daarom buiten beschouwing gelaten.

Figuur 5: meetstations met beschikbare metingen (gekleurde bolletjes) van de maximumtemperatuur op 1 mei 1945

Gecombineerde internationale referentiereeks

Met behulp van de metingen van deze Duitse stations is gekeken naar homogenisatie op basis van een combinatie van alle genoemde stations in Nederland en Duitsland, evenals een combinatie van enkel de Nederlandse stations.

De combinatie is gemaakt op basis van weging naar gemiddelde correlatie met de ruwe metingen van De Bilt in de periodes 1946-1949 en 1952-1959, volgens de vergelijking w = 1 / c3:

NL+DE Enkel NL
Eelde: 35% 42%
Vlissingen: 28% 34%
Maastricht: 16% 19%
Keulen: 10%
Solingen: 7%
Den Helder: 4% 5%

Uit deze weging blijkt dat Eelde als belangrijkste factor meeweegt, in de NL+DE reeks zelfs meer dan 1/3e. Dat viel ook te verwachten uit de klimatologische redenatie.

Vlissingen weegt vrij sterk mee, 28%, vermoedelijk omdat door het jaar heen op dit station enerzijds gemiddeld iets warmere lucht in het zuiden en anderzijds verkoeling van het nabije zeewater elkaar ten dele opheffen, zodat het temperatuurverloop gemiddeld redelijk in de buurt van De Bilt komt.

Het landstation Maastricht volgt op de derde plaats met een duidelijk lagere score, daarna volgen de Duitse stations en het kuststation Den Helder met slechts 4% is hekkensluiter.

In onderstaande tabel staan de resultaten van de homogenisatie gebaseerd op de gecombineerde referentiereeksen uit Nederlandse en Duitse stations en enkel Nederlandse stations:

Referentiestations Dagen Tx >30°C Hoogste temperatuur Aantal hittegolven
Ruwe metingen 164 36,8°C 23
KNMI (homogeen) 76 35,6°C 7
Basis (Eelde) 76 35,6°C 7
Combinatie NL+DE 98 (+22) 35,7°C (+0,1°C) 10 (+3)
Combinatie alleen NL 85 (+9) 35,6°C (=) 7 (=)

Tussen haakjes staat het verschil t.o.v. de homogenisatie van het KNMI.

Conclusie: de meetlocatie Eelde is het meest geschikt als individueel referentiestation voor homogenisatie van de meetreeks van De Bilt.

Een referentiereeks gebaseerd op zes stations in Nederland en Duitsland levert kleinere correcties op. Met een referentiereeks alleen gebaseerd op Nederlandse stations, is het verschil met de correctie gebaseerd op Eelde relatief klein.

Samenvatting – aantal hittegolven en hete dagen met marges

In de meetreeks van De Bilt zit een aantoonbaar significante breuk. De oorzaken hiervan zijn de verandering van het type meethut en de wijziging van de meetlocatie in 1950/1951. Om tegenwoordige metingen met metingen van vroeger te kunnen vergelijken, is een correctie nodig, ook wel homogenisatie genoemd.

De homogenisatie van De Bilt zoals het KNMI die heeft uitgevoerd is nauwkeurig reproduceerbaar en geeft robuuste resultaten, wanneer er wordt gevarieerd met verschillende instellingen voor smoothing en referentieperiode.

Op de keuze voor Eelde als referentiestation, wegens het ontbreken van geschikte parallelmetingen, valt vanuit de klimatologie weinig af te dingen. Als er wordt gehomogeniseerd op basis van meerdere stations, zijn de correcties kleiner, in sterkere mate als ook stations op grotere afstand (verder landinwaarts) worden meegenomen. Hierbij geldt wel dat deze stations zich in een continentaal klimaatregime bevinden, terwijl De Bilt continentaal-maritiem is.

In iedere onderzochte mogelijke variant van de homogenisatie, hieronder samengevat, wordt het aantal hittegolven en tropische dagen vóór 1950 flink naar beneden bijgesteld, in de ordegrootte die de homogenisatie van het KNMI al liet zien.

Type reeks Dagen Tx >30°C Hoogste temperatuur Aantal hittegolven
Ruwe metingen 164 36,8°C 23
KNMI (homogeen) 76 35,6°C 7
Basis (Eelde) 76 35,6°C 7
Smoothing variant 1 78(+2) 35,6°C (=) 7 (=)
Smoothing variant 2 77 (+1) 35,4°C (-0,2°C) 7 (=)
Periode variant 1 87 (+11) 35,7°C (+0,1°C) 8 (+1)
Periode variant 2 79 (+3) 35,6°C (=) 7 (=)
Periode variant 3 84 (+8) 35,7°C (+0,1°C) 8 (+1)
Periode variant 4 76 (=) 35,6°C (=) 7 (=)
Combinatie NL+DE 98 (+22) 35,7°C (+0,1°C) 10 (+3)
Combinatie alleen NL 85 (+9) 35,6°C (=) 7 (=)
Beste schatting 82 (± 14) 35,6°C (± 0,2°C) 8 (± 2)

Uit deze experimenten kan een indruk worden gekregen van de onzekerheid die de homogenisatie kent. Die ligt in de orde van 0,2 graden op de heetste dagen, wat resulteert in de periode 1901-1950 in een verschil van plusminus 14 tropische dagen en twee hittegolven meer of minder.

Omdat een tropische dag een harde grens kent (30,0 graden) en een hittegolf ook bestaat uit harde criteria, wordt een kleine onzekerheid in de onderliggende grootheid, sterk uitvergroot in deze tellingen.

We kunnen desondanks met grote zekerheid zeggen dat het aantal tropische dagen en hittegolven, in de periode 1901-1950, met ten minste de helft moet worden gereduceerd om vergelijkbaar te zijn met de huidige metingen.

Bronvermeldingen

De volgende bronnen zijn geraadpleegd:

  • Alexandersson H, Moberg A (1997) Homogenization of Swedish temperature data. Part I: Homogeneity test for linear trends. Int J Climatol 17(1):25–34.
  • Brandsma, T. Homogenization of daily temperature data of the five principal stations in the Netherlands (v1.0). De Bilt, Technical report; TR-356, 2016.
  • Deutscher Wetterdienst, Climate Data Portal.
  • Dijkstra. F, Ruis, J., De Vos, R. Crok, M., Het raadsel van de verdwenen hittegolven (versie 2), 2019.
  • KNMI gemeten en gehomogeniseerde reeksen.
  • Brandsma, T., 2011: Parallel air temperature measurements at the KNMI observatory in De Bilt (the Netherlands) May 2003 – June 2005. KNMI Scientific Report, WR 2011-01.
  • Brandsma T., Jilderda R. and Sluijter R., 2013: Standardization of data and methods for calculating daily Tmean, Tn and Tx in the Netherlands for the 1901-1970 period.
  • Brandsma T. and Van der Meulen J.P., 2007: Thermometer screen intercomparison in De Bilt (the Netherlands) – Part II: Description and modeling of meantemperature differences and extremes. Int. J. Climatol, 2007.
  • Brandsma. T., 2019: Pagodemetingen in De Bilt. Meteorologica 28(1), 4-8.
  • Grothendieck, G. (2017), “sqldf: Manipulate R Data Frames Using SQL,” R Package Version 0.4-11.
  • Hyndman, R. J. and Y. Fan, 1996: Sample quantiles in statistical packages, American Statistician 50, 361–365.
  • R Development Core Team (2008). R: A language and environment for statistical computing, R Foundation for Statistical Computing, Vienna, Austria. ISBN 3-900051-07-0.

19 Reacties op “Robuustheid van homogenisatie van KNMI onderzocht

  1. Dank voor de nuttige en onderbouwde artikelen! Zeer nuttig!
    Ik vroeg mij af of er al data en ervaringen gebruikt (kunnen) worden van Isotope Research/ESRIG van de RUG? Deze hebben mega ervaringen en data wereldwijd met klimaat, weer en relevante artikelen!

  2. Guido van der Werf

    Chapeau Ben Lankamp voor het uitpluizen en duidelijk opschrijven. Ik vind met name de gevoeligheidsanalyse nuttig; het is duidelijk dat je uitkomst varieert aan de hand van je aannames maar groot zijn die variaties blijkbaar niet. Het zou de heren Dijkstra en co sieren als ze hier online reageren met eventuele op- of aanmerkingen zodat deze discussie tot een einde kan komen.

    Wellicht is het nuttig om een link naar de gebruikte R-code toe te voegen?

  3. Van marrewijk jan

    Je Kunt berekenen wat je wilt iedere 100.000 jaar ongeveer heeft de aarde een ijsperiode en een opwarmingperiode sinds 20.000 jaar is de opwarming begonnen dus we weten wat ons te wachten staat 170.000 geleden was de zeespiegel 5a6 m hoger als nu zonder autos. industrie etc we moeten eens ophouden met de klimaathysterie

  4. Hans Custers

    De kennis over ijstijden en interglacialen volgt uit precies dezelfde wetenschap die nu op de menselijke invloed wijst. En dat heeft verder niets te maken met de analyse van Ben Lankamp.

    Wie over iets anders dan de analyse van Ben wil discussiëren kan terecht in de open discussie.

  5. Goed dat er nog eens gekeken is naar de homogenisatie; met het bovenstaande stuk is het weer wat duidelijk geworden hoe die verlopen is. En gelukkig is het verhaal dat de procedure niet reproduceerbaar is hiermee ontkracht.
    Toch is het wel vervelend dat er zoveel gedoe over is, en voor een deel heeft het KNMI dat ook aan zichzelf te danken. In 2011 is de Klimaatatlas verschenen, populair geschreven voor een breed publiek. Hierin naast kaarten van het actuele klimaat (hoewel: de cijfers lopen altijd achter) ook veel cijfers over het klimaat en klimaatverandering sinds 1901. Met daarbij cijfers van het aantal koude- en hittegolven per jaar. Als vroegere metingen met terugwerkende kracht veranderd worden dan is dat koren op de molen voor klimaatsceptici en -‘sceptici’.
    Het is duidelijk dat de gegevens van vóór en na 1950 niet goed vergelijkbaar waren, dus in die zin is het goed als er een meer homogene reeks van gemaakt wordt. In België (Ukkel) speelde iets dergelijks en daar waren de gegevens al in de zestiger jaren gehomogeniseerd. De procedure was daar anders: er werd gebruik gemaakt van de gegevens van zonuren per dag, zodat er per dag een correctie uitgevoerd kon worden. Ik denk dat dat in De Bilt ook een beter resultaat had opgeleverd. En er zijn plannen om dat alsnog te doen. Waarom is dat dan niet ineens uitgevoerd? Pas na de homogenisatie zijn nieuwe parallelmetingen uitgevoerd met een nagebouwde versie van de Pagodehut en een oude Stevensonhut. Wanneer de Pagode op een plek was geplaatst die op de oude opstelling leek dan had een vergelijking met de nu operationele opstelling ons direct verteld op welke manier deze verschillen. De gegevens van Groningen/Eelde hadden we dan niet nodig gehad.

    Voor wie zich er verder in wil verdiepen staat hieronder een tweetal bestanden. In het eerste zijn de recente parallelmetingen naast elkaar gezet, aangevuld met de operationele metingen.
    In het tweede bestand zijn de parallelmetingen uit 1947-1950 opgenomen, aangevuld met de oude en nieuwe operationele gegevens en gegevens van zonuren, windkracht en neerslag.

    http://www.logboekweer.nl/Temperatuur/Pagode_vs_Stevenson.xlsx
    http://www.logboekweer.nl/Temperatuur/Pagode4750.xlsx

    Overigens, op deze site zullen we het er met de meeste bezoekers over eens zijn dat klimaat verandert, en dat de hele discussie over hittegolven en homogenisatie maar een klein onderdeeltje is van de Nederlandse klimaatstatistiek. Discussie over het klimaatbeleid is veel zinvoller; daar is een heleboel over te zeggen.

  6. Hans Custers

    Bart,

    Een paar opmerkingen.

    Je zegt dat het KNMI het gedoe deels aan zichzelf te danken heeft. Ik weet niet zo goed wat het KNMi anders had moeten doen. Want het uitgangspunt van het pseudosceptische gedoe is overduidelijk: het is niet goed of het deugt niet. Misschien had het KNMI al eerder kunnen besluiten om de metingen te homogeniseren, maar ik ben ervan overtuigd dat dat voor het gedoe niet had uitgemaakt. Het is het resultaat van de homogenisatie dat de pseudosceptici niet bevalt, en omdat het vrij complex is en het lekker makkelijk scoren is met retoriek als “aanpassen van metingen” zullen ze er ook gewoon mee doorgaan, vermoed ik.

    Verder zeg je dat je denkt dat een andere methode een beter resultaat opgeleverd zou hebben voor De Bilt. Wat versta je dan onder “beter”? “Beter” impliceert immers dat de homogenisatie zoals die is uitgevoerd niet betrouwbaar of robuust zou zijn. De analyse van Ben Lankamp lijkt nu net op het tegendeel te wijzen.

    Tenslotte zeg je over de parallelmetingen:
    Wanneer de Pagode op een plek was geplaatst die op de oude opstelling leek dan had een vergelijking met de nu operationele opstelling ons direct verteld op welke manier deze verschillen
    Dat klinkt misschien logisch, maar dat zou alleen mogelijk zijn geweest als er accurate informatie zou zijn geweest over de precieze toestand van de oude meetlocatie. Ik betwijfel of dat het geval is. Een vergelijkbare toestand creëren is simpelweg niet mogelijk als je niet weet waarmee je moet vergelijken.

  7. Natuurlijk, sommige mensen zijn er op uit om het KNMI onderuit te halen, of berichten over klimaatverandering. Maar dat is des te meer reden om er secuur mee om te gaan. Het is duidelijk dat de dataset van De Bilt vóór 2015 niet homogeen was. Maar het had volstaan om een betere serie te maken voor wetenschappelijk gebruik. Door de dataset operationeel te maken wordt er gesuggereerd dat we precies weten wat op dagen vóór 1950 de maximum- en minimumtemperatuur was. Maar dat is niet zo, die kan er nog steeds een volle graad naast zitten. Gemiddeld over een maand zal het wel ongeveer goed zijn, maar juist voor het vaststellen van hittegolven moet je weten hoe het per dag was. En als het KNMI zelf al aan geeft dat de dataset nog verbeterd kan worden, waarom is dat dan niet in één keer gedaan?

    Vóór de ‘homogenisatie’ was er al een andere operatie uitgevoerd, een ‘standaardisatie’. Opeens bleek dat temperatuurmetingen vóór 1971 dubbel uitgevoerd waren, waarbij soms van de ene en soms van de andere meting gebruik gemaakt was. Hierover was niets gezegd in de metagegevens van station De Bilt. (Ook het gebruik van een minumum-maximum thermometer wordt niet genoemd.) Door de selectie van de gegevens met terugwerkende kracht te standaardiseren zou de dataset nu verbeterd moeten zijn. Maar nu kloppen de etmaalgegevens niet meer met de uurgegevens: daarin komen soms hogere maxima voor dan in de nu officiële maxima. Het wordt er niet overzichtelijker op.

    Het zou denk ik goed zijn als het KMMI in de operationele gegevens in een apart veld meer informatie geeft over de status daarvan. Wat is de oorspronkelijke plek waar de data verzameld zijn, en zijn het de oorspronkelijke meetwaarden of zijn deze herberekend?

  8. Hans Custers

    Bart,

    Volgens mij heeft het KNMI nergens gezegd, of bedoeld te zeggen, dat de dataset met de huidige kennis nog verbeterd kan worden. Als ze (kleine) correcties in de toekomst niet uitsluiten dan bedoelen ze daarmee dat ze open blijven staan voor voortschrijdend inzicht. Dat is tenminste hoe ik het begrijp.

    En verder vind ik het wat merkwaardig dat je nauwelijks op mijn antwoord ingaat, maar in plaats daarvan weer met wat nieuwe kritiek op het KNMI komt, die niet in je vorige reactie stond. Het wekt – ik kan er niks aan doen – enigszins de indruk dat je op zoek bent naar een stok om de hond te slaan.

    Als het KNMI 50 jaar geleden niet heel zorgvuldig is omgegaan met gegevens en als er daardoor informatie ontbreekt in oude metagegevens, dan is dat natuurlijk heel vervelend. Maar je kunt het de mensen die er nu werken niet verwijten.

    Ik denk overigens dat het voor de pseudosceptici niets had uitgemaakt hoe het KNMI met oude gegevens was omgegaan. Dat wil zeggen: als ze simpelweg alleen ruwe data zouden gebruiken zouden pseudosceptici het prima vinden, want dan zouden ze jaar na jaar kunnen blijven roepen dat het aantal hittegolven niet toegenomen zou zijn. En zouden ze elke nuancering die daarbij gemaakt zou worden aanvallen. En als metingen voor 1950 helemaal niet meer gebruikt zouden worden, dan zou de retoriek zijn dat er een halve eeuw aan metingen zou zijn geschrapt.

    Ik denk dat het de taak van het KNMI is om een zo goed mogelijk beeld te geven van de werkelijke ontwikkelingen in het klimaat. Ze moeten zich niet laten leiden door de angst dan een analyse misbruikt zou kunnen worden door pseudosceptici. Zo’n defensieve houding zou geen goed uitgangspunt zijn voor onderzoek, vind ik.

  9. Hans Custers.
    Verdere aanpassingen in de dataset worden genoemd in een artikel van Theo Brandsma in Meteorologica (p 6-7), maart 2019.

    Je gedachte ‘dat ik op zoek ben naar een stok om de hond te slaan’ vind ik wel heel merkwaardig. Waarom zou ik? Ik heb alle vertrouwen in de integriteit van het KNMI. Ik heb al 8 jaar een website (logboekweer.nl) waarop ik gegevens van het KNMI inzichtelijk presenteer, juist voor klimaatsceptici en -‘sceptici’ die het verschil tussen weer en klimaat niet goed zien (dat is soms ook lastig). Ik neem de moeite om onder mijn eigen naam te reageren op een beruchte site als Climategate.nl, dat is een slangenkuil waar vaak grote onzin over het klimaat wordt geschreven, en over het KNMI.
    Waar mogelijk prik ik dat door, maar je kunt er ook moedeloos van worden en de stroom houdt nooit op.

    Los van de wetenschappelijke kant vind ik dat het KNMI wel slordig is met de publiekscontacten. Bijvoorbeeld in de populair geschreven Klimaatatlas van 2011 staan rare fouten en onvoldoende onderbouwde statistieken. Ik heb dat destijds gemeld maar ik heb er nooit antwoord op gehad. En er is een hele pagina gewijd aan koude- en hittegolven. Zoals gezegd: niet handig om de statistiek een paar jaar later dan helemaal te herzien.

  10. Herstel: pagina 6-7 moet zijn pagina 7-8

  11. Bart schreef op 27 oktober: In België (Ukkel) speelde iets dergelijks en daar waren de gegevens al in de zestiger jaren gehomogeniseerd. De procedure was daar anders: er werd gebruik gemaakt van de gegevens van zonuren per dag, zodat er per dag een correctie uitgevoerd kon worden. Ik denk dat dat in De Bilt ook een beter resultaat had opgeleverd.

    Dezelfde retorische truc als van Crok cs: als het resultaat je niet bevalt noem je iets anders “beter”. Maar je hebt het niet nagerekend dus dat weet je helemaal niet. En wat is je maat voor “beter”? Er zijn in de statistiek hele boeken vol geschreven over of en hoe je kunt bepalen of het ene model beter is dan het andere. Dus wat had je hier in gedachten?

  12. Wat een zure reactie, Jan van Rongen. Ik gebruik helemaal geen retorische truc. Heb je eigenlijk wel gelezen wat ik op heb geschreven? Als er met terugwerkende kracht wordt vastgesteld dat er vroeger minder hittegolven waren, prima. Dat wordt ook door ervaringen met meetmethoden in het buitenland ondersteund. Maar daar is ook vastgesteld dat je tot een beter resultaat komt als je ook de gegevens van de zonneschijn er bij betrekt. Het KNMI overweegt zoiets nu alsnog te gaan doen. Maar dat levert dan wéér een nieuwe dataset op. Dat werkt verwarrend en beter had dat in één keer kunnen gebeuren. Door de recente parallelmeting iets anders op te zetten hadden de gegevens daarvan direct gebruikt kunnen worden. Staat dat allemaal in je statistiekboeken, Jan van Rongen?

    https://www.frankdeboosere.be/vragen/vraag150.php

    N.B. ik zie nu dat de homogenisatie in Ukkel niet in de zestig jaren was, maar recenter.

  13. Ongetwijfeld os het zuur voor je dat ik even door je beweringen heen prik, maar dat maakt mijn opmerking nog niet zuur. Het valt des te extra op dat je je weerwoord niet onderbouwt, maar je toevlucht zoekt in beweringen van onbekende “experts”:…

    Dat wordt ook door ervaringen met meetmethoden in het buitenland ondersteund. Maar daar is ook vastgesteld dat je tot een beter resultaat komt als je ook de gegevens van de zonneschijn er bij betrekt.

    Het lijkt me dat je hier dus nog steeds iets beweert en tegelijk geen enkel bewijs aanlevert. In de eerste plaats niet voor wat ik noemde, nl.:
    (a) dat je de Ukkelse methode niet hebt toegepast op KNMI-data maar wel voorshands al aanneemt dat die “beter” is, en:
    (b) dat “beter” jouw subjectieve beoordeling is in plaats van een statistische aanpak zoals AIC (die hier niet werkt) of cross validation .
    Ik ben ook benieuwd naar een beschrijving in de wetenschappelijke literatuur van die Ukkelse methode, In een recent overzicht van homogenisatie (https://eartharxiv.org/8qzrf/) kom ik hem niet tegen. SNHT uiteraard wel.

  14. Hans Custers

    Bart,

    Ik ben het eens met mrooijer. Je hebt tot nu toe helemaal niet beargumenteerd waarom die methode beter zou zijn. Tot nu toe heb je alleen laten zien dat de methode die voor Ukkel is gebruikt anders is.

    Ik zie zou gauw ook niet hoe die Ukkelse methode geschikt zou zijn om te corrigeren voor de verplaatsing van het station in De Bilt.

    Overigens, voor zover daar misverstand over zou zijn, is het absoluut niet mijn bedoeling om je hiermee op één lijn te stellen met pseudosceptici. Want ik weet dat je niet tot die groep hoort en ik waardeer het zeker dat jij dapper de discussie aan blijft gaan op hun blogje. Maar op het punt dat je in deze discussie probeert te maken kan ik je niet goed volgen en tot nu toe vind ik je argumenten niet overtuigend.

  15. Bart Vreeken

    Ik kan ook geen verdere beschrijving vinden van de homogenisatie van de temperatuurgegevens van Ukkel. Dat kan erop wijzen dat deze geen officiële status heeft. In de operationele reeks gaan de metingen van de open thermometerhut dan zonder correctie over op de metingen uit de stevensonhut. De reeks is dan, zoals we hebben vastgesteld, niet homogeen.
    De methode die Frank de Boosere (bekend weerman in België) toepast moet op zijn minst met medewerking van het KMI hebben plaatsgevonden, want er is gebruik gemaakt van de jarenlange parallele metingen en in België zijn de gegevens niet vrij beschikbaar. De Boosere komt tot een correctie van de maximumtemperatuur per maand maar merkt erbij op dat het resultaat niet op afzonderlijke dagen toegepast mag worden. Een beter resultaat wordt verkregen door gebruik te maken van de gegevens van de hoeveelheid zon. Ook het KNMI overweegt een dergelijke verbetering. Dat heb ik niet verzonnen, dat schrijven ze zelf op.
    Zelf heb ik bestanden samengesteld waarin de historische en de recente parallelmetingen naast elkaar zijn gezet. Ik heb het niet heel systematisch gekeken, maar ik heb gekeken naar rare uitbijters. Bijvoorbeeld: de Pagode geeft een grote positieve afwijking van de Tx als er een sneeuwdek ligt wat door de zon beschenen wordt. De Tx in de Pagode geeft een negatieve afwijking als het regent en hard waait (kennelijk wordt de thermometer dan nat).

  16. Pingback: Wereldtemperatuur | Update september 2019 - Sargasso

  17. Aangemoedigd door de reacties van mrooijer heb ik de verschillen tussen de uitgevoerde correctie voor de Tx en de gemeten verschillen tussen Pagode en Stevensonhut nader onderzocht. Probleem blijft dat we niet precies weten wat het toegevoegde effect is van de verplaatsing van de meethut 1951. Je zou wel willen dat de gecorrigeerde gegevens meer gaan lijken op de metingen met de Stevensonhut, en dat er een zichtbaar verband is tussen de gemeten verschillen per dag en de uitgevoerde correctie per dag. Dat is niet het geval.

    Ik heb per maand onderzocht hoe het gemeten verschil zich verhoudt tot de correctie. Dat levert 12 figuren op, zie onderstaan document. Binnen de gegevens van 1 maand (van 3 of 4 verschillende jaren) heb ik gesorteerd op het gemeten temperatuurverschil. Het valt dan op dat er weinig of geen verband is met de uitgevoerde correctie.

    Waarschijnlijk heeft het KNMI dit ook al opgemerkt, en is dit de reden dat er gedacht wordt over verfijning van de homogenisatie. Het blijft jammer dat dat niet gelijk is gebeurd; waneer de dataset opnieuw aangepast wordt hebben we nóg een versie erbij. Het beste zou zijn om nieuwe metingen te verrichten met de Pagode op een plek die lijkt op de situatie rond 1947. Deze kunnen dan vergeleken worden met de lopende operationele metingen.

    http://www.logboekweer.nl/Temperatuur/CorrectieTxDeBilt%201947%20-%201950%20nader%20onderzocht.pdf

  18. Hans Custers

    Bart,

    Je zegt:

    Het beste zou zijn om nieuwe metingen te verrichten met de Pagode op een plek die lijkt op de situatie rond 1947.

    Zoals ik eerder al zei: dat kan alleen als er voldoende detailinformatie is over die plek. En als er een vergelijkbare plek beschikbaar is. Dat zou nog wel eens vies tegen kunnen vallen.

    Zoals je zelf al zegt houdt jouw analyse geen rekening met de verplaatsing. Dat maakt de analyse in mijn ogen niet zo zinvol. Let vooral ook op wat Ben daar in zijn gastblog over schrijft:

    Het gecombineerde effect van het andere type meethut én de verplaatsing, hoeft verder niet gelijk te zijn aan de som van de afzonderlijke veranderingen. Dat is zelfs onwaarschijnlijk, omdat denkbeeldig enkel de verplaatsing van de Pagodehut naar de meer open locatie, vermoedelijk deels ook de negatieve effecten van dit type hut (broei op warme dagen door onvoldoende ventilatie) had gemitigeerd.

  19. We komen nu kennelijk in een welles-nietes fase terecht. Dat is niet zo zinvol.

    Ik plaats de link ook op weerwoord.be, daar heeft het onderwerp al langere tijd de aandacht.

Geef een reactie

Vul je gegevens in of klik op een icoon om in te loggen.

WordPress.com logo

Je reageert onder je WordPress.com account. Log uit /  Bijwerken )

Google photo

Je reageert onder je Google account. Log uit /  Bijwerken )

Twitter-afbeelding

Je reageert onder je Twitter account. Log uit /  Bijwerken )

Facebook foto

Je reageert onder je Facebook account. Log uit /  Bijwerken )

Verbinden met %s