Data analyse met Business intelligence: Global Warming

Business intelligence

29 augustus 2019

Het klimaat verandert, er wordt regelmatig gesproken over Global Warming, kunnen we met data analyse via Business intelligence ook aantonen dat er sprake is van global warming? Volgens het artikel “The Effect is Climate Change in the Netherlands: What’s going to happen?” dat diverse bronnen samenvat, zou er sprake zijn van 1,7 verwarming sinds 1900. Er is veel openbare data beschikbaar die we kunnen combineren om inzicht te krijgen. En misschien kunnen we ook met de data wel een goede voorspelling doen! 

Data inlezen in business intelligence tool

Om aan de slag te gaan met business intelligence hebben we data nodig: De bron voor het weer in Nederland is het KNMI waar je van diverse meetstations in Nederland de dagelijkse weer samenvattingen kunt downloaden. Dit hebben we dan ook gedaan voor De Bilt.

De gegevens hebben we vervolgens ingelezen in de tool Qlik Sense. Een fijne en overzichtelijke tool om data analyses mee te doen. Zo’n tool helpt je om veel gegevens op een overzichtelijke manier weer te geven zodat je conclusies kunt trekken en tot nieuwe inzichten kunt komen.

De juiste weergaves kiezen voor inzicht

Het kiezen van de juiste weergave is een van de belangrijkste valkuilen wanneer je aan de slag gaat met zo’n dashboard. 

Gemiddelde dagtemperatuur

Wanneer je de ingelezen data bijvoorbeeld in een grafiek zet met gemiddelde dagtemperaturen zie je door de bomen het bos niet meer. Je kunt er geen enkele conclusie aan verbinden.

Op weekniveau vergelijken

Wanneer we vervolgens de weergave aanpassen en de jaren over elkaar heen leggen op weekniveau zien we een heel ander beeld.

Hieruit kunnen we afleiden dat de temperatuur regelmatig verschilt, maar nog steeds kunnen we niet zien of de temperatuur door de jaren heen eigenlijk aan het stijgen is. Nog maar eens een andere weergave proberen om inzicht te kunnen krijgen.

Bekijken op maandniveau per decennium

We kiezen er nu voor om op maandniveau de temperatuur te tonen per decennium. Enig nadeel is dat we vlak voor een decennium einde zitten. Dit decennium kunnen we dus niet meenemen, omdat deze niet representatief is wegens ontbrekende data. Eventueel kunnen we 2019 uit dit decennium weglaten. Zo lang we met gemiddeldes werken, zal de impact daarvan beperkt zijn.

Zo kunnen we het al een stuk beter zien! De kleuren zijn in dit geval echter niet zo’n goede keuze. We kunnen vervolgens kiezen voor een kleur verloop. Dan krijg je zo’n grafiek:

Zo kun je het nog makkelijker zien dat de temperatuur geleidelijk aan het toenemen is.

Per decennium in tijd

Nog een optie voor een weergave is om de gemiddelde dagtemperatuur per decennium in tijd uit te zetten. Dan zien we ineens heel duidelijk dat er vanaf 1970 een flinke stijging is in de temperatuur. In deze grafiek hebben we het laatste decennium gecorrigeerd omdat 2019 nog wegvalt omdat we nog niet alle data hebben van dit jaar.

Uit deze weergave kunnen we ook afleiden naast dat het piekt vanaf 1970 we in het huidge decennium iets lager uit gaan komen dan het vorige decennium.

Laagste en hoogste temperatuur

Eerder keken we steeds naar de gemiddelde dag temperatuur. In de data van het KNMI kunnen we ook aan de slag gaan met het analyseren van de hoogste en de laagste temperatuur. 

We willen natuurlijk niet dat de incidenten (recordtemperaturen) prominent naar voren komen. Daarom gaan we naar de percentielen kijken. Wanneer je kiest voor percentiel 1 (100%), zou dat overeenkomen met de hoogste temperatuur, en percentiel 0 (0%) juist met de laagste. Daarom nemen we voor de hoogste temperatuur percentiel 0,9 (90%) en voor de laagste temperatuur 0,1 (10%). Een willekeurige keuze: het kan later ook blijken dat je uit andere percentielen meer inzicht kunt krijgen. Dat kun je altijd nog uit proberen. Gemakshalve hebben we daarnaast de mediaan voor de gemiddelde dagtemperatuur toegevoegd.

Om de getallen wat inzichtelijker te maken, zetten we bovenstaande grafiek uit in een tabel met daarin de mediaan over de periode 1900 - 1910 ten opzichte van de mediaan 2000 - 2100.

Op basis van deze eerste aanzet komen we uit rond de 2,2 graden temperatuurstijging, wat al behoorlijk in de richting van de gerapporteerde 1,7 graden komt.

Kom met ons in contact