fredag, december 07, 2007

Lies, damn lies and statistics

Att man kan bevisa vad som helst med statistik är väl känt, men det är sällan man träffar på något som så tydligt beskriver vilken abstraktion ett medelvärde egentligen är som följande artikl på SMHI:s hemsida: Onormalt normal novemberväder i Göteborg.

För första gången sedan mätningarna startade 1859 har Göteborg haft en medeltemperatur och nederbörd som stämmer överrens normalvärdet. "Normalvärdet är egentligen inget annat än ett referensvärde kring vilket vädret varierar på olika tidsskalor, och ibland kan svängningarna dessutom vara ganska stora." Inte ens med en tillåten avvikelse på någon tiondels grad kan SMHI hitta särskilt många månader i Stockholm, där mätningarna pågått längre, som överrenstämmer med normalvädret.

Jag fick höra på ett seminarium i förra veckan att om man tar statistik som är sammanställd på en hög nivå (land, region eller kanske till och med global nivå) och sedan bryter ner den i mindre enheter så finns i princip hela den variation man kan se på den större nivån i den mindre enheten. Att finna statistiska samband handlar alltså om att hårddra tendenser och ignorera avikelser. Och med rätt vinkel kan man hitta nästan vad som helst. Generaliseringen som blir resultatet ligger kanske på sätt och vis långt från den så kallade verkligheten - samtidigt påverkar den typen av generaliseringar upplevelsen av verkligheten.

"Att syssla med samhällsvetenskaplig och humanistisk forskning handlar om att göra våld på verkligheten" fick jag höra av en professor för några veckor sedan. Statistik var inte den metod han förespråkade, men jag måste säga att det framstår som ett utmärkt verktyg i sådana strävanden.

Inga kommentarer: