Hej,
Jag har tänkt sjösätta ett initiativ jag funderat på ett tag nu, nämligen att själv beräkna inflationen från källdata. Inflationen som begrepp är ju centralt för vår ekonomi samtidigt som det lätt orsakar viss förvirring när man skrapar lite på ytan. I podden finns det flera intressanta avsnitt om just inflation och det är även flitigt diskuterat här på forumet. Den ekonomisk-historiska litteratur jag läst beskriver hur index i ekonomin “uppfanns” av den amerikanske nationalekonomen Irving Fisher i början av 1900-talet. Det har kommit att bli grunden för mycket i vår samhällsekonomi samtidigt som det är förknippat med en hel del utmaningar. När jag funderat över dessa olika index har de från min ingenjörsmässiga synvinkel alltid varit otillfredsställande då beräkningarna bygger på (ofta godtyckliga) uppskattningar och antaganden. Jag har nu tänkt, med hjälp av de som vill bidra, göra mitt bästa för att försöka gå till botten med hur inflationen egentligen beräknas. Jag sitter bara någon timme då och då så jag tänker mig detta (långa) första inlägg som startpunkten för en typ av löpande dagbok här i forumet där ni är välkomna att antingen bara följa med i uppdateringarna eller - än hellre - bidra med insikter eller uppmärksamma felaktigheter i min metod.
Min ambition är följande.
1. Inhämta data så nära källan som möjligt:
Det bästa jag identifierat är data från SCB:s API. SCB genomför sin datainsamling genom en kombination av butiksbesök och digital inhämtning av priser. De skriver att det varje månad rör sig om ca 300 000 priser från 1 300 butiker. Att återskapa denna process är naturligtvis inte genomförbart. Den mest nedbrutna nivån jag då hittat är den som kallas produktgrupp (länk).
2. Reproducera inflationsberäkningen:
Förstå datastrukturen och identifiera de formler som SCB använder för att sedan kunna beräkna (“reverse engineera”) inflationsmåtten.
Metoden för inflationsberäkningen verkar ha genomgått stora förändringar under pandemin så jag har valt januari 2019 som utgångspunkt för att sedan kunna lägga på pandemiförändringarna efteråt. Utgångspunkten får bli SCB:s rapport från januari 2019 (länk). Från denna ska jag helt enkelt se om det går att reproducera samma siffror med hjälp av “grunddatan”.
Data från SCB:s API har följande format:
Produktgrupp månad KPI vägningstal beskrivning
Vilket ger rader med följande utseende (här är några exempel, det finns totalt 357 olika produktgrupper år 2019):
1113 2019M01 334,71 1,14 vetebröd
1114 2019M01 503,83 0,25 wienerbröd
2203 2019M01 276,25 5,23 öl, > 3,5%
3206 2019M01 88,14 2,06 herrjacka
3207 2019M01 277,27 2,21 herrpullover
4703 2019M01 746,33 28,34 elström, egnahem
6105 2019M01 326,28 29,47 nya bilar
6221 2019M01 151,52 19,29 bensin 95 oktan
Vägningstalen summerar till 1000. Med andra ord är det alltså förutbestämt att t.ex. vetebröds bidrag till den totala KPI-siffran ska vara 1,14/1000=0,114%. Hur detta bestäms kan vara intressant att återkomma till senare. Basåret i KPI är 1980 (index=100) så siffran 334,71 ska tolkas som en ökning från 100 till 334,71, m.a.o. en ökning med 234,71% sedan 1980.
Inflationsrapporten från januari 2019 är uppdelad i två huvudsakliga kapitel:
Utvecklingen den senaste månaden: Förändringen av KPI mellan december 2018 och januari 2019
Utvecklingen det senaste året: Förändringen av KPI mellan januari 2018 och januari 2019 (detta är “inflationstakten” eller kort “inflationen”)
Försök till beräkning av månadsförändringen:
Enligt rapporten har utrikes flygresor minskat med 30,8% vilket motsvarar 0,3 procentenheter:
Grunddatan ger:
6311 2019M01 98,3 7,77 utrikes flygresor
6311 2018M12 142,01 7,32 utrikes flygresor
6311 2018M01 97,33 7,32 utrikes flygresor
Förändringen av “månads”-KPI: (98,3 - 142,01) / 142,01 = -0,3078 (dvs. -30,8%).
Viktat bidrag: 7,77 / 1000 * -0,3078 = -0,0024 (dvs. 0,24 procentenheter)
Enligt rapporten har flygcharter minskat med 18,6% vilket motsvarar 0,2 procentenheter:
Grunddatan ger:
6309 2019M01 153,28 12,37 flygcharter
6309 2018M12 188,2 11,87 flygcharter
6309 2018M01 159,29 11,87 flygcharter
Förändringen av “månads”-KPI: (153,28 - 188,2) / 188,2 = -0,1855 (dvs. -18,6%)
Viktat bidrag: 12,37 / 1000 * -0,1855 = -0,0023 (dvs. -2,3 procentenheter)
Stämmer då denna metod? Beräkningen stämmer inte exakt eftersom 0,24 i så fall avrundats till 0,3 i rapporten men möjligtvis kan det bero på avrundning och att metoden stämmer ändå. Alla ovanstående siffror berör jämförelsen 2019M01 med 2018M12. Detta har inget att göra med “inflationen”, dvs inflationstakten, som beräknas som förändringen mellan 2019M01 och 2018M01.
Försök till beräkning av årsförändringen:
Enligt rapporten har priserna på el ökat med 18,0% vilket motsvarar 0,7 procentenheter:
Grunddatan ger:
4502 2019M01 788,89 10,43 elström, hyres- och bostadsrättslägenhet
4703 2019M01 746,33 28,34 elström, egnahem
4502 2018M01 678,72 10,57 elström, hyres- och bostadsrättslägenhet
4703 2018M01 629,14 28,35 elström, egnahem
Förändringen av inflationstakten för 4502: (788,98 - 678,72) / 678,72 = 0,1625 (dvs. 16%)
Förändringen av inflationstakten för 4703: (746,33 - 629,14) / 629,14 = 0,1863 (dvs. 19%)
Viktat bidrag för 4502: 10,43 / 1000 * 0,1625 = 0,0017 (dvs. 0,17 procentenheter)
Viktat bidrag för 4703: 28,34 / 1000 * 0,1863 = 0,0053 (dvs. 0,53 procentenheter)
Upprepar man kalkylen ovan för alla 357 produktgrupper får man en intressant sammanställning med bidraget för varje enskild produktgrupp. Januari 2019 summerar dessa till 1,9572% vilket då ska jämföras med den officiellt rapporterade inflationstakten på 1,9%. Upprepar man samma för januari 2018 summerar de till 1,4284% där den rapporterade inflationstakten var på 1,6%. För enstaka rader ser det alltså rimligt ut men aggregerar man dem så är det någonting som inte stämmer. Fortsättning följer alltså…
Försök till beräkning av KPI:
Jag har hittills inte lyckats reproducera total-KPI för januari 2019. Enligt rapporten var KPI 328,56 under januari 2019. Givet KPI för varje produktgrupp och dess respektive vikt borde det vara görbart att räkna fram denna siffra. Det finns viss vägledning i 2022 års dokument av Statistikens framställning under avsnitt 2.7.2.1 (länk) men jag har inte hittat en metod som fungerar än. Fortsättning följer alltså även för detta…
Jag välkomnar varmt såväl idéer som kritik för fortsatt analys.

