Går det att beräkna inflationen från grunddata?

Hej,

Jag har tänkt sjösätta ett initiativ jag funderat på ett tag nu, nämligen att själv beräkna inflationen från källdata. Inflationen som begrepp är ju centralt för vår ekonomi samtidigt som det lätt orsakar viss förvirring när man skrapar lite på ytan. I podden finns det flera intressanta avsnitt om just inflation och det är även flitigt diskuterat här på forumet. Den ekonomisk-historiska litteratur jag läst beskriver hur index i ekonomin “uppfanns” av den amerikanske nationalekonomen Irving Fisher i början av 1900-talet. Det har kommit att bli grunden för mycket i vår samhällsekonomi samtidigt som det är förknippat med en hel del utmaningar. När jag funderat över dessa olika index har de från min ingenjörsmässiga synvinkel alltid varit otillfredsställande då beräkningarna bygger på (ofta godtyckliga) uppskattningar och antaganden. Jag har nu tänkt, med hjälp av de som vill bidra, göra mitt bästa för att försöka gå till botten med hur inflationen egentligen beräknas. Jag sitter bara någon timme då och då så jag tänker mig detta (långa) första inlägg som startpunkten för en typ av löpande dagbok här i forumet där ni är välkomna att antingen bara följa med i uppdateringarna eller - än hellre - bidra med insikter eller uppmärksamma felaktigheter i min metod.

Min ambition är följande.
1. Inhämta data så nära källan som möjligt:
Det bästa jag identifierat är data från SCB:s API. SCB genomför sin datainsamling genom en kombination av butiksbesök och digital inhämtning av priser. De skriver att det varje månad rör sig om ca 300 000 priser från 1 300 butiker. Att återskapa denna process är naturligtvis inte genomförbart. Den mest nedbrutna nivån jag då hittat är den som kallas produktgrupp (länk).
2. Reproducera inflationsberäkningen:
Förstå datastrukturen och identifiera de formler som SCB använder för att sedan kunna beräkna (“reverse engineera”) inflationsmåtten.

Metoden för inflationsberäkningen verkar ha genomgått stora förändringar under pandemin så jag har valt januari 2019 som utgångspunkt för att sedan kunna lägga på pandemiförändringarna efteråt. Utgångspunkten får bli SCB:s rapport från januari 2019 (länk). Från denna ska jag helt enkelt se om det går att reproducera samma siffror med hjälp av “grunddatan”.

Data från SCB:s API har följande format:
Produktgrupp månad KPI vägningstal beskrivning

Vilket ger rader med följande utseende (här är några exempel, det finns totalt 357 olika produktgrupper år 2019):
1113 2019M01 334,71 1,14 vetebröd
1114 2019M01 503,83 0,25 wienerbröd
2203 2019M01 276,25 5,23 öl, > 3,5%
3206 2019M01 88,14 2,06 herrjacka
3207 2019M01 277,27 2,21 herrpullover
4703 2019M01 746,33 28,34 elström, egnahem
6105 2019M01 326,28 29,47 nya bilar
6221 2019M01 151,52 19,29 bensin 95 oktan

Vägningstalen summerar till 1000. Med andra ord är det alltså förutbestämt att t.ex. vetebröds bidrag till den totala KPI-siffran ska vara 1,14/1000=0,114%. Hur detta bestäms kan vara intressant att återkomma till senare. Basåret i KPI är 1980 (index=100) så siffran 334,71 ska tolkas som en ökning från 100 till 334,71, m.a.o. en ökning med 234,71% sedan 1980.

Inflationsrapporten från januari 2019 är uppdelad i två huvudsakliga kapitel:
Utvecklingen den senaste månaden: Förändringen av KPI mellan december 2018 och januari 2019
Utvecklingen det senaste året: Förändringen av KPI mellan januari 2018 och januari 2019 (detta är “inflationstakten” eller kort “inflationen”)

Försök till beräkning av månadsförändringen:
Enligt rapporten har utrikes flygresor minskat med 30,8% vilket motsvarar 0,3 procentenheter:
Grunddatan ger:
6311 2019M01 98,3 7,77 utrikes flygresor
6311 2018M12 142,01 7,32 utrikes flygresor
6311 2018M01 97,33 7,32 utrikes flygresor
Förändringen av “månads”-KPI: (98,3 - 142,01) / 142,01 = -0,3078 (dvs. -30,8%).
Viktat bidrag: 7,77 / 1000 * -0,3078 = -0,0024 (dvs. 0,24 procentenheter)

Enligt rapporten har flygcharter minskat med 18,6% vilket motsvarar 0,2 procentenheter:
Grunddatan ger:
6309 2019M01 153,28 12,37 flygcharter
6309 2018M12 188,2 11,87 flygcharter
6309 2018M01 159,29 11,87 flygcharter
Förändringen av “månads”-KPI: (153,28 - 188,2) / 188,2 = -0,1855 (dvs. -18,6%)
Viktat bidrag: 12,37 / 1000 * -0,1855 = -0,0023 (dvs. -2,3 procentenheter)

Stämmer då denna metod? Beräkningen stämmer inte exakt eftersom 0,24 i så fall avrundats till 0,3 i rapporten men möjligtvis kan det bero på avrundning och att metoden stämmer ändå. Alla ovanstående siffror berör jämförelsen 2019M01 med 2018M12. Detta har inget att göra med “inflationen”, dvs inflationstakten, som beräknas som förändringen mellan 2019M01 och 2018M01.

Försök till beräkning av årsförändringen:
Enligt rapporten har priserna på el ökat med 18,0% vilket motsvarar 0,7 procentenheter:
Grunddatan ger:
4502 2019M01 788,89 10,43 elström, hyres- och bostadsrättslägenhet
4703 2019M01 746,33 28,34 elström, egnahem
4502 2018M01 678,72 10,57 elström, hyres- och bostadsrättslägenhet
4703 2018M01 629,14 28,35 elström, egnahem
Förändringen av inflationstakten för 4502: (788,98 - 678,72) / 678,72 = 0,1625 (dvs. 16%)
Förändringen av inflationstakten för 4703: (746,33 - 629,14) / 629,14 = 0,1863 (dvs. 19%)
Viktat bidrag för 4502: 10,43 / 1000 * 0,1625 = 0,0017 (dvs. 0,17 procentenheter)
Viktat bidrag för 4703: 28,34 / 1000 * 0,1863 = 0,0053 (dvs. 0,53 procentenheter)

Upprepar man kalkylen ovan för alla 357 produktgrupper får man en intressant sammanställning med bidraget för varje enskild produktgrupp. Januari 2019 summerar dessa till 1,9572% vilket då ska jämföras med den officiellt rapporterade inflationstakten på 1,9%. Upprepar man samma för januari 2018 summerar de till 1,4284% där den rapporterade inflationstakten var på 1,6%. För enstaka rader ser det alltså rimligt ut men aggregerar man dem så är det någonting som inte stämmer. Fortsättning följer alltså…

Försök till beräkning av KPI:
Jag har hittills inte lyckats reproducera total-KPI för januari 2019. Enligt rapporten var KPI 328,56 under januari 2019. Givet KPI för varje produktgrupp och dess respektive vikt borde det vara görbart att räkna fram denna siffra. Det finns viss vägledning i 2022 års dokument av Statistikens framställning under avsnitt 2.7.2.1 (länk) men jag har inte hittat en metod som fungerar än. Fortsättning följer alltså även för detta…

Jag välkomnar varmt såväl idéer som kritik för fortsatt analys.

4 gillningar

Välkommen till forumet!

Tack för ett intressant inlägg och för dina tankar. Jag har läst det ett par gånger nu och jag blir inte riktigt klok på vad syftet – eller kanske snarare vad användningsområdet för ditt initiativ är.

Vad är anledningen till att själv ta sig an att beräkna inflationen, jämfört med att följa statistikmyndighetens mätningar?

–Jag förstår att du anser att du hittat fel eller brister och att du även anser att de bygger på godtyckliga uppskattningar och antaganden. Personligen har jag svårt att se att de inte skulle gå att förklara om du frågar SCB om saken.

1 gillning

Det är ganska uppenbart om man läser rapporten att siffror anges med 1 decimal så dina flygsiffror är väntade (dock med oortodox avrundning givet dina siffror, men vi vet ju inte hur korrekta dina siffror är då de blir fel på andra ställen)

Jag säger som @OskarK att det är väldigt otydligt vad du egentligen vill göra. Det du i slutändan kommer göra är att du reproducerar de rapporterade siffrorna, efter att du slitet ditt hår med alla smådetaljer och beslutade korrigeringar som kan ge effekter.

Två saker som måste redas ut först

  • Är rapporterade vikter och prisindex i excelfiler som levereras de som används vid beräkning internt, eller använder beräkningarna på SCB data som inte är avrundat till två decimaler. Baserat på detta dokument Fastställda och publicerade KPI-tal med två decimaler - PDF Gratis nedladdning så verkar det som att de i varje fall använder 4 decimaler internt, men alltså sedan 2006 publicerar med 2 (upp från 1 tidigare år)

  • Hur ska man hantera år där vägningstal ej summerar till 1000 (t.ex 2019). Ska allt vägas om, eller är detta redan postbehandlat i justerade priser.

Men men, jag nördar också i siffror för det höga nöjets skull så jag kastar ej någon sten.

2 gillningar

Tack för era kommentarer!

Jag inser att jag varit otydlig med syftet. Det är nog för att det egentligen inte finns något direkt syfte utöver min egen nyfikenhet. Det samt att jag tycker det är ganska roligt och intressant att gräva ner sig i detaljerna. Jag ser, skulle man kunna säga, de rapporterade siffrorna som facit och försöker reproducera dessa. Lyckas jag så har det antagligen inte tillfört någonting till världen mer än att jag stillat min nyfikenhet kring själva beräkningsmetodiken.

Anledningen till att jag valde att skriva ner mina tankar här på forumet var huvudsakligen för att dela med mig om det fanns andra som (kanske mot förmodan) skulle vara intresserade av tillvägagångssättet.

Låt mig återkomma till punkterna angående avrundningar under morgondagen.

Trevlig kväll!

1 gillning

Tack för länken. Jag tolkar efter att ha läst igenom det som att inflationstakten (den de kallar “tolvmånadersförändringen i KPI”) beräknas på indextal med två decimaler och publiceras med en decimal.
“Publicerade förändringstal såsom inflationstakten, dvs.tolvmånadersförändringen i KPI, avses som nu redovisas med en decimal och beräknas på indextal med två decimaler.”
Ska man vara riktigt noggrann så nämner de bara huvud- (12 st) och undergrupperna (~60 st) och inte den mer detaljerade nivån produktgrupperna (~350 st) men den data de tillgängliggör via länken jag använt innehåller två decimaler både för index- och vägningstal även för produktgrupperna.

Angående den andra punkten noterade jag också att det är först nyligen som vägningstalen har börjat summera till 1000. För 2019 är siffran mycket riktigt 999,57 och således bör det vara detta som står i nämnaren istället för 1000. Det förändrar inte beräkningen för 2019 nämnvärt men tidigare år påverkar det mer. Jag uppfattar det precis som du skriver att själva indextalet för 2019 redan “inkluderar” vägningen men att vägningstalen däremot kan vara intressanta att använda för att erhålla den relativa fördelningen mellan produktgruppernas bidrag. Jag har valt att använda vägningstalen för 2019 för denna relativa fördelning men möjligtvis kan man tänka annorlunda.

1 gillning

Jag pekade bara på random dokument som påvisar att det finns subtila saker som man måste känna till. Detta dokument säger bara att en förändring gjordes 2006. Du måste reda ut vad som gäller nu gällandes publicering vs intern databehandling, och alla andra saker som kan påverka som vi ej vet.

Kul initiativ och bra få lite inblick hur det beräknas.
Har alltid fått för mig att man ändrar lite i produklistan och viktning med tiden för stt kunna justera utfallen. Nu kanske man kan få belägg för den hypotesen…:crazy_face:

Eller för att reflektera verkligheten, allteftersom konsumtionsmönster förändras?

2 gillningar

Efter ett sommaruppehåll har jag börjat ta vid detta initiativ så smått igen. Jag beslutade att tills vidare låta udda vara jämt gällande beräkningsdifferenserna. Det var på marginalen det skilde på alla produktgrupper jag undersökte och det verkade även slå jämnt mellan grupperna.

Jag inser att det är detaljerat och något krångligt att hänga med i mina tankegångar så jag beslutade att slå in på ett nytt spår för att illustrera det lite bättre. Visualiseringen kommer att innehålla en linjegraf för varje produktgrupp där man kan se trenden i inflationstakten mellan olika månader och år (dvs. det jag kallat ”Förändringen av inflationstakten” i mitt originalinlägg). Det kommer alltså att, enkelt uttryckt, ge en graf över inflationen för varje enskild produktgrupp.

Vad vill jag då uppnå med detta? Det är som tidigare inget direkt syfte nu heller mer än tillfredsställelsen av att tillgängliggöra ett ganska komplicerat förhållande. Ifall det kan vara intressant för fler än mig är det såklart givande så min tanke är att så småningom publicera det på ett domän. Visar det sig bli vettigt och/eller intressant utvidgar jag det möjligtvis till att även inkludera dimensioner som det “viktade bidraget”.

Fortsättning följer om inte alltför länge!

4 gillningar

Då är sidan uppe för de som är nyfikna: https://inflationen.com/

Återkoppla om ni vill med generella upplevelser, huruvida det är förståeligt, om några siffror verkar felaktiga, osv. Jag ska klura på vad mer som kan vara intressant att visa i den.

3 gillningar

För några dagar sedan släppte Statistiska Centralbyrån inflationssiffrorna för september (Inflationstakten 9,7 procent i september 2022). Inflationstakten är fortsatt hög med KPI på hela 10,8%. Sidan (https://inflationen.com) är uppdaterad med de senaste siffrorna.

Några av produktgrupperna som nämns som bidragande i rapporten är kött, kaffe, el och möbler. Dessa och alla andra går att se i grafen på sidan. SCB redovisar inte KPIF-siffrorna per produktgrupp utan bara de för KPI så det förklarar en del skillnader på marginalen mellan sidans graf och SCB:s siffror i länken.

Jag funderar på om det kan vara intressant att lägga till någon ytterligare visualisering för att förstå hur mycket varje produktgrupps inflationstakt påverkar helheten (dvs. viktat bidrag i mitt originalinlägg). Inflationstakten för produktgrupp 5114 fåtölj är t.ex. 18,2% vilket såklart är anmärkningsvärt högt om man ska köpa fåtöljer men vägningstalet är endast 1,40 och därmed en relativt låg påverkan på helheten. Detta kan jämföras med exv. produktgrupp 4703 elström, egnahem som har en inflationstakt på 53,7% och ett vägningstal på hela 22,49. Jämför man elströmmen för egnahems bidrag till den övergripande inflationstakten med fåtöljernas är den med andra ord inte cirka tre gånger så hög som man intuitivt skulle kunna uppfatta (53,7 / 18,2 ≈ 3) utan snarare uppemot 50 gånger så hög.

Det tål att fundera på hur man skulle kunna tydliggöra det på ett bra sätt.

1 gillning

Då finns det även en Topplista på https://inflationen.com/topplista/ där man kan se högsta och lägsta inflationen per månad.

Vad mer skulle vara intressant att se?

1 gillning

Min ost inflation är 75% på årsbasis. Samma ost jag köpte på Lidl i november förra året (hittade kvittot) kostar nu 3,49€ istället för 1.99€ då. :pensive:

Förpackningen är iaf samma storlek, men börjat se andra ostar krympa

1 gillning

Synd att man inte kommer åt inflationen.com mer. Hade varit kul att se sidan.

Kan inte en liten felbedömning i KPI påverkar riksbankens arbete med att höja inflationen och driva upp priserna på ex. bostäder helt enormt?

Särskilt med KPIF.