Kan man förutspå ett val?

Av: Daniel Walther

Under ett supervalår som detta är det intressant att ställa frågan om det går att förutsäga valresultat. Nate Silver populariserade valprognoser genom att i det amerikanska presidentvalet 2012 förutspå resultatet med stor precision (och dessutom få rätt på 49 av 50 delstatsval). USA är dock ett tvåpartisystem med väldigt god tillgång till opinionsdata (också historiskt), så frågan är om samma bedrift går att upprepa i ett partisystem så komplicerat som det svenska.

Traditionellt sett har en del olika tekniker tillämpats för att förutspå val. En del har tittat på ekonomiska data, statsministerns popularitet och liknande variabler för att med hjälp av regressionsanalys försöka förutspå valresultatet. Fördelen med här tekniken är att informationen man behöver ofta finns tillgänglig tidigt under året vilket gör att man kan göra sin prognos i god tid innan valet. Sådana regressioner har också lyckats väl i tvåpartisystem som USA, Storbritannien och Frankrike. I länder med fler partier och mer flux i systemet har den här tekniken dock lyckats avsevärt sämre.

En annan teknik är den så kallade pendeltekniken – alltså idén att väljarna vill ha förändring efter en viss tid. Så pendeln går i en viss ideologisk riktning några år men når sedan sin kulmen och börjar då gå tillbaka i en förutsägbar rytm. I Sverige har vi dock sett mindre av detta fenomen än i andra länder och för oss återstår därför bara ett rimligt alternativ för att förutsäga valet – opinionsdata.

Nate Silvers metod var också baserad på opinionsdata och gick i huvudsak ut på lägga samman data från olika institut över tid och göra en tidsserie av alla mätningar. På så sätt kan man bakom allt brus i enskilda opinionsundersökningarna hitta en underliggande trend och prognosen handlar sedan om att extrapolera den tidstrenden in i framtiden. Genom en sådan långsiktig aggregering av opinionsdata får man en mycket mer precis bild av opinionsläget än vad enskilda undersökningar kan ge.

Standardmodellen i fältet för den här typen av tidsserieanalys bygger på Bayesiansk statistik och kallas för en dynamisk linjär modell. Den utnyttjar ett så kallat Kalmanfilter (som också används för att förutspå processer t.ex. inom biologi och kemi) och Markovkedjor som hjälper oss att besvara frågan: när en ny undersökning kommer in, hur mycket ska vi modifiera vår tidigare prognos? Om vi tidigare trodde att Socialdemokraterna (S) skulle få 33% i valet, och en ny undersökning kommer in där 1500 människor har tillfrågats och 31.5% har uppgett att de ska rösta på S – vad tror vi då nu? Det är den frågan vår dynamiska linjära modell besvarar.

Så vad händer då om man tillämpar en sådan modell på svenska förhållanden? Ett första test är att applicera modellen på ett tidigare val och se hur väl den lyckades då. I graferna nedan kan vi se hur det gick för modellen i valet 2010 först för de enskilda partierna och sedan för de två blocken. På partinivå kan vi se att modellen lyckades relativt väl. Prognosen var väldigt nära för partierna på högersidan, men missade både S och MP något. Det genomsnittliga felet var 0.49%.

Test2010_partier

Den mest intressanta frågan i en sådan här prognos är dock kampen om regeringsmakten, och lyckligtvis är prognosen ännu mer precis på blocknivå. Det har visat sig att det mesta av osäkerheten finns mellan partier som ligger nära varandra ideologiskt (som S och MP) men detta jämnar ut sig på blocknivå och den aggregerade prognosen blir därför bättre. För valet 2010 var prognosen 0.2 procentenheter ifrån för högersidan och mitt i prick för vänstersidan!

Test2010_block

Vad säger då modellen om höstens val? Jo, vi kan förutspå en ganska komfortabel seger för en vänsterregering (bestående av S, MP och V). Om de får egen majoritet, om KD kommer in eller inte och vad som händer med F! är fortfarande öppna frågor – men sannolikheten att högersidan hämtar in försprånget är väldigt låg. I grafen nedan kan vi se den bästa prognosen i dagsläget för de två blocken utmarkerad med en punkt med 95% konfidensintervall. Även om högersidan prestererar i toppen av sitt intervall och vänstersidan i nederkanten av sitt är det fortfarande mycket som skiljer blocken åt. Om inga politiska skandaler eller andra katastrofer inträffar blir det svårt för högersidan att ta ikapp detta.

blockpred

Slutligen, i grafen nedan kan vi se modellens prediktioner för de åtta nuvarande riksdagspartierna plus F!. Alla vänsterpartier ser ut att gå framåt jämför med förra valet och MP blir tredje största parti. F! ser ut att missa riksdagsspärren. C ligger en bit över spärren medan KD ligger precis på gränsen. De sista veckorna fram till valet blir spännande!

partypred


Daniel Walther är doktorand i statsvetenskap vid Umeå universitet och jobbar inom forskningsprojektet Representative Democracy in Europe. Fram till valet kommer prognoser enligt den ovan beskrivna modellen att göras regelbundet på sidan trefyranio.com

Annonser

8 reaktioner på ”Kan man förutspå ett val?

  1. Hej, roligt med ny blogg, och intressant inlägg!
    Men jag tycker att konfidensintervallen verkligen ser extremt små ut. För SD ser det ut att ligga mellan typ 9,5 och 10,2. Det är verkligen inte stort, med tanke på att det finns två osäkerhetskällor:
    1. Hur opinionen verkligen ser ut nu (liten osäkerhet)
    2. Hur opinionen ser ut på valdagen (större osäkerhet).

    Kan du med 95 procent säkerhet säga att det inte kommer hända något som ändrar stödet för SD ur konfidensintervallet fram till valdagen? Till exempel att invandrings- och flyktingfrågan skulle få mycket mer uppmärksamhet?

    Ta F!:s resultat i EU-valet. Om man hade gjort en motsvarande analys av dem i januari hade konfidensintervallet väl aldrig kommit upp i det faktiska resultatet. Dynamiken ändrades under våren. Kan man förutsäga sådant, eller är det en del av de där oväntade fem procenten?

    Bästa hälsningar
    Anders Sundell

    • Hej Anders,

      Roligt att du har hittat hit (mellan de intressanta inläggen i DN) och tack för en intressant kommentar.

      Det finns ett par skäl till de snäva konfidensintervallen för en del partier. Jag har tänkt mycket över det själv eftersom jag också upplever dem som små. Den huvudsakliga orsaken till att de är så snäva är att modellen antar konstant varians. I själva verket är det möjligt att variansen och osäkerheten ökar sista månaden innan valet men detta finns inte inbyggt i modellen. Så givet att tidsserien inte blir mer instabil sista tiden stämmer konfidensintervallen, men om det antagandet inte stämmer så kan vi se större förändringar i resultaten.

      Konfidensintervallen är redan ganska stora för partier som har varierat mycket det senaste året (såsom M och V) men SD har legat väldigt stabilt på mellan 9 och 10.5% vilket gör modellen lite väl säker på sin sak. BottenAda tar hänsyn till hur det har gått i tidigare valslutspurter vilket gör att deras modeller har högre varians. Jag har inte inkluderat detta eftersom vi bara har två rimliga observationer att basera uppskattningarna på (opinionsundersökningarna blev tillräckligt bra först 2006) så det är nästintill omöjligt att få fram stabila estimatorer för hur utvecklingen borde se ut den sista månaden.

      Generellt sett i Sverige ändras dock inte så mycket de sista veckorna (med ett par nämnvärda undantag!) så även om antagandet om konstant varians är problematiskt borde det inte leda till så missvisande uppskattningar.

  2. Hej Daniel!

    Jag är också fundersam över de mycket små konfidensintervallen. Oavsett antaganden om konstant eller förändrad varians kan partier byta ståndpunkter och väljare byta partipreferens och den osäkerheten det skapar borde rimligen vara större ju längre från valet vi befinner oss. Eller gör du några andra antaganden?

    Förstår inte riktigt vad du menar med att opinionsmätningarna blev ”tillräckligt bra först 2006”. Vad baserar du det på? Mig veterligen har de flesta institut använt i stort sett samma metoder under lång tid. Den stora förändringen är det ökande bortfallet, men det har snarast haft en negativ inverkan.

    Hälsningar
    Richard

    • Hej Richard,

      Jag håller med – ju längre ifrån valet vi befinner oss, desto större osäkerhet. Nu när det bara är tre veckor kvar är osäkerheten mindre, men fortfarande reell. Både S och M har konfidensintervall på 5 procentenheter (29-34 och 20-25) medan de mindre har snävare intervall men nästan lika stora i procentuella termer.

      Det konfidensintervall jag är mest bekymrad över är det för SD där jag tror att osäkerheten är större. Men modellen kan inte veta att just SD:s väljare kan vara svårare att mäta. Jag kan så klart lägga in varians manuellt just för SD, men hur stor ska den variansen vara och vad baserar jag det på? Det känns som att godtyckliga beslut kommer att fattas om jag går in och specialbestämmer osäkerheten för mycket.

      Och angående undersökningarna – jag menar inte att de blev av bättre kvalitet (de flesta institut publicerar inte sina metoder så vi kan inte veta) utan helt enkelt att vi nu får fler av dem. Från ett genomsnitt av 3 i månaden i början av 2000-talet till 8 i månaden nu. Det ger oss mycket mer data att jobba med.

      • Tack för svar, och då förstår jag vad du menar kring opinionsmätningar.

        Jag tycker dock fortfarande att konfidensintervallen ser märkligt små ut. Jag noterar att du för vissa partier hade mindre konfidensintervall i din prognos i juni än vad du har nu, och vissa punktskattningar nu verkar ligga på gränsen för konfidensintervallen du hade i juni (även om det är svårt att utläsa från graferna). Du kanske menar något annat med dina konfidensintervall, men om de gäller prognosen för valresultatet har jag svårt att tro att täckningen stämmer.

        Oavsett, kul med bloggen och med prognoserna!

        Hälsningar Richard

  3. Hej Daniel,
    jag kommer att följa dina prognoser med stort intresse fram till valet. Har redan koll på botten ada men undrar om du har tips på ytterligare nya prognosmakare. Gäller även de som försöker analysera sociala medier och andra data.

    Vänligen, Johan Hammarlund

    • Hej Johan!

      Vad kul att du också är intresserad av prognoser. Förutom Ada så vet jag faktiskt inga privatpersoner som försöker sig på strukturerade prognoser. Dagens Samhälle gör prediktioner baserade på en enklare Bayesiansk modell men i övrigt har jag inte hört talas om någon som går bortom vanliga sammanvägningar av opinionsundersökningar. Om jag hör något mer kan jag återkomma.

  4. […] I augusti lanserades den nya bloggen ”Om makt och politik” som drivs av en samling statsvetare inom Nätverket för koalitions- och partiforskning. Likt bloggar som Politologerna och Ekonomistas bör den ta en given plats på läslistan. Det finns redan något tiotal spännande inlägg om allt från huruvida en röst på FI är en ”bortkastad röst” eller ej, hur vanligt det är med nya partier i parlamenten, hur folk röstar när koalitionspartier ligger när under spärren till parlamentet, eller om man kan förutspå ett val. […]

Kommentera

Fyll i dina uppgifter nedan eller klicka på en ikon för att logga in:

WordPress.com Logo

Du kommenterar med ditt WordPress.com-konto. Logga ut / Ändra )

Twitter-bild

Du kommenterar med ditt Twitter-konto. Logga ut / Ändra )

Facebook-foto

Du kommenterar med ditt Facebook-konto. Logga ut / Ändra )

Google+ photo

Du kommenterar med ditt Google+-konto. Logga ut / Ändra )

Ansluter till %s