#Metoo förändrade svenska tweets – visar ny AI-forskning

Publicerad: 2019-06-17

Språkbruket på Twitter förändrades på ett positivt vis i kölvattnet av #metoo, enligt en ny avhandling i nationalekonomi från Ekonomihögskolan vid Lunds universitet. ”Jag tolkar det som att normer kan förändras snabbare än vad man generellt brukar tro”, säger nationalekonomen Sara Moricz.

Nyblivna doktorn i nationalekonomi, Sara Moricz, började redan som masterstudent att använda sig av programmerade datamodeller för sin forskning. Nationalekonomi använder av tradition statistiska modeller, och steget till att använda mer datadrivna sätt, alltså maskininlärning och AI, är inte långt.

– Det är svårt att undersöka normer eftersom att vi forskare saknar data att jobba med. Men med sociala medier som Twitter och med dagens maskininlärningsalgoritmer går det att automatiskt läsa av så kallade implicit bias, ungefär omedvetna fördomar, i text. Det har jag använt mig av i undersökningen, säger Sara Moricz, som disputerat med avhandlingen Institutions, Inequality and Societal transformations.

Modell läser ”som en människa”

Med hjälp av tusentals svenska tweets har Sara Moricz lärt en AI-modell att läsa Twitter-inlägg ”som en människa”. Kort sagt gick det ut på att träna modellen att uppfatta så kallat könskodat språk och därmed placera in orden ”hon” eller ”han” på rätt plats i olika meningar. Det kan vara allt från om en person som kallas ”sötis” är en kvinna eller man, eller om det är en kvinna som bakar kakor och en man som äter dem. Modellen har tillgång till tillräckligt med data för att lära sig att se de könskodade mönstren i språkbruket.

– Resultatet av undersökningen visar att svenska tweets i genomsnitt reflekterar könskodat språk i mindre utsträckning ett halvår efter den första metoo-hashtaggen, jämfört med ett halvår innan, säger Sara Moricz.

Metoo startade den 17 oktober 2017, och ett halvår innan dess stoppar modellen i genomsnitt in rätt könskodat ord i 78 av 100 tweets och ett halvår efter minskar det till 76,5 per 100 tweets. Förändringen innebär en minskning med cirka 2 procent av genomsnittet innan Metoo.

Är inte andelen som visar förändring väldigt låg? Bara någon procent?
– Det är inte en stor effekt, men inte heller en liten. Det man ska komma ihåg är att det är ovanligt att kunna mäta normer på en sådan fin skala. Detta visar att något verkligen förändrats, i alla fall vad gäller svenska Twitter, säger Sara Moricz och tillägger:

– Det är svårt att jämföra med tidigare forskning eftersom man inte tidigare har mätt könskodat språk, eller könsnormer, på detta sätt. Jag tycker det är lättare att tänka på hur stor effekten är i termer av att den indikerar att det skulle ta 18 år med en ihållande metoo-effekt för att helt ta bort det könskodade språk som modellen lärt sig. 

Enligt rapporten Svenskarna och internet 2018 använder fler män (25 %) än kvinnor (18 %) Twitter. Den största användargruppen är 16–25 år. Hur representativt är då Twitter och dina resultat för svenskarna som helhet?^
– Det är viktigt att poängtera att min undersökning enbart utgör ett exempel på att normer kan förändras snabbt. Resultatet i sig är inte generaliseringsbart eftersom att vi vet att Twitteranvändare inte återspeglar hur folk är mest i Sverige, säger hon och tillägger:

– Resultatet visar att en nerifrån och upp-folkrörelse kan förändra normer, i alla fall på kort sikt. Engagemanget hos dem som vågade berätta om sexuella övergrepp under #metoo ledde till en konkret förändring, åtminstone utifrån Twitter-datan.

Ett konkret exempel på hur jargongen på Twitter har förändrats är att fåtalet kvinnor tillskrivs att ha åsikter innan metoo, efter metoo finns det fler tweets som handlar om att kvinnor faktiskt har åsikter.

Vad skulle nu behöva göras, i form av vidare forskning?
– Det jag spontant tänker på är en vidareutveckling av modellen för könskodat språk. Det skulle vara intressant att ta fram ett program som är modelltekniskt likt, men som istället för autocorrect i mobilen, ger användaren gendercorrect. Det skulle jag själv tyckt varit ett användbart bidrag till samhället. Något som kan göra användare uppmärksamma på vilket språkbruk de använder sig av.

Du säger att andelen tweets som reflekterar könsnormer är mindre efter #metoo än före. Hur vet du att det kan kopplas till just #metoo och inte till slumpen eller andra orsaker?
– Man kan aldrig vara hundra procent säker när man jämför saker över tid. Men jag har gjort metoden så bra som jag någonsin kunnat för att säkert kunna säga att det är metoo som driver den här förändringen på Twitter. Till exempel har jag gjort en parallell undersökning, med samma metod, men för en annan norm, där jag inte ser någon förändring alls.

Sara Moricz försvarade sin avhandling den 5 juni 2019. Avhandlingen är inte publicerad digitalt ännu, men delen som behandlar den nämnda undersökningen finns som working paper här.

Kontakt

Sara Moricz
Doktorand i nationalekonomi på Ekonomihögskolan vid Lunds universitet

E-post: sara.moricz@nek.lu.se
Telefon: 070-273 90 41
Personlig hemsida: sara.moricz.se

Fakta om studien

Sara Moricz har i sin avhandling skrivit tre artiklar, varav den första behandlar kortsiktiga förändringar av könsnormer. Där använder hon sig av maskininlärningsalgoritmer för att studera normförändringar i svenska tweets. En LSTM neural network-modell tränas till att definiera könsnormer på ett omfattande och datadrivet sätt. Modellen används som ett verktyg för att ta fram ett mått på könsnormer som människor möter i vardagslivet, vilket används för att studera normförändringar i samband med Metoo-rörelsen.

#Metoo startade 17 oktober 2017 efter att en amerikansk skådespelerska uppmuntrade kvinnor att dela med sig av sina erfarenheter av sexuellt ofredande. Datumet är orelaterat till svenska könsnormer och därmed tillåter kontexten att en effekt skattas utan jämförelseproblem. Tweets som innehåller metoo-hashtaggen eller relaterade taggar tas bort från analysen för att inte effekten av en mer intensiv könsdebatt ska mätas.

Artikeln finner att svenska tweets reflekterar könsnormer i en mindre utsträckning sex månader efter metoo-händelsen i jämförelse med fem månader innan. Föregående års normförändringar används som jämförelsegrupp. Resultatet är robust gentemot att använda fixa effekter för kalenderdagar och Twitter-användare. Resultatet får även stöd genom att en orelaterad norm som inte borde förändras med placebo-test har undersökts.

Studien är ett exempel på att normer kan förändras snabbt, vilket kan göra det möjligt att ifrågasätta tidigare litteratur där normer visas som relativt oföränderliga.

Källa: Institutions, Inequality and Societal transformations av Sara Moricz.

Fakta: Könskodning 

I engelskan används ofta en adjektivform av gender, gendered, för att beskriva att något visar skillnad enligt en viss uppfattad genusordning. Om man utgår från att en genusordning är strukturerad i två genus, ett manligt och ett kvinnligt, kan en sak, en egenskap eller ett fenomen vara kodat som maskulint eller feminint. Ett exempel kan vara färger, där rosa blir feminint och blått blir maskulint. Det finns ingen vedertagen svensk version av begreppet gendered, men exempel på möjliga översättningar är genusifierad, genuspräglad, könad, könskodad eller genuskodad. (källa: Wikipedia)

Könskodat språk blir utifrån detta ett språk som är subtilt färgat utifrån det kön som vi, ofta omedvetet, kopplar ihop med vissa ord. Samhället har vissa förväntningar på vad män och kvinnor är, och hur de skiljer sig åt, och detta avspeglas i det språk vi använder. Ett kvinnligt färgat, stereotypt ordval kan till exempel vara snäll, försiktig, söt. Ett maskulint färgat språk kan vara aktiv, driven, företagsam. Självklart kan människor av vilket kön som helst kan ha någon av dessa egenskaper, men i den nämnda forskningen har de separerats.