Nu skapas första AI-baserade språkförståelsemodellen för svenska myndigheter


2021-01-22

Magnus Sahlgren, Head of Natural Language Processing på RISE.
Bild: RISE
Magnus Sahlgren, Head of Natural Language Processing på RISE.

Hittills har de stora internationella techbolagen inte prioriterat AI-lösningar för små språk som svenska. Nu utvecklar RISE tillsammans med bland andra Tillväxtverket och AI innovation of Sweden en ny svensk språkförståelsemodell. Modellen ska frigöra tid för svenska myndigheter att istället fokusera på kvalificerat arbete och hjälpa medborgarna mer effektivt.

Tack vare en enorm textinmatning av stora mängder av Kungliga Bibliotekets skönlitterära böcker, faktaböcker, dagstidningar och magasin som genomfördes under 2020 har man utvecklat en artificiell svensk språkhjärna som myndigheter, företag, forskare och andra aktörer kan använda för olika syften.
– Med hjälp av denna språkhjärna går det att bygga upp exempelvis AI-baserade textkategoriseringssystem mycket bättre och även snabbare än tidigare, säger Magnus Sahlgren, Head of Natural Language Processing på RISE, som leder arbetet med att utveckla en första AI-baserad språkförståelsemodell för svenska myndigheter.

Projektet Språkmodeller för svenska myndigheter är finansierat av Vinnova. Här skapas en modell för digital språkförståelse som är anpassad för inkommande och utgående myndighetskommunikation. RISE jobbar fram modellen med expertis både inom AI och Språkteknologi. Arbetsförmedlingen, Skatteverket och Tillväxtverket är tillsammans med AI Sweden, Luleå Tekniska Universitet och Peltarion samarbetspartners. 
– Vår ambition med projektet är att alla myndigheter ska kunna använda den bästa svenska AI-teknologin för att hantera sina informationsflöden, säger Magnus Sahlgren.

I februari i år inventeras de vanligaste flödena i den offentliga sektorn, och under resten av 2021 byggs konkreta lösningar som myndigheter kommer att kunna använda. Med språkmodellen på plats kan AI snabbt tränas till att sortera och kategorisera mejl, rapporter och dokument och se till att rätt handläggare har tillgång till rätt information vid rätt tidpunkt.
– Mejl kommer exempelvis att automatiskt kunna skickas vidare till rätt avdelningar eller rätt personer, eller kategoriseras på ett visst sätt. En väl utvecklad AI kan förstå information lika bra som vi människor, i många fall bättre. Ett mejl som rör F-skattsedel behöver exempelvis inte länge innehålla ordet ”F-skattsedel” för att AI:n genast ska förstå sammanhanget och veta vad som ska göras med informationen, säger Magnus Sahlgren.

Med språkmodellen som grund ska medborgare kunna skriva in frågor och få svar direkt på en myndighets webbsida, till skillnad från att hänvisas till sidor med mer information.
– En viktig poäng med språkförståelsemodellen är att det kommer att krävas mycket mindre träningsdata för att AI:n snabbt ska komma upp i förståelse då det finns redan en underliggande språkkunskap.

Språkmodellen innebär också att det inte spelar så stor roll hur medborgare formulerar sig. Två personer som vill veta samma sak men uttrycker sig på olika sätt, kommer båda att bli förstådda och få samma besked.
– AI:n förstår meningen bakom enskilda uttryck. Det är den stora skillnaden mot vanlig nyckelordsmatchning.

Många tester kommer att utföras för att säkerställa att medborgare inte får olämpliga svar eller snedvridna fördomar.
– Vi har tränat vår modell på redaktionell text, inte Flashback, men vi vet ändå inte vilket genomslag det får när AI:n använder språket ute på myndigheterna. En hel del andra osäkerheter finns också. Modellen är exempelvis tränad på rikssvenska. Kommer den att fungera lika bra i Norrbotten som i övriga landet? Det återstår att se, och vi kommer att hantera det.

I slutet av 2021 planeras de första AI-lösningarna baserade på den svenska spåkmodellen ha satts i drift.


Källa: RISE