Forskningsprojekt
finansierat av Trafikverket, Umeå universitet och Sweco.
Vi har gjort en chat-robot till vilken man kan ställa olika typer av frågor på dokument och sen få svar snabbt med hjälp av AI-språkteknik. Tekniken testas på Norrbotniabanan i samverkan med Trafikverket.
Projektöversikt
Projektperiod:
2021-03-01 –
2021-11-30
Medverkande institutioner och enheter vid Umeå universitet
Få svar på allt du undrat över! Vi har gjort en chat-robot där man kan ställa olika typer av frågor på dokument och sen få svar rätt snabbt med hjälp av AI-språkteknik. Det kan handla om:
- Frågor i form av fria meningar "Vad kostar det att bygga Norrbotniabanan?" eller "Vad är vinsterna med den?"
- Få reda på inblandade orter, personer, tider, mått eller organisationer
och/eller
- Få en kortare sammanfattning av det viktigaste i en lång text med speciellt urvalda meningar.
Det som är unikt är att vi dels inte matat in någon mer information än rådokumenten (i pdf, hämtade från webbsidor) som datorn analyserar på egen hand och dels att svarstiderna bara är crka 20 sekunder för 300 sidor tack vare smart utnyttjande av beräkningsgrafikkort av svåråtkomlig nyare modell, en vanlig snabb dator hade behövt tänka typ en timme för att tröska igenom dessa sidor och molntjänster/superdatorer uppstartstider på flera minuter eller ibland veckor.
Tekniken kallas Natural Language Processing, NLP, och tack vare insatser från Kungliga Biblioteket (KB) finns det nu även möjligheter att hantera dokument på Svenska. AI-modellen (BERT) är ursprungligen från Google och programmeringsbiblioteket PyTorch från Facebooks AI lab.
Vi har gjort en prototyp med en allmänt åtkomlig server som har stått till tjänst under några veckor för tester av frågemekanismerna och i den har vi lagt in dokument om Norrbotniabanan (typiskt miljökonsekvensbeskrivningar), Ostlänken samt några äldre böcker (Röda rummet och Nils Holgerssons underbara resa genom Sverige).