Kursen vänder sig till yrkesverksamma inom IT som önskar en systematisk introduktion till de koncept och verktyg som ligger till grund för stora språkmodeller (LLM:er). Vi behandlar Transformers, BERT och GPT på en hög nivå och undersöker sedan "few-shot"-metoder, RAG-metoder baserade på LangChain och vektordatabaser samt metoder för att använda LLM:er för att föra dialoger över SQL-databaser. Vissa delar av examinationen låter studenterna utveckla lösningar över sina egna bransch-specifika data.
Förväntade studieresultat
Kunskap och förståelse Efter avslutad kurs ska studenten kunna:
(FSR 1) Förklara komponenterna, processerna och arbetsflödet som används för att bygga GPT-baserade modeller.
(FSR 2) Beskriva olika sätt att använda LLM:er, såsom prompt engineering, few-shot-metoder, vektordatabaser och RAG-basera metoder.
Färdighet och förmåga Efter avslutad kurs ska studenten kunna:
(FSR 3) Konfigurera och köra enkla GPT-inlärningsproblem med hjälp av PyTorch.
(FSR 4) Använda LangChain och vektordatabaser för att implementera arbetsflöden baserade på RAG och avancerad RAG.
(FSR 5) Använda few-shot-metoder för att bygga dialogsystem över SQL-databaser.
Värderingsförmåga och förhållningssätt Efter avslutad kurs ska studenten kunna:
(FSR 6) Förstå och diskutera koncept och terminologi associerade till LLM:er.
(FSR 7) Förmå att skilja på fakta och fantasi inom detta snabbrörliga kunskapsområde.
Behörighetskrav
För behörighet krävs 6 hp grundläggande programmering och 6 hp datastrukturer och algoritmer samt minst 30 hp inom matematik eller datavetenskap. Färdighet i Python-programmering rekommenderas starkt.
Undervisningens upplägg
Kursen är en distanskurs som inte kräver någon fysisk närvaro. Föreläsningarna hålls över Zoom och kursmaterialet distribueras via universitetets lärplattform. Föreläsningarna spelas in för att möjliggöra flexibla studier. Studenterna löser problem och demonstrerar sina programmeringslösningar i vid muntliga förhör som genomförs via Zoom. Det är obligatorisk närvaro vid förhören, men dessa anordnas vid flera olika tillfällen för att kunna anpassas till studentens övriga aktiviteter. Kursen avslutas med en hemtentamen som studenterna laddar upp på lärplattformen. Allt arbete utförs enskilt av studenten.
Examination
Examinationen består av tre Zoom-baserade muntliga förhör och en slutlig hemtentamen. Vissa delar av examinationen låter studenterna utveckla lösningar över sina egna bransch-specifika data.
Betygsskalan är Underkänd (U), Godkänd (G) eller Väl Godkänd (VG). För godkänt betyg krävs att samtliga moment är avklarade. Betyget sätts efter en samlad bedömning av examinationens olika delar.
Anpassad examination Examinator kan besluta om avsteg från kursplanens examinationsform. Individuell anpassning av examinationsformen ska övervägas utifrån studentens behov. Examinationsformen anpassas inom ramen för kursplanens förväntade studieresultat. Student som har behov av en anpassad examination ska senast 10 dagar innan examinationen begära anpassning hos Institutionen för datavetenskap. Examinator beslutar om anpassad examination som sedan meddelas studenten.
Övriga föreskrifter
Om kursplanen har upphört att gälla eller kursen slutat erbjudas garanteras en student som någon gång registrerats på kursen minst tre provtillfällen (inklusive ordinarie provtillfälle) enligt denna kursplan under en tid av maximalt två år från det att kursplanen upphört att gälla eller kursen slutat erbjudas.
Litteratur
Litteraturlistan är inte tillgänglig via den webbaserade utbildningskatalogen.
Kontakta aktuell institution.