Engelskt namn: Natural Language Processing
Denna kursplan gäller: 2021-01-04 till 2023-06-25 (nyare version av kursplanen finns)
Kursplan för kurser med start efter 2023-06-26
Kursplan för kurser med start innan 2023-06-25
Kurskod: 5DV218
Högskolepoäng: 7,5
Utbildningsnivå: Avancerad nivå
Huvudområden och successiv fördjupning:
Datavetenskap: Avancerad nivå, har kurs/er på avancerad nivå som förkunskapskrav
Betygsskala: Väl godkänd, godkänd, underkänd
Ansvarig institution: Institutionen för datavetenskap
Beslutad av: Teknisk-naturvetenskapliga fakultetsnämnden, 2021-02-25
Kursen är en introduktion till språkteknologi för studenter som redan är skickliga på programmering och maskininlärning. Målet är att ge en gedigen bakgrund i den teori och de tekniker som används för olika språkteknologiska uppgifter som t.ex. att förstå och generera naturligt språk. Eftersom språkteknologi används dagligen av många personer och ligger till grund för många andra "AI"-system, kommer särskilt fokus att läggas på frågor om etik, rättvisa och den sociala effekten av dessa tekniker.
Kursen behandlar olika typer av tekniker inom språkteknologi, inklusive regelbaserade, statistiska och maskininlärningsbaserade metoder. Eftersom språkdata är centralt i många moderna tekniker, kommer kursen dessutom att omfatta bedömning av datakvalitet, samt att utveckla en förståelse för komplexa frågor om representation och ägande av data.
Grundläggande begrepp och metoder från lingvistik introduceras, inklusive aspekter av hur språket konstrueras och används samt vikten av sammanhang. Dessa används dels för att ge en förståelse för hur effektiva lösningar på språkteknologiska uppgifter är konstruerade och dels för att förstå utmaningarna med att göra detta för olika språk.
Utöver denna teoretiska förankring erbjuder kursen praktiska övningar och uppgifter som fokuserar på att tillämpa olika tekniker på diverse språkteknologiska uppgifter. Kursen inkluderar också aktivt deltagande i seminarier och skrivande av rapporter.
Kunskap och förståelse
Efter genomgången kurs ska studenten kunna:
Färdighet och förmåga
Efter genomgången kurs ska studenten kunna:
Värderingsförmåga och förhållningssätt
Efter genomgången kurs ska studenten kunna:
Univ: För att bli antagen måste du ha 90 högskolepoäng som inkluderar 60 högskolepoäng i datavetenskap eller tre års avklarade studier inom ett studieprogram (180 högskolepoäng). I båda fallen krävs
* minst en kurs (7.5 hp) i maskininlärning (exempelvis 5DV194) som innehåller naive Bayes, Hidden Markov Models, beslutsträd neurala nätverk inklusive hur backpropagation fungerar.
* minst en kurs (7.5 hp) i Formella språk (exempelvis 5DV208 DV3: Beräkningar och språk eller 5DV037 Datavetenskapens grunder) som ska inkludera automatteori, Turingmaskiner, reguljära språk, kontektfria språk, pumping lemma (för båre reguljära och kontextfria språk), CYK parser
Det är rekommenderat att vara bekant med Python (vi kommer använda Python i övningar och uppgifter, studenter bör antingen kunna programmera Python eller känna sig bekväma med att lära sig det på egen hand).
Engelska A/5 och svenska för grundläggande behörighet för högskolestudier (om kursen ges på svenska).
Kursen följer en "flipped classroom"-modell, där studenterna själva arbetar med materialet innan lektionen. En lektion kan t.ex. bestå av lärarledda diskussioner, övningar på att tillämpa kunskap, seminarier samt handledda datorlaborationer och andra övningar. Utöver de schemalagda aktiviterna krävs även eget arbete med materialet.
På kursen ges något av betygen Underkänd (U), Godkänd (G) eller Väl Godkänd (VG). Studentens prestationer på kursen bedöms genom skriftliga uppgifter (FSR 1-7, 9-10) och seminarier (FSR 8-10). Några uppgifter involverar programmering i Python. Alla uppgifter och seminarier måste vara avklarade för att få godkänt betyg på kursen.
Avsteg från kursplanens examinationsform kan göras för en student som har beslut om pedagogiskt stöd på grund av funktionsnedsättning. Individuell anpassning av examinationsformen ska övervägas utifrån studentens behov. Examinationsformen anpassas inom ramen för kursplanens förväntade studieresultat. Efter begäran av studenten ska kursansvarig lärare, i samråd med examinator, skyndsamt besluta om anpassad examinationsform. Beslutet ska sedan meddelas studenten.
En student som utan godkänt resultat har genomgått två prov för en kurs eller en del av en kurs, har rätt att få en annan examinator utsedd, om inte särskilda skäl talar emot det (HF 6 kap. 22 §). Begäran om ny examinator ställs till prefekten för Institutionen för datavetenskap.
I en examen får denna kurs ej ingå, helt eller delvis, samtidigt med en annan kurs med likartat innehåll. Vid tveksamheter bör den studerande rådfråga studievägledare vid Institutionen för datavetenskap och/eller programansvarig för sitt program.
Om kursplanen har upphört att gälla eller kursen slutat erbjudas garanteras en student som någon gång registrerats på kursen minst tre provtillfällen (inklusive ordinarie provtillfälle) enligt denna kursplan under en tid av maximalt två år från det att kursplanen upphört att gälla eller kursen slutat erbjudas.
Speech and language processing : an introduction to natural language processing, computational linguistics and speech recognition
Jurafsky Dan, Martin James H.
2. ed. : Upper Saddle River, N.J. : Pearson Education International/Prentice Hall : cop. 2009 : 1024 s. :
ISBN: 9780135041963
Obligatorisk
Se Umeå UB:s söktjänst
Ytterligare källor såsom forskningsartiklar, bokkapitel, etc efter behov.
Denna webbplats använder kakor (cookies) som lagras i din webbläsare. Vissa kakor är nödvändiga för att sidan ska fungera korrekt och andra är valbara. Du väljer vilka du vill tillåta.