Forskningsintressen: pålitlig ML/DL, grafinlärning i NLP/multimodal data. Medförfattare till olika neurala modeller-t.ex. ppRNN (snabbare version av RNN), MGTN (modulär), SGTN (sekretessförhållande).
Jag är seniorforskare på WASP Media & Language arena, och grundare av DeepTensor AB - en spin-off från CS-avdelningen, som arbetar med att säkra ML/AI Solutions. Jag har en doktorsexamen från Umeå universitet med fokus på sekretesskyddad maskininlärning med big data. Jag har en masterexamen i datavetenskap från Kyungpook National University i Korea med fokus på språkteknologi (NLP) och maskininlärning. Mitt arbete har främst fokuserat på kunskap – både kunskap inhämtad från text, multimodala data och med hjälp av strukturerad kunskap för att driva nedströms applikationer. Jag är recensent för tidskrifter/konferenser, bland annat TheWebConf, ECAI, ICDM, PAKDD, SSR, SC2, COSE (Computer & Security), TPAMI.
Min forskning har innefattat ML/DL-lösningar för allmän databehandling och analys. Allmänt förekommande data är olika typer av data som är tillgängliga via IoT-applikationer och användargenererat innehåll i dagliga aktiviteter (till exempel multimodala recensioner och användaraktiviteter på mobil utrustning). Dessa data är inte bara begränsade, allmänt tillgängliga, de är även placerade i olika enheter, på olika platser och tillhör olika användare. För forskning på användargenererat innehåll har jag arbetat med integritetsskyddade modeller för att skydda användarnas integritet medan jag studerar deras data. För dataanalys har jag föreslagit KaPPA och INFRA, två olika analytiska ramverk för att projicera personliga data för dataanalys med nya integritetsmedvetna inlärningsmetoder i ramverken. Sist men inte minst, har vi föreslagit olika neurala modeller i olika forskning inklusive (men inte begränsat till) ppRNN [6], dpUGC [5], SGTN [4], MG-PRIFAIR [3], MGTN [1], Cformer [7]. Dessa modeller spelar viktiga roller i behandlingen av allmänt tillgängliga data som inte bara är begränsade utan oftast även komplexa.
Samarbete är en viktig del av mitt arbete och jag är styrelseledamot och publikationsordförande för Vietnam Language and Speech Processing (VLSP) som anordnar en internationell workshop varje år. VLSP uppmuntrar forskning i relaterade områden genom att tillhandahålla högkvalitativa datasets och låta forskarvärlden arbeta med dem via datautmaningar. Lokalt arbetar jag med ett projekt i Robust Machine Learning som studerar nya algoritmer och neurala metoder för att öka robustheten i Ml-baserade applikationer i multimodala datauppgifter (till exempel kombinationen av textdata, visuella data och grafdata). Nu senast innefattade vårt arbete applikationer inom hälsovård, Food of Interest och säkerheten i kantmoln.