Nya algoritmer ökar integriteten för känsliga data
NYHET
Känsliga och personliga data, som medicinska journaler och bankuppgifter, kan nu förvaras säkrare än tidigare tack vare nya algoritmer som utvecklats vid Umeå universitet. De förbättrade algoritmerna minskar risken för dataläckage vid exempelvis systemuppdateringar.
När du besöker en läkare registreras information som läkemedelsordinationer, röntgenbilder och genetiska tester för att hjälpa läkaren i sitt arbete. I dessa sammanhang används en teknik som kallas federated learning, eller kollaborativt lärande, för att minska risken för att känslig data exponeras. Tekniken gör det möjligt för flera enheter att samarbeta utan att dela den faktiska datan med varandra.
Saloni Kwatra, doktorand vid Institutionen för datavetenskap, har i sin avhandling identifierat brister med tekniken och utvecklat nya algoritmer som ökar säkerheten för användarna.
– Federated learning används ofta för att skydda användarens integritet. Men under systemuppdateringar kan känslig information ändå läcka. Min forskning har lett till algoritmer som kan förhindra sådana läckage, säger Saloni Kwatra.
För att uppnå detta har hon använt två tekniker: k-anonymity och differential privacy. Med k-anonymity organiseras datan så att varje kombination av identifierande detaljer (som längd, ålder eller ögonfärg) delas av flera individer. Detta gör det svårt att urskilja eller identifiera någon, eftersom de grupperas med andra som har samma egenskaper. Differential privacy fungerar på ett annat sätt genom att säkerställa att resultaten av en analys inte påverkas nämnvärt oavsett om en specifik person är inkluderad i datamängden eller inte. På detta sätt skyddas individens integritet, även när datan används för forskning eller studier.
Metoder för att motverka interferensattacker
Saloni Kwatra har också undersökt hur syntetiska data, som imiterar verkliga mönster men inte innehåller riktiga personuppgifter, kan skyddas mot så kallade attributinformationsattacker. I dessa attacker försöker en angripare återskapa specifika egenskaper hos en individ. Dessa nya algoritmer är särskilt relevanta för sektorer där dataintegritet är avgörande, såsom sjukvård, finans och telekommunikation..
– Där kan dessa algoritmer hjälpa till att bibehålla användarnas integritet samtidigt som systemen blir både säkrare och mer effektiva, säger Saloni Kwatra.
Om avhandlingen
Måndagen den 4 november försvarar Saloni Kwatra, från Institutionen för datavetenskap vid Umeå universitet, sin avhandling med titeln ”Navigera i datasekretess och verktyg: ett strategiskt perspektiv.” Disputationen äger rum kl. 09:15 i BIO.A.206 Aula Anatomica, Biologihuset. Opponent är Sébastian Gambs, professor vid Institutionen för datavetenskap, Université du Québec à Montréal (UQAM).