5. november 2020

Verdens proteinforskere får nu tiltrængt hjælp fra dansk AI-værktøj

kunstig intelligens

At sortere kæmpe datamængder er en flaskehals i proteinforskning – et felt, som bl.a. er afgørende for at udnytte genteknologien CRISPR og forstå sygdomme som cancer, Alzheimers og Parkinsons. Nu har forskere fra Københavns Universitet som de første i verden fået kunstig intelligens til at gøre den tunge del af arbejdet – det kan sikre fælles internationale standarder og gøre avanceret proteinvidenskab anvendeligt for flere.

Nærbillede af proteinprøve, der studeres med FRET-teknik.
Nærbillede af proteinprøve, der studeres med FRET-teknik. Foto: Shunliang Wu

Forskere fra Københavns Universitet har med kunstig intelligens løst et problem, som indtil nu har været stopklods for vigtig proteinforskning i dynamikkerne bag sygdomme som cancer, Alzheimers og Parkinsons samt i udviklingen af grøn, bæredygtig kemi og ny genteknologi.

Det har nemlig været et både tidskrævende og vanskeligt arbejde at analysere de kæmpe datamængder, som forskerne indsamler, når de ved hjælp af mikroskopi og teknikken FRET undersøger, hvordan proteiner bevæger sig og interagerer med deres omgivelser. Samtidig kræver opgaven høj ekspertise. Derfor har det hobet sig op med fyldte servere og harddiske. Nu har forskere fra Kemisk Institut, Nano-Science Center, Novo Nordisk Foundation Center for Protein Research og Niels Bohr Institutet udviklet en machine learning-algoritme til at tage det tunge slæb.

”Før sad vi og sorterede data, indtil vi var ved at blive skøre. Nu trykker vi på en knap, og så er al vores data analyseret. Og algoritmen gør det mindst lige så godt eller bedre end os. Det frigiver ressourcer til, at vi kan optage endnu større datamængder end tidligere og hurtigere nå resultater,” siger Simon Bo Jensen, biofysiker og Ph.d.-studerende ved Kemisk Institut og Nano-Science Center.

Algoritme gør arbejdet på sekunder


Algoritmen har lært at genkende mønstre i proteinernes bevægelser, så den på få sekunder kan klassificere datasæt, som det normalt kan tage eksperter flere dage at komme igennem.

”Vi har hidtil siddet med en masse rådata i form af tusindvis af mønstre, som vi har måttet sortere manuelt ét efter ét. Dermed blev vi flaskehalsen i vores egen forskning. Og selv for eksperter er det svært at gøre arbejdet konsistent og nå samme konklusion hver gang, fordi vi jo bare er mennesker, der bliver trætte og laver fejl,” siger Simon Bo Jensen.

KU-forskernes studier i sammenhængen mellem proteiners bevægelse og funktion er internationalt anerkendt og afgørende for at forstå, hvordan den menneskelige krop fungerer. Fx skyldes sygdomme som cancer, Alzheimers og Parkinsons, at proteiner klumper sammen eller ændrer deres opførsel. Også genteknologien CRISPR, som i år vandt Nobelprisen i kemi, er baseret på proteiners evne til at klippe i specifikke DNA-sekvenser. Når forskerne på KU, herunder Guillermo Montoya og Nikos Hatzakis, undersøger hvordan de processer foregår, er det netop ved hjælp af data fra mikroskopi.

”Før vi kan behandle alvorlige sygdomme eller udnytte genteknologien CRISPR til fulde, er vi nødt til at forstå hvordan de mindste byggesten, proteinerne, fungerer. Her kommer proteinernes dynamik og bevægelser i spil, og vores værktøj er en stor hjælp,” siger Guillermo Montoya fra Novo Nordisk Foundation Center for Protein Research.

Nikos Hatzakis og Simon Bo Jensen betjener det avancerede fluorescens-mikroskop, der benyttes til optagelse af FRET.
Nikos Hatzakis og Simon Bo Jensen betjener det avancerede fluorescens-mikroskop. Foto: Shunliang Wu

Opmærksomhed fra hele verden

Det lader til, at andre proteinforskere rundt om i verden også har savnet et sådant værktøj. Allerede nu har adskillige forskergrupper i udlandet henvendt sig og udvist interesse i at bruge algoritmen.

”AI-værktøjet er et kæmpe plus for hele forskningsfeltet, fordi det giver nogle fælles standarder, man ikke før har haft, når forskere verden over skal sammenligne data. Før var meget af analysen baseret på en subjektiv opfattelse af, hvilke mønstre, der var brugbare. Og det kan jo variere fra forskningsgruppe til forskningsgruppe. Nu har vi et værktøj, der kan sikre, at vi alle når de samme konklusioner,” siger forskningsleder og lektor Nikos Hatzakis fra Kemisk Institut og Novo Nordisk Foundation Center for Protein Research, og tilføjer at værktøjet også har et andet perspektiv:

”At analysere proteiners bevægelsesmønstre er stadig en niche, som dog vinder frem flere og flere steder i takt med, at de avancerede mikroskoper, man skal bruge til formålet, bliver billigere. Men det kræver stadig et højt ekspertiseniveau at analysere dataene. Vores værktøj gør nu metoden tilgængelig for flere forskere inden for biologi og biofysik uden særlig ekspertise, hvad enten det handler om forskning i coronavirus, udvikling af nye lægemidler eller grønne teknologier.”

Emner