31. august 2022

AI-træning med billeder afhjælper engelsk dominans

Kunstig intelligens

Træningssæt inden for kunstig intelligens er næsten altid på engelsk. Det skaber en kulturel skævvridning. Men nu har forskere fra Københavns Universitet udviklet en ny billedbaseret teknik, som tillader andre kulturer og sprog at komme til orde.

Billedbaseret Machine Learning kan også udvide rækkevidden af apps
Getty Images

Engelsk er det klart dominerende sprog inden for AI-teknologien maskinlæring (machine learning). Når forskere for eksempel vil afprøve software, der skal gøre en computer i stand til at forstå indholdet af en tilfældig tekst, bliver der næsten altid trænet på engelske tekster.

”Det skaber en betydelig utilsigtet kulturel skævvridning. Selv efter langvarige træningsforløb vil computeren aldrig være stødt på indisk tyretæmning, kinesisk ”hot pot” madlavning eller andre fænomener, der er velkendte af millioner af mennesker, men tilfældigvis ligger uden for den engelsktalende verdens horisont,” siger ph.d.-studerende Emanuele Bugliarello, Datalogisk Institut (DIKU), Københavns Universitet.

Sammen med kolleger fra en række lande har Emanuele Bugliarello skabt en ny målestok for maskinlæring, som de har døbt IGLUE (Image-Grounded Language Understanding Evaluation). Her bliver effektiviteten af maskinlæring vurderet på 20 sprog i stedet for kun på engelsk.

Den videnskabelige artikel, som introducerer IGLUE, er blevet accepteret til offentliggørelse ved en af de mest prestigefyldte konferencer på feltet, International Conference on Machine Learning (ICML).

Frivillige sendte billeder fra forskellige kulturer

Hvordan kan en ny målestok så gøre en forskel?

”Maskinlæring er præget af hård konkurrence. Når et forskerhold er lykkedes med at løse en bestemt problemstilling med 98 % nøjagtighed, vil et andet hold forsøge at opnå 99 %. og så videre. På den måde bliver feltet hele tiden drevet fremad. Men ulempen er, at parametre, som savner en målestok, ikke bliver prioriteret. Det har været tilfældet for multikulturel maskinlæring, men den situation forsøger vi nu at ændre ved at lancere IGLUE,” forklarer Emanuele Bugliarello.

Inden for maskinlæring er det helt almindeligt at anvende træningssæt med billeder. Imidlertid er billederne normalt markeret med korte tekster, som fremmer maskinens indlæring. Teksterne er næsten altid på engelsk, men ikke i IGLUE. Her forekommer der 20 meget forskellige sprog, som ligger inden for 11 forskellige sprogfamilier, benytter ni forskellige alfabeter og dækker tre meget forskellige dele af klodens geografi.

Samtidig er der inddraget billeder fra mange forskellige kulturer. En del af billederne i IGLUE er indhentet gennem en mail-kampagne. Forskerne har bedt frivillige fra en lang række lande om at sende billeder og tekster på deres modersmål - gerne med et indhold, der er karakteristisk for landet.

Overvældet af positive reaktioner

Skævvridningen i maskinlæring er ikke kun et akademisk problem, forklarer Emanuele Bugliarello:

”For eksempel findes der apps, som kan fortælle en bruger med fødevareallergi, hvilke ingredienser, der er i et måltid. Forestil dig, at du sidder på en restaurant i Kina. Menuen er på kinesisk, som du ikke kan læse, men der er billeder af retterne. Hvis din app er god, kan den give dig opskriften ud fra et billede – men kun hvis der indgik kinesiske retter, dengang maskinen blev trænet.”

Sagt på en anden måde får ikke-engelske anvendelser af maskinlæring dårligere løsninger:

”Mange af de førende løsninger inden for maskinlæring klarer sig markant dårligere, når de bliver udsat for data fra ikke-engelsktalende lande. Og omvendt går maskinlæringen glip af koncepter og idéer, der er udviklet andre steder end i Europa eller Nordamerika. Det er noget, som forskerne inden for maskinlæring er nødt til at forholde sig til.”

Heldigvis har mange kolleger forstået budskabet, konstaterer Emanuele Bugliarello:

”Det hele begyndte for et par år siden, da vi skrev et indlæg til konferencen EMNLP (Empirical Methods in Natural Language Processing, red.). Vi ville bare pege på, at der var et muligt problem. Men vi blev simpelthen overvældet af positive reaktioner, og til vores store overraskelse blev vores bidrag valgt som konferencens ”Best Long Paper”. Folk erkendte helt klart, at problemet eksisterer, og opfordrede os til at fortsætte.”

Kan skabe hjælpemidler til synshæmmede

Til tider kan bølgen af succes, som holdet rider på, næsten føles som en byrde, indrømmer Emanuele Bugliarello:

”Som offentlige forskere er der grænser for vores ressourcer. Vi kan ikke forfølge alle aspekter af denne meget store problemstilling. Imidlertid kan vi se, at andre grupper begynder at bidrage. Desuden er der interesse hos de store tech-virksomheder. De er meget aktive inden for maskinlæring og begynder nu at indse, at engelsk skævvridning kan være problematisk. Naturligvis er de kede af at se effektiviteten af deres løsninger falde markant, når man bevæger sig uden for engelsksprogede sammenhænge.”

De positive udviklinger får dog ikke Emanuele Bugliarello til at hæve armene over hovedet. På spørgsmålet om, hvor tæt vi er på maskinindlæring uden skævvridning, lyder svaret:

“Uha, vi er meget langt væk!”

Samtidig er der imidlertid mere end kulturel ligestilling på spil:

”De underliggende metoder i IGLUE kan finde adskillige anvendelser. For eksempel kigger vi på løsninger til synshæmmede. Der findes værktøjer, som hjælper synshæmmede med at følge plottet i en film eller andre typer af visuel kommunikation. I dag er den slags værktøjer langt fra perfekte, og jeg håber, at vi kan forbedre dem. Det ligger dog lidt længere ude i fremtiden,” slutter Emanuele Bugliarello.

 

Den videnskabelige artikel “IGLUE: A Benchmark for Transfer Learning across Modalities, Tasks, and Languages” er offentlliggjort i “Proceedings of The Thirty-ninth International Conference on Machine Learning” (ICML). Konferencen fandt sted 17-23 juli i Baltimore, USA.

Kontakt

Emanuele Bugliarello
Ph.d.-studerende
Natural Language Processing
Datalogisk Institut
Københavns Universitet
Mail: emanuele@di.ku.dk
Mobil +45 93 51 60 61

Kristian Bjørn-Hansen
Journalist
Det Natur- og Biovidenskabelige Fakultet
Københavns Universitet
Mail: kbh@science.ku.dk 
Tlf: +45 93 51 60 02

Emner

Læs også