Nyhet -

Datorn lär sig "se" som en människa

Att tolka bilder är en nödvändighet för datorer som ska styra framtidens självkörande bilar. Eller identifiera ditt ansikte när du går genom en spärr. Ny forskning ökar datorernas känslighet för bilddetaljer.

Bo Li har i sitt avhandlingsarbete vid Umeå universitet utvecklat ett banbrytande koncept inom datorseende, interest curves, som baserar sig på kurvor och linjer och breddar området för datorers uppfattning av bilddetaljer. Han försvarar sin avhandling den 27 november vid Umeå universitet.

Med vår mänskliga uppfattning kan vi känna igen föremål genom bilddetaljer så som former och kurvor. Vi kan till exempel identifiera ansikten, djur, bilar och andra vardagsobjekt i enkla skissbilder men för datorer är denna uppgift väldigt utmanande.

"Seende datorer"

Datorseende är ett område som arbetar med att bygga "seende datorer", vilka automatiskt bearbetar och "förstår" innehållet i digitala bilder. Forskningsområdet är i snabb utveckling och noggrann modellering av bilddetaljer är mycket viktigt inom ett brett spektrum av tillämpningar, till exempel bildregistrering, 3D-rekonstruktion och objektdetektering.

I framtida teknik såsom Google Car, virtuell verklighet (VR), eller inom artificiell intelligens (AI), kommer bilddetaljer fortfarande vara grundläggande komponenter. Trots att hundratals lösningar för detektering av bilddetaljer redan existerar, har ett stabilt koncept hittills saknats.

Känna igen föremål

Bo Li har utvecklat ett koncept som innebär ett genombrott inom fältet datorseende: så kallade interest curves.

– Med denna metod kan en dator rita bilder med penseldrag. Interest curves kan också användas av datorn för att känna igen föremål på ett mer exakt sätt, säger Bo Li.

Konceptet ger helt nya möjligheter för förståelse av bilddetaljer, inklusive punkter, regioner, linjer och kurvor. Det gör också att alla dessa funktioner kan rymmas inom samma teoretiska ramverk. Resultatet innebär inte enbart ett teoretiskt framsteg för framtida forskning kring bilddetaljer, det ger också praktisk vägledning till området.

Använder kurvor och linjer

Den viktigaste komponenten för att hitta bilddetaljer är stabilitet, enligt Bo Li. Hans resultat visar att den nya metoden gör de kurvor och linjer som skall detekteras stabila trots bildtransformationer och störningar i bilderna.

Förut har kurvor och linjer inom datorseende inte varit lika populära att använda som punkter och regioner, eftersom de saknar tillräckligt med robusthet. Bo Lis nya teori och algoritmer ändrar nu på detta.

– Kurvor och linjer är naturligt mer användbara än punkter, eftersom människor använder dessa former för att beskriva världen, förklarar Bo Li.

Hans avhandlingsarbete visar på många fördelar med att använda kurvfunktioner för tillämpningar inom datorseende.

Mikael Hansson

Ämnen

  • Företagande

Kategorier

  • bilddetaljer
  • datorer
  • forskning
  • umeå universitet

Regioner

  • Umeå

Kontakter

Mikael Hansson

Webbredaktör, skribent InfoTech Umeå +46 70 553 06 18

Annelie Weinehall

Marknadsassistent Infotech Umeå Marknadsaktiviteter och event +46903435622