Skip to main content

Maskinlæring er ikke ren magi

Nyhed   •   Feb 02, 2017 15:27 CET

Maskinlæring er et fantastisk værktøj, men ikke noget magisk man bare vifter med, og så sker der noget godt.

Sensorer og Internet-of-things er kun halvdelen af historien, når man skal omstille produktionen til industri 4.0 og gøre de klassiske produkter intelligente og smarte. Den anden halvdel handler om maskinlæring og at have det rette system, der kan opsamle og analysere de opsamlede data. Men det giver måske mening “afhype” begrebet, fordi maskinlæring er ikke et magisk værktøj.

Sådan lyder det fra Bjørn Bugge Grathwohl, Machine Learning Specialist i Data Science and Engineering Lab på Alexandra Instituttet, der her lister nogle af de udfordringer, han møder, når virksomheder skal i gang med maskinlæring.

Første skridt er, at vide, hvad du vil

Maskinlæring er ikke fuldstændig veldefineret. Der er en standard værktøjskasse, der indeholder matematik, anvendt statistik og datalogi, som man ofte vender tilbage til. Det betyder ikke, at man bare kan tage fat i værktøjskassen og bruge den, fordi typisk har en algoritme så mange parametre, at man skal forstå problemet og typen af problemet for at kunne bruge det effektivt til noget.

“Folk, der ikke har teknisk indsigt, kan have en tendens til at sige, at de vil godt i gang med noget maskinlæring. Men det svarer til at sige, at man gerne vil igang med at save. Men maskinlæring er ikke magisk, som man kan vifte med og så sker der noget. Det er anvendt statistik, som du kan bruge til mange ting. Men du er nødt til at vide, hvad du vil bruge det til,“ forklarer han.

Ofte mangler der data

Et andet problem, som ofte overrasker, er at det kræver data, og at det skal være den rigtige data. Folk har som regel ikke den data. De vil typisk gerne have en algoritme, der kan forudsige inden for et givent område. Det betyder, at man bygger modeller og træner dem ved at køre dem en masse gange, og så justerer man på en masse parametre for at få kvaliteten til at blive højere - og at få antallet af fejl til at blive mindre.

Og for at det skal blive godt, så skal man have en masse data, og det er tit, at folk ikke har det, fordi de ikke har gemt det. Det var eksempelvis tilfældet med en virksomhed, der laver et skrivetræning-software, der gør det nemmere at lære at læse og skrive. Her har Alexandra Instituttet via InnoBooster-ordningen hjulpet med at bygge en infrastruktur, der opsamler data, og som kan bruges til at identificere fejlmønstre.

Omsætter blodets karakter til tal

Et andet eksempel på, at maskinlæring er en motor, der skal fodres med den rigtige data, er et samarbejde, som Alexandra Instituttets Visual Computing Lab havde med Eldon Biologicals A/S. Det er samtidig et eksempel på, at maskinlæring egner sig rigtig godt til visuel genkendelse.

Her var udfordringen, at udvikle en algoritme, der kan skelne om blod klumper, og dermed afgøre, hvilken blodtype folk har. Herhjemme foregår det automatisk i blodbankerne, men i udviklingslande er de såkaldte Eldon-kort https://da.wikipedia.org/wiki/Eldonkort stadig et vigtigt værktøj for sundsarbejdere. Derfor har man udviklet en mobil applikation, der kan aflæse blodtypen ud fra det blod, der er afsat på kortet. Læs mere om projektet her https://alexandra.dk/dk/cases/digitalisering-af-blodtypekort

Forbedrede svartid fra 45 til et halvt minut

Det kan også handle om optimering af en prototype. Det var tilfældet med Archii, der er en startup virksomhed, der har lavet en automatisk arkivar, der klassificerer juridiske dokumenter og kontrakter. Her har Alexandra Instituttet hjulpet med at forbedre deres prototype.

“Som lille startup er det begrænset, hvad man kan og har af ressourcer. Her gik vi ind og eksperimenterede med forskellige AI-teknikker, og på den måde fik vi bygget en forbedret prototype. Det betød, at både kvaliteten i de svar, den gav, blev højnet, og samtidig gik det markant hurtigere. Svartiden gik fra omkring 45 minutter til et halvt minut,” forklarer han.

Med Archii så gør maskinlæring det som en arkivar gjorde i gamle dage, men som mange virksomheder har droppet, fordi man er hoppet på det papirløse samfund, og fordi vi hver især opbevarer vores dokumenter. Det betyder, at virksomheder bruger meget tid på at holde styr på kontrakter - og ofte foregår det på direktør-niveau, hvilket er dyrebar tid.

“Maskinlæring vil komme ind alle de steder, hvor opgaverne er rutinepræget for mennesker, men hvor man lige akkurat ikke har automatiseret det. Bogføring af data har vi skrevet ned i databaser siden 1960’erne, men der findes masser af rutinearbejde inden for sagsbehandling som ikke er så strengt defineret. Her giver det mening at bruge maskinlærings-teknikker,” forklarer han.

Kommentarer (0)

Tilføj kommentar

Kommentar