Skip to main content

Ny dansk talegenkender kan tilpasses med fagsprog

Nyhed   •   Jun 13, 2019 09:35 CEST

Spar på tasterne - ny dansk talegenkender kan tilpasse alle brancher med fagudtryk og relevant sprogbrug.

Hvis klinikken er bagud med at få skrevet journaler, eller hvis direktøren mangler sin sekretær, kan et ’tale-til-tekst-program’ hjælpe med at få det talte ord ned på skrift. Virksomheder, hospitaler, skoler og andre har i en årrække sparet tid og tastetryk ved at bruge et talegenkendelsesprogram. Programmerne har aflastet skrivearbejdet men har aldrig været 100 procent præcise.

Nu har danske Dictus udviklet en ny dansk talegenkender, der er tilpasset det danske sprog. Den kan opdateres med lige netop de fagtermer, der er brug for på et ønsket område.

- De fleste kender i dag Apple og Googles talegenkendere, og de fungerer også fint til eksempelvis Siri. Men blandt andet i sundhedsvæsnet, i folkeskolen eller til referatskrivning har de internationale systemer ikke været gode nok til at genkende de danske fagtermer. Derfor har vi udviklet en ren dansk løsning – Dictus SUN, som står for Speech UNlimited, siger Jens Otto Kjærum, der er direktør i danske Dictus, som står bag tale-til-tekst-programmet.

Afprøvet og godkendt i Folketinget

Dictus bruges af mange store virksomheder som DR, TV 2 og Postnord. Det danske Folketing har brugt talegenkendelsesprogrammer til referatskrivning i ti år og har i foråret 2019 testet Dictus SUN i Folketingstidende.

- Vi har to udfordringer med vores gamle system. Dels er det stemmeafhængigt. Det vil sige, at det skal lære brugerens stemme at kende, og en ny medarbejder kan ikke bare springe til og bruge det uden tilpasning. Derudover bliver de dansksproglige opdateringer ikke prioriteret fra den amerikanske udbyder. Det kan bliver et problem, da sproget jo hele tiden udvikler sig, og derfor er der behov for, at tale-til-tekst-systemet følger med, siger Michael Ejstrup, redaktionssekretær i Folketingstidende.

Sproget udvikler sig

Det er vigtigt for Folketingets administration, at leverandøren af talegenkendelsessystemet har fokus på det danske sprog og ikke mindst på, hvordan sproget udvikler sig.

- Det er demokratiet, der udspiller sig i Folketingssalen, så sproget skal naturligvis gengives korrekt. Desuden bruger politikerne jo termer fra mange brancher, der hele tiden udvikler sig, og det skal systemet kunne tilpasses. Et eksempel kunne være ordet snaps (den danske brændevin), som jo staves ligesom det engelske snaps (fotos), som det danske sprog har adopteret, fortæller Michael Ejstrup.

Dictus SUN vil blive sendt til eksamen ved finanslovsforhandlingerne i september. Her bliver talegenkenderen for alvor sat på prøve, da møderne både indeholder tal, paragraffer og fagtermer.

Kan selv skabe ordforråd

Tidligere danske tale-til-tekst-programmer har været bygget af store udenlandske virksomheder. Her har man kunnet vælge mellem et meget begrænset antal forskellige ordforrådspakker, afhængig af hvilken branche systemet skulle bruges til. Med den nye model har Dictus selv kontrol over både software og sprog. Leverandøren kan dermed selv udvikle systemet til en række brancher, som ikke tidligere har haft mulighed for at bruge talegenkendelse.

- Vi har brugt kunstig intelligens til at bygge sprogmodeller til Dictus SUN. Til Folketingets sprogpakke er flere end 100 millioner ord lagt ind. De er taget fra de seneste 11 års referater fra møderne i Folketingssalen, fortæller Jens Otto Kjærum.

Håbet er nu, at Dictus SUN både kan erstatte tidligere, forældede løsninger, og at det fremover kan benyttes i brancher, der tidligere ikke har haft glæde af talegenkendelse på grund af manglende sprogmodeller eller utilstrækkelig genkendelseskvalitet.

Dictus er medlem af Welfare Tech

Billede: Pixabay