Gå direkt till innehåll
Anna Jonsson, doktorand på Institutionen för datavetenskap vid Umeå universitet. Foto: Lina Lidmark
Anna Jonsson, doktorand på Institutionen för datavetenskap vid Umeå universitet. Foto: Lina Lidmark

Pressmeddelande -

Regler måste brytas när datorer ska lära sig människospråk

Datorers styrka ligger i att de alltid följer regler i form av de instruktioner de är programmerade med. Detta är också deras svaghet när det kommer till att bearbeta människors språk – i alla fall om man ska tro Anna Jonsson, som fredagen den 11 juni försvarar sin avhandling vid Umeå universitet.

– Vi människor använder språk på ett inte alltid helt entydigt sätt, men givet sammanhanget tenderar vi att förstå varandra ändå. För en dator är vi dock i grunden helt obegripliga, säger Anna Jonsson, Institutionen för datavetenskap vid Umeå universitet.

Hon fortsätter:

– Ett annat problem är att språk är oändliga, och att en dators minnesutrymme är ändligt. Det vi som jobbar med språkbearbetning gör är att försöka använda det ändliga utrymmet för att täcka en så stor del av ett språk som möjligt.

Datorer kommunicerar via så kallade formella språk – språk som följer ett ändligt antal logiska regler. Trots att människospråk också följer vissa grammatiska regler så är dessa regler föränderliga och inte strikt nödvändiga för att vi ska förstå varandra, vilket ju är målet med mellanmänsklig kommunikation.

För att en dator ska kunna analysera människors språk behövs ändliga modeller som representerar aspekten som ska analyseras. Två centrala aspekter är syntax och semantik: syntax är orden som används och deras ordning medan semantik avser mening – vad en specifik text vill förmedla. I en dator representeras syntaktiska analyser som datastrukturen träd medan semantiska analyser fångas i form av datastrukturen graf.

Språkanalysmodeller måste också kunna utvärderas. För det behövs data i form av människospråk: med den kan modellens analyser poängsättas genom jämförelse med data. I sin avhandling utvecklar Anna Jonsson en metod som extraherar de högst poängsatta syntaktiska analyserna från en existerande språkanalysmodell.

– Vad gällande de semantiska analyserna har forskningen inte kommit lika långt. Därför har vi valt att utveckla en egen modell för semantisk analys, och jag hoppas och tror att vår modell kommer att vara betydelsefull i forskningen om semantisk språkbearbetning, säger Anna Jonsson.

Anna Jonsson är född och uppvuxen i Skellefteå. Hon har en civilingenjörsexamen i teknisk datavetenskap från Umeå universitet.

Läs hela avhandlingen

Pressfoto. Foto: Lina Lidmark

Om disputationen:

Fredagen den 11 juni försvarar Anna Jonsson, Institutionen för datavetenskap vid Umeå universitet, sin avhandling med titeln: Best Trees Extraction and Contextual Grammars for Language Processing. Svensk titel: Extrahering av optimala träd samt kontextuella grafgrammatiker för språkbearbetning

Disputationen äger rum klockan 10.00 i MA316 vid Umeå universitet och streamas på Zoom på grund av covid-19-restriktioner
Fakultetsopponent är Dr. Hendrik Jan Hoogeboom, Leidens universitet.

Läs i kalendariet

För mer information, kontakta gärna:

Anna Jonsson, Institutionen för datavetenskap vid Umeå universitet
Mobil: 076-819 06 10
E-post: aj@cs.umu.se

Ämnen

Regioner


Umeå universitet
Umeå universitet
är ett av Sveriges största lärosäten med drygt 36 000 studenter och 4 000 anställda. Här finns en mångfald av utbildningar av hög kvalitet och världsledande forskning inom flera vetenskapsområden. Umeå universitet är också platsen för den banbrytande upptäckten av gensaxen CRISPR-Cas9 – en revolution inom gentekniken som tilldelats Nobelpriset i kemi.

Vid Umeå universitet är allt nära. Våra sammanhållna campus gör det lätt att mötas, samarbeta och utbyta kunskap, något som gynnar en dynamisk och öppen kultur där vi gläds åt varandras framgångar.

Kontakter

Ingrid Söderbergh

Ingrid Söderbergh

Forskningssamordnare Forskning vid Umeå Centre for Microbial Research, UCMR 070-60 40 334

Umeå universitet

Med omkring 37 900 studenter och drygt 4 560 medarbetare är Umeå universitet ett av Sveriges största lärosäten. Här finns en mångfald av utbildningar och världsledande forskning inom flera vetenskapsområden. Umeå universitet är också platsen för den banbrytande upptäckten av gensaxen CRISPR-Cas9 – en revolution inom gentekniken som år 2020 tilldelades Nobelpriset i kemi.

Umeå universitet har funnits i drygt 50 år och präglas av såväl tradition och stabilitet som förändring och nytänkande. Här bedrivs utbildning och forskning på hög internationell nivå som bidrar till ny kunskap av global betydelse, där hållbarhetsmålen i Agenda 2030 utgör drivkraft och inspiration. Här finns kreativa och nytänkande miljöer som tar sig an samhällets utmaningar, och genom djupa och långsiktiga samarbeten med organisationer, näringsliv och andra lärosäten fortsätter Umeå universitet att utveckla norra Sverige som kunskapsregion.

Universitetets internationella atmosfär och våra sammanhållna campus gör det lätt att mötas, samarbeta och utbyta kunskap, något som främjar en dynamisk och öppen kultur där studenter och anställda gläds åt varandras framgångar.

Umeå campus och Konstnärligt campus ligger nära Umeås centrum och intill ett av Sveriges största och mest välrenommerade universitetssjukhus. Campus finns även i Skellefteå och Örnsköldsvik.

Vid Umeå universitet finns den högt rankade Designhögskolan, den miljöcertifierade Handelshögskolan och landets enda arkitekthögskola med konstnärlig inriktning. Här finns också Bildmuseet och Umeås science center, Curiosum. Umeå universitet är dessutom ett av Sveriges fem riksidrottsuniversitet och har ett internationellt ledande arktiskt centrum.