Aalto-yliopisto

Väriläiskät paljastavat datasta ilmiöitä ja yhteyksiä

Lehdistötiedote   •   Marras 11, 2011 13:06 EET

 Visualisoinnin avulla datasta voi hahmottaa kiinnostavia ilmiöitä ja yhteyksiä, joita ei etukäteen osata tarkasti määritellä. Esimerkiksi ihmisen geeneistä kerätystä datasta voidaan nähdä, kuinka eri puolilta Suomea tulevat ihmiset ryhmittyvät geneettisesti, kertoo Perustieteiden korkeakoulusta väittelevä DI Eli Parviainen.

Visualisoinnilla tarkoitetaan käytännössä datan muuttamista väriläiskiksi. Moniulotteista dataa ei kuitenkaan voi visualisoida sellaisenaan, vaan se on ensin muutettava yksinkertaisempaan, matalaulotteisempaan muotoon.

Parviainen tutkii laskennallisen tekniikan alan väitöskirjassaan datan visualisoimisen mahdollistavaa ulotteisuudenpienennystä. Työ koostuu joukosta ulotteisuudenpienennyksen ja neuroverkkotutkimuksen ajankohtaisiin kysymyksiin liittyviä tutkielmia. Parviainen esittää uuden tavan nopeuttaa ulotteisuudenpienennyksen laskentaa poistamalla osan datapisteiden välisistä vertailuista huomioimalla datapisteiden naapuruussuhteet. Menetelmän avulla ulotteisuudenpienennyksen käyttö sovelluksissa olisi helpompaa.

Nykypäivän datassa voi Parviaisen mukaan olla kymmeniä tuhansia muuttujia. Ulotteisuudenpienennyksellä moniulotteisesta datasta haetaan tärkeimmät piirteet. Moniulotteisella datalla tarkoitetaan dataa, jossa havainnot koostuvat monesta osasta – esimerkiksi kuvassa on useita pikseleitä, jolloin jokainen pikseli muodostaa yhden ulottuvuuden.

̶ Datan visualisointiin tarvitaan matalaulotteinen esitys, koska paperi on kaksiulotteinen ja tila on kolmiulotteinen. Korkeaulotteinen tila on siis muutettava muotoon, jonka voi visualisointia varten piirtää paperille tai tietokoneen ruudulle, Parviainen havainnollistaa.

 

Automatisoitu maailma vaatii datan luokittelua

 

Visualisoinnin avulla voidaan tutkia myös datasta mallin avulla tehtyjä tulkintoja – etsiä esimerkiksi syitä siihen, miksi datan luokittelija ei pysty erottamaan tiettyjä luokkia toisistaan.

Esimerkkinä Parviaisen väitöskirjassa toimivat käsin kirjoitetut numerot. Huonolla käsialalla kirjoitettuja numeroita on pystyttävä luokittelemaan esimerkiksi siksi, että postin kulku helpottuisi.

̶ Postissa kone voi lukea kirjeistä käsinkirjoitetut postinumerot ja heittää kirjeet oikeisiin pinoihin, jotta postiljoonin ei tarvitse tavata numeroita. Datan luokittelun avulla monia asioita pystytään automatisoimaan.

 

Eli Parviaisen väitöskirja “Studies on dimension reduction and feature spaces” (suom. “Ulotteisuudenpienennyksestä ja piirreavaruuksista”) tarkistetaan 11.11. kello 12 Aalto-yliopiston perustieteiden korkeakoulun salissa F239a, Otakaari 3 J, Espoo.

 

Väitöskirja verkossa: http://lib.tkk.fi/Diss/2011/isbn9789526043128/

Lisätietoja: Eli Parviainen, p. 050 512 4385, eli.parviainen@aalto.fi


Kuvalinkki:
http://media.digtator.fi/digtator/tmp/cb9efde7f7a99dfeb03855fd952b7e9c/preview.html 

 

Latauslinkki on voimassa 11.12.2011 asti.