Kansallisen koulutuksen arviointikeskuksen asiantuntijalausunto sivistysvaliokunnalle: Perusopetuksen oppimistulokset, mahdollisuuksien tasa-arvo ja rahoitus (O 20/2024 vp)
Kansallinen koulutuksen arviointikeskus (Karvi) kiittää sivistysvaliokuntaa mahdollisuudesta antaa asiantuntijalausunto tarkastusvaliokunnan teettämästä tutkimuksesta ja siinä esitetyistä suosituksista.
Tarkastusvaliokunnan teettämän tutkimuksen Perusopetuksen oppimistulokset, mahdollisuuksien tasa-arvo ja rahoitus raportissa esitetään perusopetukseen liittyvän tiedonkeruun vahvistamista ja kansallisen datainfrastruktuurin kehittämistä. Raportissa ehdotetaan aloitettavaksi parlamentaarinen komiteavalmistelu, jonka tehtävänä olisi valmistella konkreettiset toimet datainfrastruktuurin parantamiseksi. Karvi ottaa tässä lausunnossa kantaa raportissa esitettyihin suosituksiin sekä tiedontuotannon ja arviointitoiminnan kehittämistarpeisiin.
Yhteenveto lausunnon pääkohdista
Koulutuksen ja varhaiskasvatuksen ulkopuolisen arvioinnin riippumattomana asiantuntijaorganisaationa Suomessa toimii Kansallinen koulutuksen arviointikeskus (Karvi). Sen lakisääteisenä tehtävänä on tuottaa arviointiin perustuvaa tietoa koulutuspoliittisen päätöksenteon sekä koulutuksen ja varhaiskasvatuksen kehittämisen tueksi. Karvin toimiala kattaa koko koulutusjärjestelmän. Tehtäviin kuuluu muun muassa perusopetuksen opetussuunnitelman perusteiden tavoitteiden toteutumisen arviointi, opetuksen järjestäjien laadunhallinnan tukeminen ja arviointitoiminnan kehittäminen.
Karvin toiminnan keskeiset periaatteet ovat luottamus, avoimuus, osallisuus ja oikeudenmukaisuus. Arvioinnin tehtävinä ovat tiedon tuottaminen, kehittäminen sekä tuloksellisuuden varmistaminen. Kehittävä arviointi on kirjattu lainsäädäntöön suomalaisen koulutuksen arviointitoiminnan periaatteeksi. Karvin arviointien lähtökohtana on systeeminen näkemys koulutuksen ja kasvatuksen ilmiöistä, asioiden keskinäisistä yhteyksistä ja muuttuvasta toimintaympäristöstä.
Karvin oppimistulosten arvioinnit perustuvat otospohjaiseen arviointimalliin, joka mahdollistaa koulutuksen tuloksellisuuden sekä tasa-arvon ja yhdenvertaisuuden toteutumisen seurannan ilman, että yksittäisiä kouluja voidaan asettaa paremmuusjärjestykseen. Karvi pitää nykyisenkaltaista oppimistulosten arviointijärjestelmää parhaana vaihtoehtona, mutta kannattaa opetuksen ja koulutuksen laadun kehittämistä koskevan monipuolisen tietotuotannon ja arvioinnin kehittämistä.
Arviointitietoa tarvitsevat erityisesti opetus- ja kulttuuriministeriö, Opetushallitus ja opettajankoulutuslaitokset, jotka hyödyntävät sitä opetussuunnitelman tavoitteiden toteutumisen, osaamisen kehityssuuntien ja opettajien osaamistarpeiden arvioinnissa. Arviointitietoa hyödyntävät myös kunnalliset päätöksentekijät, rehtorit ja opettajat. Arvioinneissa tarkastellaan oppilaiden osaamista taustatekijöiden, kuten asuinpaikan, kielitaustan, tuen muotojen, koulun koon ja huoltajien koulutustaustan näkökulmasta. Pitkittäisarvioinneilla tuotetaan lisäksi kehitystietoa samoista oppilaista usean vuosiluokan ajalta. Nykyinen kansallinen arviointijärjestelmä on kansainvälisesti vertaillen kevyt ja kustannustehokas, eikä se kuormita kohtuuttomasti oppilaita tai opettajia. (Kansallinen koulutuksen arviointikeskus 2025)
Karvin kansalliset oppimistulosten arvioinnit toteutetaan digitaalisella järjestelmällä (Joda), joka on kehitetty yhteistyössä CSC:n kanssa vuosina 2022–2025. Järjestelmä mahdollistaa arviointidatan tehokkaan ja tietoturvallisen käsittelyn sekä sujuvan yhdistämisen rekisteriaineistoihin. Järjestelmän kehittämisen lähtökohtana on ollut tarve luoda pitkäjänteiseen käyttöön soveltuva ja käyttäjälähtöisesti suunniteltu ratkaisu, joka tukee laadukkaan arviointitiedon tuottamista ja jatkohyödyntämistä
Karvi pitää tärkeänä, että perusopetuksen ja muun koulutuksen sekä varhaiskasvatuksen tietopohjan vahvistamista tarkastellaan pitkäjänteisesti, tutkimusperustaisesti ja koko koulutus- sekä ohjausjärjestelmän kokonaisuus huomioiden, hyödyntäen kuluvalla hallituskaudella tehtyä laaja-alaista työryhmä- ja asiantuntijatyötä sekä valmistelua tukeneita tutkimuksia, selvityksiä ja laajoja kuulemisia. Samalla on olennaista varmistaa, että arvioinnin kehittämistä ohjaa koulutuksemme kansallisesti jaettu arvopohja ja keskeiset vahvuudet: yhdenvertaisuus, tasa-arvo, sivistys ja luottamus. Nykyisen koulutuksen arviointineuvoston tehtävänä on seurata ja kehittää kansallista koulutuksen arviointitoimintaa.
Tarkastusvaliokunnan tilaamassa tutkimuksessa tunnistetaan tärkeitä koulutuksen tietopohjaan liittyviä kehittämistarpeita. Pidämme myönteisenä pyrkimyksiä vahvistaa kansallista tiedontuotantoa sekä siihen perustuvaa arviointia ja tutkimusta. Arviointijärjestelmää tulee kuitenkin kehittää hyödyntämällä nykyisiä mahdollisuuksia monipuoliseen tiedonkeruuseen, eikä tarkastelua tulisi rajata liiaksi vain helposti mitattaviin ilmiöihin. Tiedontuotannon ja arvioinnin kehittämistarpeita tulee tarkastella monitieteisesti ja erilaisiin tutkimusparadigmoihin perustuen. Huomionarvoista on, että kansallisten opetussuunnitelmien moninaiset ja tärkeät tavoitteet eivät taivu yksinkertaisiin mittareihin, jotka voisivat jopa kaventaa kuvaa koulutuksen laadusta ja oppilaiden osaamisesta.
Tutkijoiden ehdotukset voivat siis tuottaa arvokasta tietoa, mutta ne eivät yksin riitä kuvaamaan koulutusjärjestelmän kokonaislaatua. Kansallisen arvioinnin tulee jatkossakin huomioida myös koulutuksen inhimilliset, kulttuuriset ja normatiiviset ulottuvuudet, sillä niiden sivuuttaminen voi ohjata järjestelmää pois kasvatuksellisista päämääristä ja yhteisistä arvoista (Kauko & Pajunen 2021). Opettajat tarvitsevat lisäksi tarkkaa ja monipuolista tietoa yksittäisten oppilaiden osaamisesta, jotta arviointi tukee sekä opetusta että oppimista. Monitasoinen arviointitieto mahdollistaa koulutuksen laadun ymmärtämisen ja kehittämisen tavalla, joka vastaa koulun yhteiskunnallista tehtävää.
Raportissa esitetty datainfrastruktuuri voisi parhaimmillaan vahvistaa koulutuksen arvioinnin tietopohjaa. Samalla siihen liittyy kuitenkin merkittäviä, yhtäältä metodologisia ja toisaalta kustannuksiin liittyviä kysymyksiä, joita avaamme lausunnossamme. Erityisesti on syytä tarkastella, tuottaako ehdotettu järjestelmä sellaista tietoa, joka aidosti tukee suomalaisen koulutuksen kehittämistä, vai keskittyykö se ensisijaisesti niihin ilmiöihin, joita on helpointa mitata.
Karvi ei pidä tarpeellisena raportissa esitettyä parlamentaarisen komiteavalmistelun käynnistämistä koulutuksen datainfrastruktuurin kehittämiseksi. Karvin yhteydessä toimii koulutuksen arviointineuvosto, joka on valtioneuvoston nimeämä asiantuntijaelin, jonka tehtävää on seurata ja kehittää koulutuksen arviointia sekä laatia ehdotus arviointisuunnitelmaksi. Karvi suhtautuu arviointitoiminnan kehittämiseen myönteisesti, kehittää aktiivisesti toimintaansa sekä kerää systemaattisesti palautetta toimintansa laadusta ja vaikuttavuudesta.
Karvi pitää tärkeänä, että raportissa esiin nostettua osaamisen ja resurssien eriytymisen kehitystä tarkastellaan osana laajempaa, pitkäaikaista arviointitietoa. Karvin omissa kansallisissa arvioinneissa on jo pitkään havaittu samansuuntaisia kehityskulkuja, kuten oppimistulosten eriytymistä, koulujen välisen ja sisäisen vaihtelun kasvua sekä muutoksia resurssien kohdentumisessa. Näkemyksemme mukaan arviointitiedon hyödyntämistä päätöksenteossa voidaan jatkossa vahvistaa varmistamalla, että kansalliset ja lakisääteiset arvioinnit otetaan systemaattisesti huomioon tällaisissa selvityksissä ja raporteissa. Tämä edistää sekä tiedon läpinäkyvyyttä että arviointijärjestelmän vaikuttavuuden toteutumista.
Datainfrastruktuurin vahvistaminen on tärkeää – koulutuksen laatua ei voi kaventaa vain helposti mitattaviin ilmiöihin
Karvi kannattaa ehdotusta kansallisen datainfrastruktuurin vahvistamisesta. Raportin esittämässä tietopohjassa korostuu kuitenkin helposti mitattavat ilmiöt ja tallennettavissa oleva tieto, jolloin huomio kohdistuu ensisijaisesti esimerkiksi oppimistuloksiin ja kognitiivisiin taitoihin. Rekisteritietojen laajentaminen, systematisointi ja yhdisteltävyys ovat tärkeitä koulutuspolitiikan ja tutkimuksen kehittämisen edellytyksiä, mutta rekistereistä ei tule muodostaa koulutuksen laadun ensisijaista mittaria.
On tärkeää muistaa, että koulutuksen arviointi ei ole sama asia kuin datainfrastruktuuri tai rekisteripohjainen tiedonkeruu. Arvioinnilla tarkoitetaan systemaattista ja monimenetelmällistä tiedon tuottamista ja siihen perustuvaa kokonaisvaltaista arvottavan analyysin tekemistä, jonka tavoitteena on lisätä ymmärrystä koulutuksen laadusta ja kehittämistarpeista. Arvioinnilla on kolme keskeistä tehtävää: tiedon tuottaminen, toiminnan kehittäminen ja tuloksellisuuden varmistaminen. Näiden tehtävien täysipainoinen toteuttaminen edellyttää lähestymistapaa, joka korostaa arvioinnin riippumattomuutta, luotettavuutta, kehittävää otetta sekä kasvatuksen ja koulutuksen toimijoiden osallisuutta (Korkeakoski & Silvennoinen 2008). Vahva arviointikulttuuri rakentuu luottamukselle ja sille, että tietoa kerätään eettisesti, läpinäkyvästi, tarkoituksenmukaisesti sekä erilaisista näkökulmista (Atjonen 2007; 2015)
Esimerkiksi rekisterit voivat kuvata vain sellaista tietoa, joka on yhteismitallisesti tallennettavissa. Ne eivät tavoita koulun arjen ilmiöitä, kuten vuorovaikutusta, tunnekokemuksia, kulttuurisia merkityksiä tai opetuksen taustalla vaikuttavia arvoja ja normeja (Kauko & Pajunen 2021). Epävarmassa maailmanpoliittisessa tilanteessa huomiota on lisäksi kiinnitettävä koulun hyvinvoinnillisiin ja sosiaalisiin ulottuvuuksiin, joita esimerkiksi Karvi on tarkastellut niin oppimistulos- kuin teema-arvioinneissaan.
Keskeistä siis on, mitä arvioidaan ja millaisilla menetelmillä. Tarkastusvaliokunnan tilaamassa raportissa annetaan ymmärtää, ettei nykyinen koulutuksen arviointitiedontuotanto ole riittävää. Jos tiedonkeruu automatisoidaan ja se keskittyy pääasiassa numeerisiin indikaattoreihin, on vaarana, että arviointi alkaa ohjata huomiota vain niihin osaamisen piirteisiin, jotka on helppo muuttaa mittaluvuiksi. Käytännössä tämä tarkoittaa esimerkiksi sitä, että oppilaiden osaaminen typistyy sellaiseen, mikä on arvioitavissa monivalintatehtävillä tai muilla standardoiduilla tehtävätyypeillä. Tällöin opetussuunnitelman muut tärkeät osaamisalueet, kuten eettinen ajattelu, vuorovaikutus- ja yhteistyötaidot, luova ongelmanratkaisu tai kulttuurinen osaaminen, uhkaavat jäädä järjestelmätason mittareiden ulkopuolelle. Nämä osa-alueet ovat kuitenkin olennainen osa koulun sivistystehtävää ja vaativat monimenetelmällistä, eli myös laadullista ja pedagogisesti harkittua arviointia.
Raportti esittää useita koulutuksen panoksiin liittyviä tietoja, joita tulisi kerätä nykyistä kattavammin tai ainakin systemaattisemmin. Tämä olisi hyödyllistä sekä tutkimukselle että kansalliselle koulutuksen arvioinnille. Opettajan ja oppilaan tietojen yhdistettävyys sekä koulutason tietojen parempi saatavuus toisivat uusia mahdollisuuksia myös arviointitoimintaan. Ne mahdollistaisivat esimerkiksi sen tarkastelun, miten erilaiset panostukset koulutuksessa ovat yhteydessä oppilaiden oppimistuloksiin. Tämä lisäisi ymmärrystä koulutuksen tilasta ilman, että tarvitaan laajoja kansallisia tuotosmittauksia.
On siis perusteltua tarkastella panostietojen kattavuutta. Raportissa esitetyt panokset ovat pääosin määrällisiä ja sellaisia, että niitä on helppo mitata ja tilastoida. Tällöin on vaarana, että huomio kohdistuu ensisijaisesti niihin tekijöihin, joista tietoa on yksinkertaisinta kerätä, ei välttämättä niihin, jotka ovat koulutuksen kehittämisen kannalta keskeisimpiä. Voisimme pitää perusteltuna, että panos–tuotos -malliin perustuvia vaikuttavuustutkimuksia toteutetaan erillisinä tutkimushankkeina, mutta emme kannata kansallisen oppimistulosarvioinnin ohjaamista tähän malliin, koska se kaventaisi merkittävästi arviointitiedon monipuolisuutta ja käytettävyyttä.
Kausaalitiedon tuottamisen rajoitteet koulutuksen kehittämisessä
Tarkastusvaliokunnan teettämän tutkimusraportin tavoitteena on luoda peruskoulutukseen datainfrastruktuuri, joka mahdollistaisi nykyistä paremman tiedon tuottamisen koulutuksen kehittämistä varten. Keskeinen ajatus on, että vahvemmat kausaalipäätelmät olisivat mahdollisia. On kuitenkin perusteltua kysyä, kattaako esitetty datainfrastruktuuri ne tiedon tasot, joita vahvojen kausaalisuhteiden arviointi aidosti edellyttäisi.
Nykyiset panostiedot ovat vielä kaukana raportissa hahmotelluista tavoitelluista tuotoksista, ja tiedon infrastruktuurista puuttuu kokonaan niiden väliin sijoittuva selittävä taso. Esimerkiksi opettajan kelpoisuus tai täydennyskoulutus voivat vaikuttaa oppimistuloksiin vain silloin, kun ne muuttavat opetuksen käytäntöjä ja luokkahuoneen vuorovaikutusta konkreettisella tavalla. Jos tätä kriittistä välikerrostumaa ei kyetä systemaattisesti kuvaamaan, panosten ja tuotosten yhdistäminen ei todennäköisesti tuota luotettavaa kausaalitietoa koulutuksen vaikutusmekanismeista.
Raportilla ehdotettuun infrastruktuurin liittyvät rajoitteet eivät tarkoita, etteikö sen rakentaminen voisi parantaa nykyistä tiedon saatavuutta ja yhdenmukaistaa tiedonkeruuta. Ehdotettu infrastruktuuri ei kuitenkaan korvaa temaattisten, laadullisten ja tarkentavien arviointien tarvetta. Jos tavoitteena on luoda tietojärjestelmä, joka ohjaa koulutuksen kehittämistä laaja-alaisesti, ehdotetun järjestelmän tuottama tieto jää väistämättä rajalliseksi niin kauan kuin opetuksen ja koulun arjen laadulliset ydinprosessit eivät ole datainfrastruktuurin tavoitettavissa. Konkreettisesti tämä tarkoittaa esimerkiksi sitä, että rekisterit voivat kuvata opettajien kelpoisuuksia, täydennyskoulutuksia, resurssien kohdentumista tai oppilasmääriä, mutta ne eivät kerro, miten opetus todellisuudessa toteutuu, millaista vuorovaikutusta luokkahuoneissa syntyy tai kuinka koulun toimintakulttuuri tukee oppimista. Ilman laadullisin menetelmin tuotettua tietoa järjestelmä voi näyttää kehittämistarpeita vain karkealla tasolla ja jopa ohjata toimenpiteitä harhaan.
Kuten raportissa todetaan, interventioiden vaikutukset jäävät vähäisiksi, jos ne toteutetaan heikkolaatuisesti riippumatta siitä, kuinka huolellisesti ne on suunniteltu. Jos interventio ei ole riittävän vaikuttava, panos ja tuotosdatan yhdistäminen tarjoaa parhaimmillaankin rajallisen ja pahimmillaan harhaanjohtavan perustan koulutuksen kehittämistä koskeville johtopäätöksille. Tällöin riski virhetulkintoihin kasvaa, koska analyysi ei tavoita niitä tekijöitä, jotka todella vaikuttavat interventioiden toimivuuteen ja laatuun. Esimerkiksi puutteellinen tieto luokkahuoneen arjen käytännöistä voi heikentää arviointien tuottamaa hyötyä tai johtaa virheellisiin päätelmiin siitä, mikä koulutuksessa toimii. Tämä voi jopa synnyttää vaikutelman, ettei täydennyskoulutuksella ole merkitystä, vaikka todellinen ongelma olisi sen vaihtelevassa toteutuksessa. On myös huomattava, että kattavan infrastruktuurin rakentaminen edellä kuvatulle välitasolle on erittäin haastavaa, ellei jopa mahdotonta, sillä suuri osa opetuksen laadusta ja vuorovaikutuksesta on luonteeltaan ei-määrällistä.
Yhtenä esimerkkinä interventiotutkimuksen haasteista voidaan pitää raportille nostettua kuvausta kaksivuotisen esiopetuksen kokeilusta. Kokeiluasetelma interventioineen oli haastava, vaikka itse arviointitutkimus oli huolellisesti toteutettu. Esiopetuskokeilussa kerättiin laaja lapsikohtainen arviointiaineisto, jossa mitattiin lasten kielellisiä, matemaattisia ja sosioemotionaalisia valmiuksia. Tulosten mukaan kaksivuotinen esiopetus ei kuitenkaan tuottanut parempia oppimistuloksia verrattuna nykyiseen varhaiskasvatuksen ja yksivuotisen esiopetuksen kokonaisuuteen, lukuun ottamatta tilanteita, joissa vaihtoehtona oli kotihoito (Sarvimäki ym. 2025). Kokeilun tulos ei ollut yllättävä, sillä kokeilun pääinterventioksi tarkoitettu kaksivuotisen esiopetuksen kokeiluopetussuunnitelma poikkesi vain vähän nykyisistä varhaiskasvatuksen ja esiopetuksen opetussuunnitelmista. Suomessa varhaiskasvatus ja esiopetus perustuvat kokonaisvaltaiseen käsitykseen lapsen kehityksestä eivätkä painotu akateemisten taitojen varhaiseen vahvistamiseen tai mittaamiseen, joita kokeilun tutkimuksessa päädyttiin kuitenkin korostamaan. Kokeilu siis kuvaa hyvin konkreettisesti panos–tuotos ajattelun rajoituksia: vaikka panoksia lisättiin, mitatut tuotokset kohdistuivat taitoihin, jotka eivät olleet intervention keskeinen kohde. Vaikuttavuuden arviointia vaikeutti myös se, että varhaiskasvatuksen ja esiopetuksen vaikutusmekanismit ovat monisyisiä ja riippuvat lukuisista taustatekijöistä (Karila 2016; Vlasov ym. 2018). Näitä vaikutusmekanismeja ei voida tarkastella yksinomaan rekistereistä saatavilla tiedoilla.
Kokeilulla ja sitä arvioineella tutkimuksella oli lisäksi odottamattomia vaikutuksia varhaiskasvatuspalveluiden järjestämiseen. Kokeilu muokkasi lasten arkea ja esiopetuksen toteutusta kunnissa muun muassa siten, että kelpoista henkilöstöä siirrettiin pienempien lasten ryhmistä esiopetusryhmiin, mikä johti muutoksiin oppimisympäristöissä (Sarvimäki ym. 2025). Lisäksi on tärkeää tiedostaa, että esiopetuksen henkilöstö keräsi laajan tutkimusaineiston oman opetustyönsä ohella. Arvioitava todellisuus ei siten pysynyt muuttumattomana, vaan tutkimusasetelma itsessään vaikutti siihen (Siippainen, Paananen & Pitkänen 2024).
Uuden datainfrastruktuurin kustannuksia suhteessa sen tuottamaan lisäarvoon tulee selvittää
Lausuttavana olevassa raportissa esitetään useita olemassa olevia tiedonkeruun muotoja, joiden laajentaminen tarjoaisi perustan datainfrastruktuurin kehittämiselle. Haluamme kuitenkin huomauttaa, että laajamittainen, kaikki koulut, useat vuosiluokat ja useita oppiaineita koskeva kansallinen koejärjestelmä olisi huomattavasti nykyistä otoksiin perustuvaa järjestelmää kalliimpi ja myös raskaampi toteuttaa. Sama pätee järjestelmiin, joilla kerättäisiin systemaattista tietoa oppilaan muista osaamisen alueista, kuten hyvinvoinnista tai yhteistyötaidoista. Myös koulutuksen panostietojen laajentaminen ja systematisointi kasvattaa kustannuksia nykytilanteeseen verrattuna.
Lisäkustannukset voisivat olla perusteltuja, jos niiden tuottama hyöty eli koulutuksen kehittämisen kannalta käyttökelpoisempi tieto, ylittää menot. Tämä ei kuitenkaan ole itsestään selvää. Siksi on tarpeen arvioida huolellisesti, kuinka kallis uusi datainfrastruktuuri olisi suhteessa nykyjärjestelmään ja millaista lisäarvoa se todellisuudessa tuottaisi. Samalla tulee selvittää, voidaanko nykyistä kansallista otospohjaista arviointijärjestelmää kehittää siten, että se vastaisi entistä paremmin koulutuksen kehittämisen keskeisiin kysymyksiin. Vasta tällaisen vertailun jälkeen voidaan arvioida, tuottaisiko täysin uusi, laaja datainfrastruktuuri riittävästi lisähyötyä vai voisiko uudistettu nykyjärjestelmä hoitaa arviointitehtävän riittävän hyvin mutta selvästi kustannustehokkaammin.
Nykyinen kansallinen oppimistulosten arviointijärjestelmä on kevyt ja kustannustehokas. Sen etuna on sekä rahallinen että ajallinen taloudellisuus, sillä se ei kuormita kohtuuttomasti hallintoa, opettajia tai oppilaita. Suomessa koululaisten oppimistulokset ja hyvinvointi sijoittuvat edelleen OECD-maiden keskitason yläpuolelle, mikä osoittaa, että hyvään tuloksellisuuteen on mahdollista päästä ilman oppilaiden hyvinvointiin kohdistuvaa liiallista painetta. Useissa korkean oppimistuloksen verrokkimaissa, kuten Virossa, Irlannissa ja Singaporessa, koululaisten hyvinvointi ja osallisuus sijoittuvat OECD-keskiarvon alapuolelle, mikä edelleen puoltaa tasapainoisen arviointijärjestelmän merkitystä. Koko maan kattavien kansallisten digitaalisten koejärjestelmien rakentaminen ja ylläpito edellyttävät huomattavasti nykyistä suurempia taloudellisia ja toiminnallisia resursseja.
Oppimistulosarviointien laajentaminen kansallisiksi kokeiksi ei ole riskitöntä
Keskeinen osa koulutuksen tuloksellisuutta ovat oppimistulokset: ne taidot, joita oppilaat koulussa omaksuvat ja joita opetussuunnitelma ohjaa opettamaan. Osa näistä taidoista on oppiainesidonnaisia, mutta osa on yleisiä taitoja, kuten opiskelutaidot, sosioemotionaaliset taidot, itsesäätely ja metakognitiiviset taidot. Raportissa keskeiseksi keinoksi oppimistulosten mittaamisessa esitetään kansalliset kokeet.
Raportissa todetaan, ettei nykyisten aineistojen avulla ole mahdollista arvioida perusopetuslain 2 §:ssä määriteltyä tavoitetta antaa oppilaille elämässä tarpeellisia tietoja ja taitoja. Tämä havainto nostaa esiin laajemman kysymyksen siitä, mitä taitoja ylipäätään on mielekästä ja tarkoituksenmukaista mitata kansallisesti. Vaikka nykyjärjestelmän kattavuutta on perusteltua tarkastella kriittisesti, ei ole yksinkertaista määritellä, mitkä oppiaineet ja osa-alueet tulisi sisällyttää kansalliseen koejärjestelmään. Pohjoismaissa käytännöt painottuvat äidinkieleen, matematiikkaan, luonnontieteisiin ja englantiin, ja vastaava rajaus olisi todennäköinen myös Suomessa. On kuitenkin aiheellista kysyä, kattaako tämä riittävän laajan osuuden opetussuunnitelman tavoitteista ja erityisesti niistä taidoista, jotka liittyvät oppilaiden valmiuksiin toimia muuttuvassa yhteiskunnassa. Jo osan oppiaineiden tarkempi ja säännöllisempi seuranta, esimerkiksi luonnontieteissä, vieraissa kielissä tai taide‑ ja taitoaineissa, vahvistaisi kansallisen oppimistulosarvioinnin tietopohjaa. Se auttaisi muodostamaan selkeämmän kokonaiskuvan siitä, kuinka hyvin koulutusjärjestelmä tukee niitä taitoja ja valmiuksia, joita opetussuunnitelma ja perusopetuslaki edellyttävät.
Oppiainekohtaisen osaamisen arviointi on usein helpompaa kuin yleisten taitojen mittaaminen. Tämä lisää riskiä, että kansalliset kokeet painottuvat siihen, mitä on helpointa mitata, eikä välttämättä siihen, mikä on oppilaiden tulevaisuuden taitojen kannalta keskeisintä. Mittaamisen klassinen ongelma on, että mitattavista asioista voi tulla toiminnan tärkeimmät tavoitteet. Näin kokeiden ohjausvaikutus voi muodostua ei-toivotun voimakkaaksi.
Ketonen ja Atjonen (2025) ovat tarkastelleet kansallisten kokeiden mahdollisia kielteisiä sivuvaikutuksia. Systemaattinen tutkimuskatsaus osoittaa, että yksittäisten koulujen tai kuntien paremmuusjärjestykset ovat ongelmallisia. Koulukohtaisiin oppimistuloksiin vaikuttavat monet tekijät kuten oppilaiden taustat, hyvinvointi, motivaatio, vertaissuhteet ja vaihtuvuus, opetuksen ja pedagogiikan laatu, koulun toimintakulttuuri ja johtaminen, oppimisen tuki sekä resurssit, ryhmäkoot ja henkilöstön pysyvyys ja kelpoisuus. Siksi yksittäinen testitulos ei kuvaa suoraan koulun tarjoaman opetuksen laatua.
Kielteisten sivuvaikutusten riski kasvaa erityisesti silloin, kun kokeiden tuloksia käytetään kuntien tai koulujen tulos- tai tilivelvollisuuden mittaamiseen. Goodhartin (2015) lain mukaisesti, kun mittarista tulee tavoite, se lakkaa olemasta hyvä mittari. Lukuisat kansainväliset esimerkit osoittavat, että kansallisista kokeista selviytymisestä voi tulla opetuksen tosiasiallinen tavoite (”teaching to the test”) tai se voi johtaa jopa vilppiin (esim. Coldwell & Willis 2017; Krause 2022; Nehring & Szczesiul 2015; Koretz 2005). Tämä voi joko kaventaa opetusta tai heikentää aineiston luotettavuutta. Siksi on olennaista määritellä tarkasti, mihin tarkoituksiin kansallisia kokeita käytetään, jotta niistä muodostuu osa luotettavaa, ei vääristävää datainfrastruktuuria.
Lausuttavana olevassa raportissa viitataan myös oppilaiden hyvinvoinnin ja muiden vastaavien tulemien mittaamiseen. On kuitenkin aiheellista pohtia, missä laajuudessa oppilaista tulisi kerätä tällaista tietoa, ja onko tarkoituksenmukaista koota yksilöllisiä hyvinvointi- tai terveystietoja yhteen rekisteriin. Vaikka tällainen tieto voi olla tutkimuksen kannalta hyödyllistä, siihen liittyy sekä tietosuojaan että henkilötietolainsäädäntöön liittyviä kysymyksiä siitä, mitä yksilöivää tietoa on ylipäänsä mahdollista tai edes järkevää rekisteröidä.
Laajat ja monipuoliset oppimistulosten arvioinnit edellyttävät selkeää resurssien ja toteutusvastuiden määrittelyä. Mikäli arviointeihin sisällytetään laajasti muutakin kuin monivalintatehtäviä ja lyhyitä avovastauksia, tarvitaan joko opettajien systemaattista koulutusta oppilaiden avovastausten pisteyttämiseen tai erikseen palkattua ja koulutettua henkilöstöä vastausten arviointiin. Käytännössä tämä tarkoittaa huomattavaa panostusta pisteytysohjeiden laadintaan, yhdenmukaiseen arviointiin sekä laadunvarmistukseen, sillä arvioijien välisen johdonmukaisuuden varmistaminen on vaativa ja resursseja edellyttävä tehtävä.
Myös nykyiset seuranta-arvioinnit ovat tehneet näkyväksi oppimisen kehityksen ja taustatekijöiden vaikutuksen - niihin kannattaa jatkossakin panostaa
Karvi on toteuttanut ja toteuttamassa useita pitkittäisarviointeja (Harjunen ym. 2019; Metsämuuronen 2017; Ukkola & Metsämuuronen 2019; 2023, Ukkola ym. 2020; Ukkola ym. 2025; Åkerlund ym. 2022), joissa yhden ikäluokan oppimistuloksia seurataan kouluvuosien aikana. Näin päästään aiempaa paremmin kiinni oppimisessa ja osaamisessa tapahtuviin muutoksiin. Seuranta-aineistot mahdollistavat osaamisen muutoksen vertailun oppilaiden, luokkien ja koulujen lähtötilanteiden mukaan.
Arviointimme ovat osoittaneet (Metsämuuronen 2023; Ukkola ym. 2020; Ukkola ym. 2025), että koulujen keskimääräisessä osaamistasossa voi olla jopa vuosina mitattavia osaamiseroja, jotka ovat olemassa jo ennen kuin oppilaat ovat käyneet päivääkään koulua. Suomessa lähikouluperiaate on vahva, joten asuinalueiden sosioekonomiset, kielelliset ja hyvinvointiin liittyvät erot vaikuttavat siihen, millaisista taustoista oppilaat kouluun tulevat tai mikä heidän taitotasonsa on. Siksi ei voida päätellä, että korkeimmat oppimistulokset saavuttavat koulut olisivat onnistuneet paremmin opetuksessaan tai että niissä olisi paremmat opettajat tai paremmat opetusmenetelmät tai -materiaalit kuin muissa kouluissa. Koulujen keskimääräiset tulokset kuvastavat ennen kaikkea hyvinvointiresurssien ja kasvuedellytysten epätasaista jakautumista, eivät koulujen opetuksen laadukkuutta.
Tiedontuotannon kehittämisen tulee nojata jo käynnissä olevaan valtakunnalliseen valmisteluun
Karvi korostaa, että tiedontuotannon kehittämisessä tulee hyödyntää käynnissä olevaa valtakunnallista valmistelutyötä, jotta ratkaisut rakentuvat yhteen toimiviksi ja tukevat koulutusjärjestelmää kokonaisuutena.Valtioneuvosto on antanut Opetus- ja kulttuuriministeriön koordinoimalle Tutkimuksen, ennakoinnin ja arvioinnin yhteistyöryhmälle tehtäväksi valmistella esitys sivistyshallinnon tietotuotannon tiekartaksi. Valmistelua tehdään tiiviissä yhteistyössä Sivistyshallinnon strategisen tietohallinnon ja digitalisaation yhteistyöryhmän sekä Tilastokeskuksen kanssa. Toimeksiannossa korostetaan, että sivistys- ja muun valtionhallinnon piirissä tapahtuva tiedontuotanto ei palvele ainoastaan, eikä edes ensisijaisesti, valtionhallinnon tietotarpeita, vaan sektorin toiminnan päätöksenteon, toimeenpanon, kehittämisen, seurannan ja arvioinnin tietotarpeita paikallistason organisaatioista ja yksittäisistä opettajista, tutkijoista, taiteilijoista ja muista sivistyssektorin ammattilaisista valtiolliseen ja ylikansalliseen päätöksentekoon ja yhteistyöhön.
Karvi pitää ensisijaisena jo olemassa olevien kansallisten tietovarantojen puutteiden ja niiden tiedoissa esiintyvien virheiden korjaamista, sillä ne haastavat tiedon hyödyntämistä myös kansallisessa arviointitoiminnassa.
Karvin näkemyksen mukaan koulutuksen ja varhaiskasvatuksen tiedontuotantoa tulee vahvistaa laajentamalla ja systematisoimalla arviointi‑ ja seurantatiedon tuottamista kaikilla koulutusasteilla. Keskeistä on politiikkatoimien tuloksellisuuden, uudistusten vaikutusten sekä koulutuksen laadun ja laadunhallintajärjestelmien kehityksen arviointi ja seuranta.
Erityisesti perusopetuksen oppimistuloksista tarvitaan pitkäjänteistä, kattavaa ja vertailukelpoista arviointitietoa. Tähän sisältyy tila‑ ja trenditieto oppimistuloksista ja oppimisen tasa-arvosta ja yhdenvertaisuudesta, taustatekijöiden vaikutusten tarkastelu sekä pitkittäistieto oppiainekohtaisesta osaamisen kehittymisestä. Lisäksi tarvitaan koulutusasteet ylittävää tietoa, joka kuvaa koulutusjärjestelmän toimintaa kokonaisuutena.
Tiedontuotantoa on laajennettava myös koulutus- ja kasvatusalan resilienssin vahvistamiseen, kuntien ja alueiden elinvoiman kehityksen seurantaan sekä koulutuspalvelujen, kouluverkon muutosten ja alueellisen hyvinvoinnin tarkasteluun. Elinvoiman pehmeämmistä tai laadullisista ulottuvuuksista tarvitaan kevyesti indikoivia mittareita, joita voidaan tuottaa eettisesti ja tietosuoja huomioiden.
Taloustiedon osalta on tarpeen tuottaa järjestelmällistä seurantaa opetuksen ja koulutuksen rahoituksesta kunnittain, alueittain ja opetuksen järjestäjittäin. Samoin tulee vahvistaa tiedontuotantoa opetus- ja kasvatuksen henkilöstön osaamisen kehittämisestä, täydennyskoulutuksen tarjonnasta sekä henkilöstön osallistumisesta koulutuksiin.
Korkeakouluista tarvitaan opiskelijoiden ja valmistuneiden arvosanatietoja suoritetuista kokonaisuuksista ja opinnäytetöistä, ja vapaan sivistystyön tilastotiedon merkittäviä puutteita tulee korjata. Lisäksi kansallisia tietovarantoja, kuten Koskea ja Vardaa, on kehitettävä tukemaan paremmin kattavaa ja ajantasaista koulutustiedon tuotantoa.
Karvin täsmennykset ja muut huomiot tutkimusraportin esityksistä
Tämänhetkinen kansallinen arviointi perustuu monimenetelmäisiin ja laaja-alaisiin aineistoihin
Karvi pitää harmillisena, että raportissa esitetään sen käyttämät menetelmät ja aineistot kovin yksipuolisesti. Karvin arviointiaineistot eivät koostu pääasiassa valtakunnallisista otantatutkimuksista, kyselyistä ja dokumenttianalyyseista, vaan arviointikäytäntömme ovat huomattavasti tätä monipuolisempia. Esimerkiksi ammatillisen koulutuksen teema-arvioinneissa ja laadunhallinnan arvioinneissa ei käytetä otantoja, vaan kaikki koulutuksen järjestäjät sisältyvät arviointiin.Seuraamme systemaattisesti arviointitiedon hyödyntämistä ja tiedämme, että kansallisia arviointeja käytetään laajasti muun muassa opetussuunnitelmatyössä, koulutuspoliittisessa valmistelussa sekä paikallisen kehittämisen tukena.
Karvin arviointiaineistot eivät myöskään perustu pääosin kyselyihin ja dokumenttianalyyseihin, vaan käytämme arvioinneissamme laajaa ja monilähteistä aineistopohjaa. Hyödynnämme sekä rekisteri- ja tilastoaineistoja, kuten varhaiskasvatuksen tietovarantoa Vardaa, opetuksen ja koulutuksen valtakunnallista tietovarantoa Koskea ja opetushallinnon tilastopalvelua Vipusta sekä Tilastokeskuksen, Eurostatin ja muiden kansallisten tiedonkeruiden aineistoja. Näiden lisäksi hyödynnämme suoraan koulutuksen järjestäjiltä, opetushenkilöstöltä ja opiskelijoilta kerättyä tietoa. Kyselyiden lisäksi arviointiaineistot sisältävät esimerkiksi haastatteluja ja opetuksen sekä työelämän toimijoiden näkemyksiä. Tuottamamme arviointiaineistot ovat myös ulkopuolisten tutkijoiden käytettävissä, mikäli aineistoluovutuskriteerit täyttyvät. Aineistojamme käytetään laajasti tutkimuksessa, kuten yliopistojen väitöskirjatyössä ja muissa akateemisissa hankkeissa.
Arviointien lähtökohtana on monimenetelmäisyys ja systeeminen ymmärrys koulutuksen ja kasvatuksen ilmiöistä sekä opetussuunnitelmien laajoista tavoitteista. Esimerkiksi oppimistulosarviointien lähtökohtana tulee johdonmukaisesti olla Opetussuunnitelman perusteet, sillä juuri siellä määritellään se laaja-alainen oppiminen ja osaaminen, joka kattaa kaikki oppiaineet, oppimäärät sekä osaaminen, ja jonka luotettava arviointi edellyttää väistämättä monipuolisia ja tarkoituksenmukaisesti valittuja menetelmiä. Aineistoja analysoidaan tilastollisin ja laadullisin menetelmin ja yhdistellään, kun se on arviointikysymysten kannalta tarpeen. Tavoitteena on muodostaa luotettava ja monipuolinen kokonaiskuva arvioitavasta ilmiöstä sekä tuottaa kehittämisehdotuksia, jotka tukevat koulutuksen vaikuttavuutta ja laatua.
Nykyinen järjestelmä tukee koulujen ja opettajien työtä huomattavasti laajemmin kuin raportissa esitetään
Nykyinen oppimistulosten arviointijärjestelmä tukee koulujen ja opettajien työtä monipuolisella koulupalautteella. Tutkimusraportissa Karvin kouluille toimittama palaute kuvataan varsin suppeasti, eikä esitetty kuvaus vastaa nykyisiä palautekäytäntöjä. Karvi on jo lähes kymmenen vuoden ajan toimittanut kouluille laajempaa ja yksityiskohtaisempaa palautetta, joka sisältää keskiarvojen lisäksi analyysiä eri oppilasryhmien osaamisen jakaumista, koulujen erityispiirteiden huomioimista sekä tietoa opetuksen ja pedagogisten ratkaisujen kehittämisen tueksi. Myös opettajat saavat arvioinnin jälkeen oman opetusryhmänsä oppilaskohtaiset tulokset. Palautetta on kehitetty systemaattisesti käyttäjäpalautteen perusteella, ja se koetaan laajasti hyödylliseksi: rehtoreista 88 prosenttia ja opettajista 70 prosenttia pitää koulupalautteita tarpeellisina, ja valtaosa rehtoreista hyödyntää niitä työssään. On kuitenkin syytä todeta, että nykyiset otospohjaiset arvioinnit eivät tavoita kaikkia kouluja, mikä rajoittaa tulosten suoraa hyödynnettävyyttä paikallisella tasolla. Karvi on pyrkinyt siksi kehittämään arviointien laajempaa saatavuutta ja käytettävyyttä siten, että yhä useammat koulut ja kunnat voivat hyödyntää arvioinneista saatavaa tietoa oman toimintansa kehittämiseen ilman, että arviointijärjestelmän riippumattomuus tai arviointikuormitus kasvaa kohtuuttomasti.
Uusi käyttäjälähtöinen digitaalinen arviointijärjestelmä osana kansallisen arviointitoiminnan rakenteita
Karvissa on jo pitkään käytetty vakiintuneita ja luotettavia menetelmiä erilaisten taitojen ja oppimistulosten arviointiin sekä ankkuritehtäviä ajassa tapahtuvien muutosten seurantaan. Arvioinneissa kerätty tieto oppilaiden osaamisesta, taustatekijöistä ja oppimisympäristöistä on voitu yhdistää kansallisiin rekisteriaineistoihin lainsäädännön mukaisesti yksilö- ja koulutasolla.
Karvi on yhdessä CSC – Tietotekniikan keskus Oy:n kanssa kehittänyt digitaalisen arviointijärjestelmän Jodan, joka on juuri otettu käyttöön kansallisissa oppimistulosarvioinneissa. Järjestelmän kehittämistyössä on varmistettu arviointitiedon korkea tietoturvallisuus, luotettava käsittely ja tietojen pitkäjänteinen jatkohyödyntäminen.
Jodan kehittämisen lähtökohtana on ollut käyttäjälähtöisyys ja arviointitoiminnan sujuvuuden vahvistaminen. Järjestelmän suunnittelussa on huomioitu oppilaiden, opettajien ja rehtoreiden kokemukset ja tarpeet, ja se on rakennettu tukemaan yhdenvertaista arviointia sekä tietojen yhdisteltävyyttä ja vertailukelpoisuutta pitkällä aikavälillä. Joda tarjoaakin valmiin, tietoturvallisen ja skaalautuvan alustan.
Riippumattomuus on edellytys luotettavalle ja laadukkaalle arviointitiedolle
Karvi ei pidä tarpeellisena raportissa esitettyä parlamentaarisen komiteavalmistelun käynnistämistä koulutuksen datainfrastruktuurin kehittämiseksi. Karvin yhteydessä toimii koulutuksen arviointineuvosto, joka on valtioneuvoston nimeämä asiantuntijaelin, ja jonka jäsenet edustavat eri koulutussektoreita, opettajankoulutusta, tutkimusta, työelämää sekä opiskelijoita. Arviointineuvoston kokoonpanosta, tehtävistä ja päätösvaltaisuudesta säädetään asetuksessa Kansallisesta koulutuksen arviointikeskuksesta (1317/2013). Arviointineuvoston keskeisinä tehtävinä on seurata ja kehittää arviointikeskuksen toimintaa sekä laatia esitys nelivuotisesta koulutuksen arviointisuunnitelmasta opetus- ja kulttuuriministeriölle. Suunnitelma laaditaan laajassa vuoropuhelussa sidosryhmien kanssa, ja sen valmistelussa huomioidaan koulutuspoliittiset tavoitteet, tutkimus- ja arviointitieto sekä asiantuntijoiden, opetuksen ja koulutuksen järjestäjien ja muiden toimijoiden näkemykset.
Valtioneuvoston asetuksen mukaan Kansallisen koulutuksen arviointikeskuksen toiminnassa noudatetaan riippumattomuuden periaatetta. Riippumattomuus on keskeinen edellytys arviointitoiminnan legitimiteetin, uskottavuuden ja tietopohjan laadun kannalta.
johtaja Hannele Seppälä
yksikön johtaja Salla Venäläinen
Lähteet
Atjonen, P. (2007). Hyvä, paha arviointi. Tammi.
Atjonen, P. (2015) Kehittävä arviointi kasvatusalalla. Kirjokansi.
Coldwell, M., & Willis, B. (2017). Tests as boundary signifiers: Level 6 tests and the primary secondary divide. The Curriculum Journal, 28(4), 578–597. https://doi.org/10.1080/09585176.2017.1330220
Goodhart, C. (2013). Goodhart’s Law. Le Libellio d’AEGIS 9 (4), 29–33. file:///C:/Users/03121932/OneDrive%20-%20Sivistyshallinto/Ty%C3%B6p%C3%B6yt%C3%A4/Goodharts-Law_2015.pdf (Viitattu 11.3.2026)
Harjunen, E., Marjanen, J. & Karlsson, J. (2019). Äidinkielen pieni pitkittäisarviointi 2014–2017: Perusopetuksen päätöstä lukion päättöön. Kansallinen koulutuksen arviointikeskus. Julkaisut 4:2019. https://www.karvi.fi/sites/default/files/sites/default/files/documents/KARVI_0419.pdf
Kansallinen koulutuksen arviointikeskus (2025). Perusopetuksen oppimistulosten arvioinnit – MITÄ, MIKSI ja MITEN. Helsinki: Karvi. Esite-Karvin-oppimistulosarvioinneista_0.pdf
Karila, K. (2016). Vaikuttava varhaiskasvatus. Tilannekatsaus toukokuu 2016. Opetushallituksen raportti ja selvitys 2016:6.
Kauko, J. & Pajunen, M.K.T. (2021). The Thickening Modern: Developing a Research Agenda beyond Intensifying Rationalism. Teoksessa P. Dahler-Larsen (toim.) A Research Agenda for Evaluation: Inspirational Themes. Edward Elgar, 21–41.
Ketonen, L. & Atjonen, P. (2025). Mitä empiiristen tutkimusten perusteella tiedetään kansallisista kokeista? Kasvatus 56 (2), 238–248. https://doi.org/10.33348/kvt.157366
Koretz, D. (2005). Alignment, high stakes, and the inflation of test scores (CSE Report 655). National Center for Research on Evaluation, Standards, and Student Testing, University of California, Los Angeles. PDF
Korkeakoski, E. & Silvennoinen, H. (toim.) (2008). Avaimia koulutuksen arvioinnin kehittämiseen. Koulutuksen arviointineuvoston julkaisuja 31. https://jyx.jyu.fi/bitstreams/5292571e-f2e2-49c3-8c0b-abacf8897e5f/download (Viitattu 11.3.2026)
Krause, U., Beneker, T., & van Tartwijk, J. (2022). Higher order thinking by setting and debriefing tasks in Dutch geography lessons. European Journal of Investigation in Health, Psychology and Education, 12(1), 11–27. https://doi.org/10.3390/ejihpe12010002
Metsämuuronen, J. (2017). Oppia ikä kaikki – Matemaattinen osaaminen toisen asteen koulutuksen lopussa 2015. Kansallinen koulutuksen arviointikeskus. Julkaisut 1:2017. https://www.karvi.fi/sites/default/files/sites/default/files/documents/KARVI_0117.pdf
Metsämuuronen, J. (2023). Matematiikkaa Covid-19-pandemian varjossa III. Syventäviä analyyseja matematiikan 9. luokan arvioinnista keväällä 2021. Kansallinen koulutuksen arviointikeskus. Julkaisut 31:2023. https://www.karvi.fi/sites/default/files/sites/default/files/documents/KARVI_3123.pdf
Nehring, J. H., & Szczesiul, S. (2015). Redefining high performance in Northern Ireland: Deeper learning and twenty-first century skills meet high stakes accountability. Journal of Educational Change, 16, 327–348. https://doi.org/10.1007/s10833-015-9250-8
Sarvimäki, M., Holvio, A., Kuusiholma-Linnamäki, J., Sulkanen, M., Alasuutari, M., Harju, K., Harjunen, O., Izadi, R., Kalland, M., Laakso, M.-J., Lerkkanen, M.-K., Muhonen, H., Ruutiainen, V., Räsänen, P., Salo, A.-E., Salo, S., Saranko, L., Suorsa, T., Upadyaya, K. & Villanen, H. (2026) Kaksivuotisen esiopetuksen kokeilu: Loppuraportti. Opetus- ja kulttuuriministeriön julkaisuja 2026:2.
Siippainen, A., Paananen, M. & Pitkänen, H. (2024). Arvioinnin paradoksit: Epilogi. Teoksessa A. Siippainen & M. Paananen (toim.) Mitattu Lapsuus. Varhaiskasvatuksen arviointi Suomessa. Gaudeamus, 233–276.
Ukkola, A. & Metsämuuronen, J. (2019). Alkumittaus – matematiikan ja äidinkielen ja kirjallisuuden osaaminen ensimmäisen luokan alussa. Kansallinen koulutuksen arviointikeskus. Julkaisut 17:2019. https://www.karvi.fi/sites/default/files/sites/default/files/documents/KARVI_1719.pdf
Ukkola, A. & Metsämuuronen, J. (2023). Matematiikan ja äidinkielen taidot alkuopetuksen aikana – Perusopetuksen oppimistulosten pitkittäisarviointi 2018–2020. Kansallinen koulutuksen arviointikeskus. Julkaisut 1:2023. https://www.karvi.fi/sites/default/files/sites/default/files/documents/KARVI_0123.pdf
Ukkola, A., Metsämuuronen, J. & Paananen, M. (2020). Alkumittauksen syventäviä kysymyksiä. Kansallinen koulutuksen arviointikeskus. Julkaisut 10:2020. https://www.karvi.fi/sites/default/files/sites/default/files/documents/KARVI_Alkumittaus.pdf
Ukkola, A., Suomilammi, M., Silverström, C., Metsämuuronen, J. & Marjanen, J. (2025). Matematiikan ja äidinkielen taidot kuudennen luokan lopussa – Perusopetuksen oppimistulosten pitkittäisarviointi 2018–2024. Kansallinen koulutuksen arviointikeskus. Julkaisut 1:2025. https://www.karvi.fi/sites/default/files/sites/default/files/documents/KARVI_0125.pdf
Vlasov, J., Salminen, J., Repo, L., Karila, K., Kinnunen, S., Mattila, V., Nukarinen, T., Parrila, S. & Sulonen, H. (2018). Varhaiskasvatuksen laadun arvioinnin perusteet ja suositukset. Kansallinen koulutuksen arviointikeskus. Julkaisut 24:2018. https://www.karvi.fi/sites/default/files/sites/default/files/documents/KARVI_Perusteet-ja-suositukset_web.pdf
Åkerlund, C., Marjanen, J. & Peltola, E. (2022). A-finska Kunskapsutveckling från åk 6 till åk 9. Nationella centret för utbildningsutvärdering. Publikationer 24:2022. https://www.karvi.fi/sites/default/files/sites/default/files/documents/KARVI_2422.pdf