Nationale test til høring

I sidste uge kom de nationale test i folkeskolen igen i fokus. Fire forskere fra DPU sad med i det panel, der i en åben høring i Folketinget skulle gøre politikerne klogere på styrker og svagheder ved de nationale test. Dagen før viste en ny undersøgelse fra DPU, Aarhus Universitet, at lærere og skoleledere savner tilstrækkelig viden til at fortolke testresultaterne.

Hvilken betydning har de nationale test fået i skolen? Hvordan bruges de, og hvad måler de egentlig? Hvilke dilemmaer og udfordringer stiller testene os over for? Hvilke muligheder giver de? Hvordan kan de forbedres - hvis ikke de ligefrem bør skiftes ud med andre evalueringsformer?

Der var fyldt godt op i Landstingsalen d. 14. september 2016, da de nationale test blev sat under lup ved en åben høring i Folketingets Børne- og undervisningsudvalg - 10 år efter at Folketinget vedtog at indføre de obligatoriske, standardiserede test i Danmark.

Læs om DPU-forskernes pointer og perspektiver på de nationale test:

Test set fra børneperspektiv
Kristine Kousholt: De nationale test som ny praksis i den danske folkeskole
Test må ikke blive mål i sig selv
John B. Krejsler: Test som pædagogisk værktøj i undervisningen
Test måler det forkerte
Jeppe Bundsgaard: Validitet og reliabilitet - hvad måler vi og med hvilken sikkerhed?
Test bør tilpasses
Peter Allerup: Hvad bør vi måle, og hvordan kan vi måle anderledes?

Se TV-optagelse af hele høringen

Se programmet for høringen

Find viden om nationale test på DPU’s hjemmeside

Test set fra børneperspektiv

Ifølge Kristine Kousholt, lektor ved DPU, Aarhus Universitet, er de nationale test ikke blot en ny måle- og testpraksis, men også en ny social praksis. Hendes forskning har ikke fokus på test som måleinstrument, men på hvordan børnene oplever testene, hvordan de påvirker dem, og hvordan test er en del af det sociale mellem børn og lærere.

At forstå hvordan de nationale test anvendes i skolen kan nemlig ikke løsrives fra at forstå, hvordan de griber ind i børnenes relationer til hinanden og til lærerne. For nogle børn er det ikke blot deres færdigheder, men også deres sociale liv i klassen, der kommer på prøve, når det er testtid.

Kristine Kousholt illustrerede i sit oplæg nogle af de dilemmaer, som testene stiller os over for. Hun har fulgt børn og lærere op til og under testene og ser bl.a., hvordan børn leder efter ’evalueringstegn’ under testen.

”De mangler orienteringsmuligheder i testsituationen, og nogle børn bliver så optaget af at lede efter tegn på, hvordan det går dem, både i selve testen og i forhold til deres placering i det sociale i klassen, at det bliver det vigtigste. Børnene ved, at testen bringer spørgsmålet om deres faglige dygtighed og sociale tilhørsforhold i klassen i spil. Man kan spørge, om det ikke er et paradoks, at vi har indført en evalueringsform, hvor feedback til eleverne udsættes eller måske helt er fraværende – som andet end papir på, hvor de ligger i statistikken. Nogle børn giver desuden udtryk for, at testen kan afsløre noget om deres faglige dygtighed, som de ikke selv har direkte adgang til at vide noget om. Det kan indebære, at de får et udvendigt forhold til deres egen faglighed”, siger Kristine Kousholt.

Under testen er hver elev overladt til sig selv, og det er elevernes faglige niveau som enkeltpersoner, der skal måles. De nationale test indebærer en individualisering af børnene, og samtidig opstår der i klassen ofte et fællesskab omkring testen.

”Eleverne ved, at det er deres individuelle dygtighed, der skal afprøves, og for nogle børn gør testene det derfor endnu vigtigere at være sammen med andre. Men for de børn, hvor det at være sammen i forvejen er under pres, kan det forstærke det pres, testen lægger på dem. Børn, der deltager i klassen på kanten af fællesskabet, kan rammes hårdere af testenes individualisering”, siger hun.

Testene indebærer også dilemmaer i forhold til lærerne: De ønsker af flere grunde, at eleverne opnår gode testresultater og i det hele taget får en god oplevelse med testen.

”De bliver optaget af at forberede eleverne på testen – men samtidig vil de undgå, at deres undervisning bliver ’teaching to the test’, dvs. formes og tilrettelægges efter den forestående test”, siger hun.

Testene skal give os viden om elevernes faglige niveau, men det rejser et andet dilemma.

”Den viden, testene giver os om børnene, har fået en legitimitet, som lærernes hverdagsviden ikke på samme måde ser ud til at have. Det betyder, at lærerne kan låne af denne legitimitet, f.eks. til skole/hjem-samtaler, hvor de kan bruge testresultater til at understøtte deres egen hverdagsforståelse og -viden om børnene. Det sker, hvis lærerne kommer i tvivl om, hvorvidt de kan stole på deres egen hverdagsviden, og hvis forældrene mener, at lærernes hverdagsviden er nødt til at være underbygget med testresultater”, siger hun.

Kristine Kousholt opfordrer til, at vi undgår at forstå testresultater som neutrale resultater uden kontekst.

”Der er mange ting, der spiller ind på og med i testene, som vi må have for øje, når vi vurderer resultaterne. Når skoleledere fortæller mig, at de godt ved, at der foregår rigtig meget omkring testene, og at vi er nødt til at tænke konteksten med, men samtidig siger, at de bliver forført af tallene, af de rene tal – så er det netop en vigtig påmindelse om, at tallene aldrig er rene”, siger Kristine Kousholt.

Test må ikke blive mål i sig selv

John Benedicto Krejsler, professor MSO ved DPU, Aarhus Universitet, stillede ved høringen det retoriske spørgsmål, om test og pædagogik har noget med hinanden at gøre – og svarede selv:

”Ja, det kan de godt have. Hvis man er specifik i forhold til, hvordan man bruger test, kan de have stor anvendelsesværdi. Men de kan også være direkte skadelige, hvis man bruger test på områder, hvor de ikke hører hjemme og overvurderer, hvad de kan sige noget om”, siger John Benedicto Krejsler.

John B. Krejsler minder om, at måden vi forstår og bruger test på, beror på, hvordan vi mere grundlæggende besvarer spørgsmålet om, hvad der er skolens formål.

”Et af de store problemer med test er, at man let kommer til at blande mål og middel sammen og gør test til et mål i sig selv. Men test fungerer bedst som middel til at realisere mål – og skolen har mere end ét formål. Den skal give os kundskaber og færdigheder og bidrage til, at arbejdskraften i samfundet reproduceres. Men den skal også fremme medborgerskab, kreativitet, samarbejde og trivsel - alt det, som er svært at måle i test. For slet ikke at tale om, at skolen er en vigtig livsperiode for børnene, som er et formål i sig selv”, siger John B. Krejsler.

Ifølge John B. Krejsler er de fleste af os – uanset hvad vi i øvrigt mener om test – enige om, at test ikke må blive et mål i sig selv.

”Problemet er, at det bliver det ad alle mulige veje og vildveje let alligevel. Og så bliver test ligesom point og medaljer - noget børnene gør, så godt de kan for at gøre far og mor og lærerne glade eller for at konkurrere med kammeraterne. Men det er sjældent på den måde, man bliver rigtig dygtig på et bestemt kerneområde”, siger John B. Krejsler.

Under et ophold som gæsteprofessor ved University of California Los Angeles (UCLA) i 2015 foretog John B. Krejsler en række case-studier af skoler i Texas og Californien. De amerikanske erfaringer demonstrerer den sociale slagside ved test.

”På skoler med høj socioøkonomi, hvor forældrene er veluddannede osv., var test ikke det store problem. Men på skoler med lav socioøkonomi og store resurse- og læringsproblemer var lærere og skoleledere imidlertid under langt større pres til at fokusere undervisningen på, at eleverne klarede sig godt til test, da flere af deres elever var i risiko for at præstere dårlige testresultater med heraf følgende high-stakes-sanktioner for skolen. Det ensidige fokus på high-stakes test og dets skadelige bivirkninger i form af instrumentaliserende ’teaching to the test’-effekter fik senere the Commissioner of Education ved Texas Education Agency (Texas’ parallel til undervisningsministeren) til at udtale, at ”den måde vi bruger test på er blevet en perverteret version af den oprindelige intention”. Konkret har det betydet, at test i Texas nu i højere grad er ved at blive en blandt andre måder at vurdere, om skoler og elever er succesfulde eller ej”, siger John B.Krejsler.

Politikere, skoleledere, lærere og forældre har hver deres forskellige legitime interesse i at opnå viden om elevernes faglige niveau, mener John B. Krejsler.

”Politikerne har brug for overblik over, hvor skolerne rundt i landet står for at kunne prioritere; skolelederen vil gerne vide, hvad hendes skole kan lære af naboskolen, læreren vil gerne vide, hvordan hans klasse står over for andre klasser, hvordan man eventuelt kan lære noget af dem, og hvordan eleverne i hans klasse står for bedre at at kunne undervisningsdifferentiere m.m. Den vigtige problematik om, hvordan test kan understøtte elevernes læringsprogression, er vi imidlertid ikke nået så langt med endnu”, siger John Benedicto Krejsler.

Test måler det forkerte

Ifølge Jeppe Bundsgaard, professor MSO ved DPU, Aarhus Universitet er folkeskolelærerne ikke blevet informeret tilstrækkeligt om de nationale tests svagheder – herunder at de ikke kan anvendes til at sige noget præcist om hver enkelt elev.

”Usikkerhederne ved testresultaterne gør, at man som lærer ikke får nogen brugbar viden om, hvor eleverne i klassen ligger. Lærerne får opgivet helt præcise tal for elevernes dygtighed, men i realiteten er usikkerheden så stor, at den enkelte elev ligger i et interval på måske 30 point på en skala fra 1-100. Det er der bare ikke nogen, der har fortalt lærerne. Derfor tror de, at de får viden om den enkelte elev,” siger Jeppe Bundsgaard.

Han henviser til en ny undersøgelse af lærernes og skolelederes brug af, holdninger til og viden om de nationale test, som han står bag sammen med Morten Rasmus Puck fra UC Lillebælt. Den viser blandt andet, at lærerne ikke ved, hvordan de skal forstå testresultaterne, og at mange af de elever, der får de laveste testresultater, bliver kede af det. Desuden viser den, at mange lærere er begyndt at undervise i det, elevernes bliver testet i.

”Mange lærere træner eleverne i de ting, som testene måler. Jeg mener ikke, at det er den vej, vi bør gå. Især i dansk, som er det fag, jeg selv har været med til at udforme de fælles mål for, bør simple færdigheder som at dele sammenstillede ord op eller at kunne betydningen af talemåder ikke tage tid fra mere selvstændige, anvendelsesorienterede og komplekse kompetencer, som det er meget vigtigere, at eleverne lærer,” siger han.

Læs rapporten 'Nationale test: Danske lærere og skolelederes brug, holdninger og viden' (pdf, 2016)

Jeppe Bundsgaard advarer desuden kraftigt imod at bruge testresultaterne til at vurdere, om folkeskolereformen er en succes. Hvis man ønsker en mere progressiv undervisning og måler resultatet ved hjælp af nogle test, der fokuserer på nogle få, simple dele af de faglige mål, så måler man det forkerte.

”Testene måler nogle kompetencer, som man ikke ønskede at fremme med folkeskolereformen. Det skyldes, at det var et krav, at testen ikke måtte tage mere end 45 min. at udføre, og at en computer skulle kunne udregne resultatet. Skal vi lade vores folkeskole styre af det?” spørger han.

Hvis vi ønsker nogle mere brugbare data om elevernes samlede faglige niveau, bør vi skele til USA og Canada, der har haft succes med at anvende grundigere test, siger han. Der er flere åbne spørgsmål i testene, og det er lærerne, der vurderer resultatet.

”Der findes test, der egner sig bedre til at vurdere den enkelte elev, og som kan måle mere komplekse ting. De er muligvis lidt mere besværlige at administrere, men de har ikke de store ulemper, som vores nationale test har,” siger Jeppe Bundsgaard.

Test bør tilpasses

Peter Allerup, professor ved DPU, Aarhus Universitet anbefaler, at de nationale test bliver tilpasset, så de kan anvendes til det, man ønsker at bruge dem til.

Han vurderer, at testene er konstrueret metodisk korrekt. Han medgiver, at der er en statistisk usikkerhed forbundet med resultaterne – men det vil der altid være, når man har med statistik at gøre. Den vil blive forbedret, hvis eleverne får mere tid til at tage testene, og hvis opgavebanken løbende kvalitetssikres.

”Jeg mener langt hen ad vejen, at det statistiske grundlag for testene er i orden. Men der er også nogle udfordringer, som vi bør løse. Der laves løbende nye opgaver, som indgår i testene, og det bør derfor kontinuerligt vurderes, hvordan de påvirker den statistiske sikkerhed,” siger Peter Allerup.

Han er enig med Jeppe Bundsgaard i, at det er vanskeligt for lærerne at bruge testene pædagogisk i deres nuværende form. Både fordi opgaverne er relativt simple og derfor ikke kan bruges til at vurdere elevens samlede kunnen i et fag, og fordi lærerne ikke får at vide, hvad eleverne har svært ved.

Og så mener han, at det er et stort problem, at de tal, som lærerne får præsenteret, er svære at forstå.

”I deres nuværende form matcher testene ikke det, man ønsker at bruge dem til. Jeg foreslår derfor, at man tilpasser og udbygger dem. Det vil hjælpe betydeligt, hvis man omregner elevernes scorer til, hvor mange procent, de har rigtig. Og så kan man udvide testene, så de måler mere komplekse kompetencer. Og endelig bør man indbygge en funktion, der giver en grundigere feedback til læreren, så han eller hun ved, hvad klassen har svært ved,” siger Peter Allerup.

Han vurderer, at det er muligt at tilpasse de nationale test på denne måde.

”Det vil svare mere til den måde, som de store internationale undersøgelser PISA, TIMMS, PIRLS og ICILS er bygget op. Men man vil stadig ikke kunne sige noget på elevniveau – det kan man heller ikke de internationale undersøgelser,” siger han.

10 år med nationale test - og fortsat plads til forbedring

Læs om DPU-forskernes pointer og perspektiver på de nationale test:

Test set fra børneperspektiv

Test må ikke blive mål i sig selv

Test måler det forkerte

Test bør tilpasses