Vad är det för fel på prov?

Just den här frågan får jag väldigt ofta. Jag får den av människor som läst någon av mina böcker. Och inte sällan skickar man med ett par av sina egna prov, för att visa att det minsann går att göra bra prov, oavsett vad jag skriver. Jag får också samma fråga varje gång jag under en föreläsning antyder att det finns problem med att lärare i Sverige i allt för hög grad baserar sin bedömning på resultat från skriftliga prov. I princip tycks det inte spela någon roll hur mycket jag än motiverar min ståndpunkt, utan precis som i betygsfrågan gäller principen: Är man inte odelat för, så är man emot. Men skam den som ger sig! Här kommer därför ett (extra långt) blogginlägg om prov, där jag försöker förklara varför jag anser det vara problematiskt att i allt för hög grad förlita sig på prov.

Först vill jag dock klargöra att jag inte är principiellt emot prov. Precis som de flesta instrument och metoder i skolan beror det på hur de används. Det jag försöker argumentera mot är när prov tar överhanden, så att bedömningen blir ensidig (i motsats till allsidig) och när prov används på fel sätt eller i fel syfte.

Och så vill jag be dig som läsare om en liten tjänst. Lägg din ilska åt sidan en liten stund. Läs och försök förstå det jag skriver, innan du börjar formulera ditt inlägg i kommentarsfältet. Ge det en chans. Kanske kan det leda till ett lite annorlunda sätt att se på prov. Kanske inte. Men då har vi åtminstone försökt. Båda två.

 

Vad är ett prov?

Jag vet att många anser akademiker vara mer än lovligt dryga, som alltid vill börja med definitioner. Men jag vill ändå hävda att det är viktigt att man är överens om vad man pratar om. Dels för att slippa missförstånd, men framför allt eftersom det är grundläggande för att förstå de argument jag ska framföra. Så jag ber om lite tålamod.

Prov bygger i grunden på en idé om att försöka fånga något som inte syns. Först ut var människors intelligens. Vi tänker oss att intelligens finns som en egenskap hos människor, men vi kan inte se den – inte ens med magnetresonanstomografi eller genom att blottlägga folks hjärnor. Så hur får vi reda på reda på hur begåvade människor är? Man får helt enkelt be dem göra saker, som kräver intelligens. Som till exempel att lista ut kluriga mönster. Att enbart ha en uppgift blir emellertid lite trubbigt, eftersom resultatet då blir antingen ”kan” eller ”kan inte”. Man kan dessutom lyckas/misslyckas på enskilda uppgifter av anledningar, som inte har med intelligensen att göra. Därför samlar man gärna ihop en stor mängd uppgifter till ett sammanhållet test, så att det blir en spridning i resultaten när olika människor gör testet. Har man många uppgifter av olika svårighetsgrad, tenderar spridningen att närma sig en normalfördelning.

Utifrån detta resonemang, kan man uppmärksamma en viktig sak: Den osynliga egenskapen (intelligens) manifesterar sig i hur väl man kan svara på uppgifterna. Resultatet är således beroende på vilka uppgifter som valts. Att till exempel vara intelligent på något annat sätt än att lista ut kluriga mönster betalar sig därför inte, om det är just denna typ av uppgifter som används för att testa intelligens. Men det betyder inte att intelligens är samma sak som att kunna lista ut kluriga mönster. Uppgifter där man listar ut kluriga mönster används eftersom de är indikatorer på det vi egentligen vill testa, men som vi inte riktigt kan komma åt. De enskilda uppgifterna i ett intelligenstest är därför ”oviktiga”, i den bemärkelsen att de bara är godtyckligt valda indikatorer, som tillsammans med övriga uppgifter i samma test ger en hyfsad uppskattning av en människas intelligens.

Det är detta sätt att med hjälp av tester uppskatta intelligens, som ligger till grund för uppskattningar av andra osynliga egenskaper hos människor – som kunskaper (eller ”förmågor” om man så vill). Man kan föra precis samma resonemang om kunskaper och förmågor, som om intelligens. Kunskaper syns inte på utsidan eller i MRT. För att veta om en människa har kunskaper, måste man be henne svara på frågor som kräver dessa kunskaper, så att den osynliga egenskapen blir synlig. Detta är grunden för ett prov. Man väljer vad som ska prövas (dvs. vilka kunskaper/förmågor) och formulerar ett antal uppgifter om just dessa kunskaper. Det är inte de enskilda uppgifterna som är viktiga – man skulle kunna byta ut dem mot andra frågor på samma tema – utan hur de tillsammans ger en hyfsad uppskattning av elevens kunskaper inom det område som prövas. Att kunna provuppgifterna utantill är därför inte detsamma som att ”ha kunskaper” inom detta område, eftersom de enskilda uppgifterna endast är indikatorer på något större, men som inte syns. Detta känner de flesta elever till på ett intuitivt sätt, vilket gör att de oftast är ointresserade av att gå igenom de rätta svaren på ett prov i efterhand. Genom att ha flera uppgifter på ett prov, kan man dessutom åstadkomma en spridning i resultat, till exempel för att kategorisera resultaten i olika betygsnivåer. Att åstadkomma spridning och betygsgränser underlättas även av att ge poäng på uppgifterna. Ju fler poäng totalt på provet, desto mer fingraderad sortering kan man göra.

Sammantaget innebär detta att prov är ett bedömningsinstrument som:

  • Avser att testa något som inte syns, som ”kunskap”, ”förståelse” eller ”förmåga”.
  • Innehåller ett antal uppgifter av olika svårighetsgrad, som är indikatorer på det som ska prövas. Ju fler uppgifter och poäng, desto bättre ”upplösning” har provet.
  • Ger resultat i form av ett sammanfattande omdöme, som totalpoäng, provbetyg eller rangordning.

Nu kan vi ställa samma fråga igen, men med lite mer teoretisk kunskap om prov i bagaget:

 

Vad är det för fel på prov?

Som framgått ovan, är prov konstruerade för att testa något som inte syns. Det man testar är på så vis större än provuppgifterna, som bara är några få exempel tagna ur en i princip oändlig mängd tänkbara uppgifter inom ett ämnesområde. Som ett stickprov på elevens kunskaper inom ett område, kan därför prov sägas fungera bra. Ju fler av uppgifterna en elev klarar av, desto mer kunskaper har troligen eleven inom detta område.

Problemen är dock:

  • Man kan inte på förhand meddela vad som kommer på provet. För om eleverna känner till uppgifterna, testar man inte längre ”elevernas kunskaper inom ämnesområdet”, utan enbart att de kan just precis de uppgifter som ingår i provet. Samtidigt innebär detta att eleverna inte ges möjlighet att ta ansvar för sitt eget lärande. Om jag vet vad jag förväntas kunna, då kan jag ta ansvar för mitt lärande genom att öva och öva tills jag behärskar det jag ska kunna. Men om vilka uppgifter som helst kan dyka upp – vad ska jag då öva på? Eftersom jag inte kan lära mig precis alla tänkbara frågor i världen, måste jag istället försöka lista ut vad läraren tycker är viktigt och kan tänkas fråga efter. Att ägna tid åt att försöka lista ut vad det (egentligen) är jag förväntas kunna, till exempel genom att hitta ledtrådar i det läraren säger och gör eller genom trial-and-error, är emellertid tveklöst mer tidsödande och frustrerande än att någon talar om för mig vad jag förväntas lära mig.

Notera också att hemlighetsmakeriet kring prov skiljer sig radikalt från de flesta verksamheter utanför skolan, både i organiserad undervisning (som idrott, akvarellmålning eller kreativt skrivande) och i vardagssammanhang. I sådana sammanhang är det helt normalt att man dels är tydlig med vad det är man vill att människor ska lära sig, dels att man bedömer hur väl folk lyckats lära sig just det man undervisade om. Om jag därför vill (under-)visa något av mina barn om hur man byter olja på gräsklipparen, visar jag först hur det går till. Därefter låter jag honom/henne testa att byta olja på gräsklipparen under mitt överinseende, som ett test på om undervisningen gått hem. Om barnet lyckas är båda glada. Barnet har lärt sig något nytt, vilket brukar kännas bra, och jag slipper kanske byta olja på gräsklipparen under några år framöver. Få skulle komma på tanken att i detta sammanhang testa barnet på något annat än det som undervisningen handlade om. Men tänk på hur det brukar se ut i skolan. Läraren meddelar att eleverna ska lära sig ett innehåll, som ”optik” eller ”universum”. I relation till det förstnämnda förväntas eleverna exempelvis lära sig om skuggor, reflektion, linser m.m., för att några veckor senare skriva ett prov. På provet kan (såklart) vilka frågor som helst kan dyka upp. För att få spridning bland eleverna är det dessutom vanligt att provet innehåller några uppgifter, vars innehåll inte behandlats i undervisningen. Ett vanligt exempel är uppgifter där eleverna förväntas ”tillämpa” sina kunskaper, för att testa vilka som har förstått ”på riktigt”. Men återigen: Om vi verkligen vill att ALLA elever ska lära sig det vi undervisar dem om, och även testa detta, då är ett sådant prov inte optimalt utformat. I en bedömningssituation som är optimerad för lärande, snarare än sortering, borde innehållet vara känt på förhand och alla eleverna borde ha övat och övat och övat, så att de i bedömningssituationen får visa vad de lärt sig genom undervisningen (och inte vad de har med sig hemifrån).

  • För att kunna ge konstruktiv och framåtsyftande återkoppling behöver man identifiera styrkor och utvecklingsbehov i det som eleverna presterar. Detta är relativt enkelt att göra utifrån lite större uppgifter, som kan bedömas utifrån flera olika aspekter/kriterier. Eleven kan till exempel ha lyckats bra med att välja metod i en uppgift om matematisk problemlösning, och även genomfört beräkningen korrekt, men samtidigt ha brister i hur lösningen kommuniceras. Metodval och beräkning är därmed styrkor och kommunikationen ett utvecklingsbehov, som kan fokuseras i återkopplingen. Motsvarande bedömning är oftast inte möjlig att göra utifrån enskilda provuppgifter. I ett traditionellt prov SKA alla uppgifter helst vara endimensionella, vilket gör att det inte går att bedöma mer än en sak i taget. Varje enskild uppgift kan därför bara ge information om styrka ELLER utvecklingsbehov. För att ge konstruktiv återkoppling måste man således hitta ett mönster utifrån flera uppgifter som prövar samma sak. Men eftersom detta mönster utgår från flera uppgifter, blir den lätt abstrakt och svår att använda för eleverna. Vad ska jag som elev göra om jag har brister i mina ”kunskaper om hur ljus reflekteras”? Återigen: Det är inte de enskilda uppgifterna som är viktiga att kunna, de är ju enbart indikatorer på något större (”kunskap om…”), så det duger inte att memorera svaren på uppgifterna. Jag tror att många som försöker formulera konstruktiv återkoppling utifrån provresultat lätt blir varse denna svårighet. Detta till skillnad från att formulera återkoppling till uppgifter som kan bedömas utifrån flera olika aspekter, där jag som lärare lätt kan visa goda exempel på hur man kan göra snygga lösningar i matematik.
  • Hela idén med prov är att ha flera uppgifter, som tillsammans ger en bild av någonting som inte syns. Och som beskrevs ovan: ju fler frågor och ju fler poäng, desto bättre spridning kan man åstadkomma – för att på så sätt bättre kunna skilja mellan de som har kunskap i högre grad och de som har kunskap i lägre grad. Att enbart ha en större uppgift, eller några få, ger inte samma möjlighet att sortera elevernas prestationer i olika resultat- eller betygskategorier. Ett pris man får betala för högre upplösning på provet, är emellertid att de enskilda uppgifterna måste vara relativt korta. Ju kortare uppgifter, desto fler hinner eleverna göra under en given tidsrymd. Samtidigt har naturligtvis korta uppgifter sina begränsningar. Enkla fakta och minneskunskaper passar bra i ett sådant format. Även uppgifter som kräver lite mer omfattande förklaringar eller beräkningar kan fungera, såvida man inte kräver att uppgifterna ska vara endimensionella, för då fungerar enbart flervals- och kortsvarsuppgifter. Men så fort eleverna ska formulera sig själva, minskar antalet uppgifter som de hinner med. Uppgifter som kräver längre och mer utredande svar passar därför sämre i provformatet. Uppgifter som kräver att eleverna ska samarbeta, tillverka någonting, utföra någonting som tar lång tid eller göra något utanför klassrummet fungerar inte alls i ett sådant format. Detta gör att flera av de komplexa förmågor/kunskaper som uttrycks dagens kursplaner inte kan fångas med prov.

Under 1900-talet, när kunskapsproven utvecklades och kom på modet, innebar uppdelningen av kunskaper i små fragment inte nödvändigtvis någon konflikt med synen på lärande. Skinner menade till exempel att man uppnår kompetens inom ett område just genom att gå genom ett stort antal väldigt små steg. Idag tänker de flesta annorlunda. Det har visat sig att om man lär sig delarna innebär inte detta per automatik att man får ihop helheten. Det räcker inte med att räkna enkla tal i matematikboken för att utveckla problemlösningsförmåga. Det räcker inte heller att lära sig fakta om atomkärnor och joniserande strålning för att kunna formulera argument och ta ställning i kärnkraftsfrågan. Fakta är en nödvändig, men inte tillräcklig del i att formulera argument och ta ställning. Vill man att eleverna ska lära sig hantera funktionella helheter, då måste man också undervisa dem om detta. Och vill man veta om eleverna kan hantera dessa helheter, då är det svårt att ta reda på detta med hjälp av prov. För det är svårt att använda prov för att testa hur väl eleverna kan söka information. Eller hur väl de förmår granska information och källor. För att inte tala om hur väl de klarar av att bemöta argument i en diskussion. Däremot kan prov fungera för att testa de fakta, begrepp, teorier och modeller, som är viktiga för att kunna formulera väl underbyggda argument. Men att man kan återge den teoretiska kunskapen på ett prov, betyder inte nödvändigtvis att man kan använda den i ett annat sammanhang.

Sammantaget ser vi alltså att provformatet innebär starka begränsningar, genom att:

  • Det försvårar för eleverna att ta ansvar för sitt lärande (eftersom provfrågorna är godtyckliga exempel på en osynlig egenskap, så eleverna kan inte känna till uppgifterna på förhand);
  • Det försvårar möjligheten för läraren att ge konstruktiv och framåtsyftande återkoppling till eleverna (eftersom styrkor och utvecklingsbehov inte kan formuleras utifrån enskilda uppgifter, utan från övergripande mönster, vilket dels blir för abstrakt och dels inte kan användas för att förbättra prestationer på kommande uppgifter);
  • De kunskaper som ska testas måste delas upp i isolerade småfragment (för att passa in i provformatet).

Till dessa besvärligheter kommer sammanvägningen av resultat till provpoäng eller provbetyg, som är problematiskt eftersom ett sådant aggregerat resultat dels innebär att all information om styrkor och utvecklingsbehov suddas ut (och därmed inte kan användas formativt), och dels att sådana resultat möjliggör jämförelser mellan elevers prestationer. Möjligheten att jämföra elevers provresultat är naturligtvis hela idén med prov, eftersom de konstruerade just i syfte att åstadkomma en spridning/sortering. Sådana jämförelser har emellertid ofta negativa effekter på elevers lärande och självbild – framför allt för lågpresterande elever – eftersom fokus hamnar på själva jämförelsen istället för den kunskap som siffran/bokstaven är tänkt att representera. Att jämföra styrkor och utvecklingsbehov, som inte är uttryckta längs en gradient, är däremot inte lika enkelt.

 

Vad är alternativet?     

Alternativet till prov är bedömningssituationer, som inte har ovanstående starka begränsningar, utan istället förmår stödja elevernas utveckling. Det vill säga uppgifter som är:

  • Viktiga i sig själva (istället för att vara indikatorer på någonting annat);
  • Flerdimensionella och ger möjlighet att identifiera styrkor och utvecklingsbehov (istället för endimensionella);
  • Återkommande, så att eleverna kan använda sin återkoppling och bli bättre (istället för att vara godtyckliga exempel);
  • Funktionella helheter, där eleverna får använda sina kunskaper i realistiska sammanhang (istället för isolerade kunskapsfragment);
  • Något eleverna kan vara stolta över att klara av (istället för att enbart vara provkunskaper).

Så – avslutningsvis – när det gäller prov, skulle jag nog främst rekommendera dem som formativa (icke-betygsgrundande) tester på att eleverna behärskar relevanta fakta, begrepp, teorier och/eller modeller innan de genomför de ”riktiga” uppgifterna – dvs. uppgifter där de får använda sina kunskaper i funktionella sammanhang. Då kan eleverna få genomföra provet flera gånger tills de klarar av det på ett tillfredsställande sätt. Plus att om de misslyckas på sina argumenterande uppgifter, litteraturanalyser m.m., då kan man vara ganska säker på att det inte är just dessa (prov-)kunskaper som brister.

Annonser

Kommentera

Fyll i dina uppgifter nedan eller klicka på en ikon för att logga in:

WordPress.com Logo

Du kommenterar med ditt WordPress.com-konto. Logga ut /  Ändra )

Google-foto

Du kommenterar med ditt Google-konto. Logga ut /  Ändra )

Twitter-bild

Du kommenterar med ditt Twitter-konto. Logga ut /  Ändra )

Facebook-foto

Du kommenterar med ditt Facebook-konto. Logga ut /  Ändra )

Ansluter till %s