Evidensbaserat urval handlar inte bara om ett intelligenstest och ett självskattnings-inventorium. Den beräkningsgrund som används har ingen begränsning hur många faktorer som vägs in, dock ska det som vägs in bygga på en rational och på belägg för att det fungerat i andra sammanhang. Det som vägs in ska naturligtvis också vara reliabelt. Det skriver psykologerna Anders Sjöberg, Maria Åkerlund och Sara Henrysson Eidvall.
När det gäller tester och chefsurval finns i samtiden en tilltagande och alltmer högljudd argumentation som menar att statistik är tillförlitligare än det professionella omdömet, skriver psykologerna Björn Sahlberg och Malin Holm. Tonfallet är självsäkert, man talar om evidensbaserat urval och alternativet beskrivs ofta i termer av ett mer eller mindre kvalificerat beslutsfattande med magen fortsätter Sahlberg och Holm, som också menar att båda sidor i denna fråga finner stöd i forskning. Vi uppfattar att huvuddragen i insändaren är att det inte är bra att rangordna kandidater i en rekryteringsprocess med hjälp av formler som väger ihop flera olika testpoäng och att erfarenhet hos en professionell yrkesperson intar en central plats i personbedömningen.
Inom arbetspsykologin har under ett antal decennier funnits två skolor inom bedömning och urval. Den ena traditionen har kallats klinisk, holistisk eller individuell bedömning och den andra mekanisk, statistisk eller psykometrisk bedömning. Det är riktigt att båda traditionerna vidhåller att data ska samlas in på ett strukturerat sätt. Det som skiljer de båda traditionerna åt är hur informationen sedan omvandlas till en rekommendation som i sin tur leder till ett urvalsbeslut.
Kliniska bedömningar kan definieras som bedömningar av olika aspekter som en expert anser vara av betydelse i ett visst sammanhang. Bedömningen är intuitiv eller åtminstone inte en standardiserad sammanvägning av dessa olika aspekter. Mekaniska bedömningar kan definieras som standardiserade sätt att mäta och sedan statistiskt sammanväga de aspekter som forskningen visat är av betydelse för urvalsbeslut. Dessa två skolor har alltså funnits parallellt under väldigt lång tid (de första artiklarna publicerade på 20-talet) och den mekaniska ansatsen är inte något som uppstått i ”samtiden”.
Det är helt rätt att evidensbaserat urval handlar om en siffra som ska ligga till grund för beslut och att denna siffra beräknas genom att man väger ihop den information om kandidaten som i forskning visat sig fungera i urval. EBU handlar emellertid inte om att begränsa detta till ett intelligenstest och ett självskattnings-inventorium. Den beräkningsgrund som används har ingen som helst begränsning hur många faktorer som vägs in, dock ska det som vägs in bygga på en rational och på belägg för att det fungerat i andra sammanhang. Det som vägs in ska naturligtvis också vara reliabelt, alltså fritt från mätfel. Således kan även intervjuer, referenstagning och omdömesgillt tänkande läggas in i samma formel tillsammans med poäng från intelligenstest och personlighetstest så länge även dessa mått är reliabla och valida. På detta sätt bildar samtliga informationskällor beslutsunderlag vid urval, i en s k kompensatorisk modell där vissa faktorer kan viktas tyngre än andra eller kompensera varandra.
Författarna argumenterar för att den mekaniska metoden inte kan upptäcka patologiska lögnare eller rasister och att det som gäller för en grupp i allmänhet inte med nödvändighet gäller för alla individer i gruppen. De ger också ett exempel på vad de anser är ett felaktigt grundat urvalsbeslut där en kvinna blev nekad ett jobb pga av att hon var normalbegåvad.
Ett urvalsunderlag som endast innehåller en intelligenspoäng och fem personlighetspoäng (av Big 5-karaktär) kan naturligtvis inte upptäcka patologiska lögnare eller rasister. Om det finns information som predicerar lögnaktighet och rasism som är reliabel kan denna emellertid vägas in i EBU. Vad gäller argumentet att det som gäller gruppen inte säkert gäller för individen är detta förvisso korrekt, men vi kan aldrig förutsäga enskilda beteenden hos en individ till 100 procent. Det är därför all bedömning handlar om sannolikhet. Det är den professionella personbedömarens (leverantörens) ansvar att redogöra för uppdragsgivaren med vilken grad av säkerhet hon eller han kan säga att det är rätt person som föreslås till anställningen. Idag upplever vi att alltför mycket tid ägnas åt oändliga beskrivningar av kandidater och att dessa beskrivningar endast är diffust kopplade till sannolikheten att lyckas i det arbete som söks.
Kvinnan som nekades anställning på grund av normalbegåvning är inte nödvändigtvis ett exempel på evidensbaserat urval. EBU förordar inte att endast en informationskälla ska användas vid urvalsbeslut.
Vi menar, till skillnad från författarna, att båda sidor inte alls får stöd i forskningen. Redan på 40-talet gjordes utvärderingar av stora urvalsprojekt i USA där det visade sig att de samlade bedömningar av testresultat och andra data som gjordes i slutet av urvalsprocessen hade lägre validitet än de enskilda testerna var för sig. Under de 70 år som följt därefter har man varje gång man jämfört kliniska/holistiska och mekaniska/psykometriska bedömningar kommit fram till samma resultat. Forskningen ger tydligt besked, mekanisk sammanvägning vinner överlägset när samma information bedöms.
När det undersökts hur bedömningsexperter inom olika områden kommer fram till beslut har man funnit att de förlitar sig på begränsad information, är oklara över och inte kan redovisa hur de har kommit fram till sina bedömningar, att interbedömar-reliabiliteten är låg samt att de blir mer säkra på sina ursprungliga slutsatser när irrelevant information tillförs. Det finns alltså inget stöd i forskningen för att den professionella bedömaren har en unik förmåga att väga samman intryck, ställa relevanta frågor och till sist med hjälp av sitt omdöme fatta bättre urvalsbeslut. Snarare visar forskningen att professionella bedömare överskattar sin förmåga.
Ett av psykologins stora bidrag till samhället är forskningen och kunskapen om människans omdöme och beslutsfattande. Genom detta bidrag har vi lärt oss mer om hur vårt omdöme påverkas av ovidkommande faktorer, hur svårt vi har att uppskatta sannolikhet och hur vi föredrar och låter oss påverkas mer av berättelser än av enstaka fakta hur relevanta de än är. Denna psykologiska kunskap förklarar varför validiteten sjunker när vi försöker ”tolka” testresultat och annan data som insamlats.
Vi menar att alla metoder bör utvärderas i förhållande till det mål man har med dem. Om målet när man gör ett urval är att exempelvis bemanna en roll med den person som med så stor sannolikhet som möjligt kommer att göra det bästa jobbet, till fromma för alla intressenter såsom medarbetare, kolleger, brukare/kunder, skattebetalare/ägare och samhället i stort, bör man välja den säkraste metoden för detta.
Den som använder metoden bör kunna göras ansvarsskyldig, det vill säga kunna redogöra för hur och med vilket stöd hon eller han kommit fram till sin slutsats. Det bör gå att spåra processen fram till beslut och om flera bedömare använder samma metod på samma data ska de komma till samma slutsats. Personligt ansvar och moral är i detta sammanhang förknippat med att vara tydlig med vad som bedöms, hur det vägs ihop och till slut ligger till grund för ett beslut baserat på empiri. Vi har alla arbetat inom urvalsområdet i ett 20-tal år. Vår erfarenhet är att urvalsbedömare sällan görs ansvarsskyldiga och i princip aldrig avkrävs en redovisning av rationalen och forskningsstödet för sina metoder. Vi uppmanar kunder och andra intressenter att avkräva oss detta och göra oss ansvarsskyldiga!