Rorschach Summer Seminars Ljubljana and the Beauty of Jante

Internationella Rorschachföreningen IRS arrangerar de år det inte är kongress, sommarseminarier under tre dagar någonstans i Europa. Upplägget är alltid detsamma: Ett tema, tre seniora kliniker, seminarium på förmiddagen och eftermiddagen ägnas åt fördjupning i fall. Temat för årets seminarier var ”Projective Methods and Psychotherapy” med kommentaren ”Probably no use of the Rorschach and projective tests is more important than its role in the planning and evaluation of psychotherapeutic treatment.”

Första dagen föreläste Lily Rothchildt om vikten av att noga utreda mentaliseringsförmåga för förståelsen av personlighetsstruktur hos patienter med ätstörningsproblematik. Hon beskrev bland annat att det inte är tillräckligt att använda RF-skalan för detta utan att mentaliseringsbegreppet behöver få det djup det förtjänar. Hon använder både självskattningsskalor och Rorschach samt TAT och tar hjälp av SCORS för att tydliggöra självbild och interpersonell förståelse i TAT-materialet. Allt detta presenterades och tydliggjordes med hjälp av kliniskt material.

Moderator Howard Lerner tackade särskilt för att hennes konceptuellt inriktade presentation som med sitt fokus på mentalisering ”…helped bring the Rorschach and other projcetive methods up to date”. Hans snabba genomgång av psykodynamisk terapiutveckling, från ”… focus on interpretation to the focus on intersubjectivity and mentalization” pekade på samma sätt framåt, och belyser hur relationen mellan terapeut och patient blivit mer jämlik och kollaborativ.

Sommarseminarierna är intensiva, lärorika och utmanande – inte minst eftersom deltagarna kommer ifrån uppåt 20 olika länder, med olika traditioner både psykodynamiskt och hur vi ser på lärande. I både fall som presenteras, och i själva lärandesituationen, blir det tydligt att det psykodynamiska paradigmet befinner sig i ett skifte någonstans mellan det hierarkiska och det kollaborativa, olika mycket i olika länder.

De två första dagarna hade det gemensamt att seminariehållaren, efter att ha föreläst om sitt ämne och gett oss fall att klura på, sedan gav oss facit. Hade vi diskuterat rätt eller fel? Lily Rotschield hade ett ambitiöst upplägg och önskan att vi snabbt skulle förflytta oss till en punkt som var intressant och kändes mycket relevant och lärorik, men också ganska snäv. Vår uppgift var att identifiera hyper-mentalisering i materialet och risken för att övervärdera dessa uttryck som tecken på hälsa. En viss irritation spred sig i min diskussionsgrupp över det höga tempot och bristen på frihet att undersöka och reflektera. Kanske fanns det också parallella processer, funderade vi, med fallet som handlade om en mycket intelligent ung person men med uppenbar hypermentalisering utan riktig verklighetsanknytning, och som skrevs ut prematurt från den ätstörningsenhet hen vårdats på.

Barbara Gamble presenterade, den andra dagen, sitt arbete med utredningar med barn och ungdomar. Hon beskrev ett mycket terapeutiskt förhållningssätt där barnets upplevelser, föräldrarnas bilder och sammanhanget beaktades för att synliggöra och förstå barnets svårigheter med hjälp av performancebaserade/projektiva metoder, tillsammans med övriga testmetoder. Hon betonade starkt vikten av en ordentlig anamnes, ibland i flera släktled, för att förstå. Moderator Howard Lerner, tillika hennes partner och Rorschach-coach på fallet, summerade och fortsatte att leverera starka one-liners; som ”the assessment starts with the first phonecall”, ”a thorough assessment may be life-changing” och att föräldrarna är med-undersökare i en gemensam problemlösning där de genom att undersöka och reflektera omkring barnet, kan få omvälvande nya insikter.

Trots ett värdefullt strukturerande av utredningsprocessen och ett mycket intressant fall, lämnade dagen mer än en av oss ganska beklämd. 36 psykologer från 16 länder fick veta att vi alla hade fel, när vi var fortsatt oroade för patienten och såg mycket av det som beskrevs som en ytanpassning från hens sida i relation till vad hen kanske uppfattade som terapeutens förväntningar. En slående gränslöshet i relationerna mellan terapeut och förälder (även psykologkollega) och rorschach-handledare (även make) kan ha ökat behovet av presentera en lycklig utgång, som också var facit för denna dag.

För mig som skandinav, blev Harald Jansons ingång en befrielse när han den tredje dagen klev upp på temat ”How Rorschach findings can assist treatment planning for psychotherapy with respect to structural dissociation of the personality”. Harald inledde med att beskriva sig som allt annat än en expert på dissociation och att han antagit utmaningen för att få tillfälle att fördjupa sig i ämnet. Det hade han verkligen gjort. Vi fick en strukturerad och tillgänglig genomgång av ”state of the art” av dissociationsbegreppet som enligt Harald lider av ”multiple definition syndrome”, samt hur dissociation i olika former blir synligt i Rorschach. Rorschachtestet är för övrigt ett genomgående rekommenderat bedömningsinstrument inom dissociationsfältet, eftersom Rorschachtestet direkt riktar sig mot att mäta relevanta variabler som perception, uppmärksamhet och föreställning/fantasi.

Det hade slumpat sig så att patienten var helt ny och att de just skulle börja sitt arbete tillsammans, och båda var gemensamt intresserade av vad 36 psykologer från 16 länder skulle kunna bidra med för förhoppningsvis hjälpsamma infallsvinklar. Det var en närmast motsatt inställningen mot de föregående dagarna, och en som ledde till uppenbart större deltagande av auditoriet. Det slår mig att den så förhatliga Jantelagen troligen har en även positiv inverkan i utvecklandet av en inställning där ingen expert är perfekt, och där fler som regel är klokare än en. Som tur är för oss, är Harald inte främmande för att hålla föreläsningen igen, någonstans i Sverige, någon gång i vinter, så stay tuned.

Det bestående intrycket av sommarseminarierna är ändå, och som alltid, att de är enormt berikande. När jag lyfter mitt första wartegg-protokoll efter hemkomst känner jag mig mer öppen och mottaglig, för ett tag klokare och med högre förmåga att integrera olika aspekter av personligheten, som alltid är den stora utmaningen när vi försöker oss på att förstå något så komplext som en människas psykiska dynamik. Tillsammans söker vi nya sätt också, att nå ut med det utvidgat psykodynamiska perspektivet och den fortsatt så viktiga frågan som startpunkt för en utredning; ”Hur kan vi förstå den här personens symtom?” och ”Hur är det att vara hen”?

 

 

Facebooktwitterredditpinterestlinkedinmail

Experter kan verka dyra tills du hyr en amatör…

En kritik av DISC-testet har seglat upp efter en granskning i tidskriften Filter  länk. Önskan att snabbt och helst digitaliserat göra urvalsbedömningar gör att enkla lösningar säljer. Både testbolag och organisationer skulle kunna tjäna mycket pengar på en quick-fix-metod och sådana lanseras också med jämna mellanrum. Det kostar dock mer än det smakar i slutänden eftersom både människor och situationer är komplexa och inte så lätt låter sig kategoriseras. Metoderna blir i bästa fall verkningslösa och leder i värsta fall till reducering, stigmatisering och kostsamma felrekryteringar.

Det aktualiserar dock frågan om vad vi egentligen kan säga om människor, även med mer seriösa metoder, och hur. En som kommenterar är Anders Sjöberg – docent i psykologi med psykologisk testning som forsknings- och affärsområde. Han vidareutvecklar i sin blogg (länk) problemet med att mäta hur personlighet relaterar till t ex arbetsprestation, eftersom idén om stabila personlighetsdrag – eller traits – visat sig vara till stor del en illusion. Personlighet är ofta situationsberoende. Paradoxalt vidhåller Sjöberg att de enda seriösa urvalsbedömningarna idag lutar sig mot femfaktormetoden (FFM) – en traitmodell. Han efterlyser dock mer dynamiska metoder för att komma åt samspelet mellan person och situation och hoppas på forskningen om teknikbaserade metoder.

Sjöbergs perspektiv är forskarens. Han försöker att hitta en modell inom laboratoriets fyra väggar som sedan skall stå sig i praktiken och här slår han i sitt metodtak. Där Sjöberg ger upp tar Greg Meyer vid i föreläsningen ”On Methods of Knowing in Psychology” (länk Youtube, Society For Personality Assessment 2018). Meyer är legitimerad psykolog och en av de internationellt mest framstående forskarna inom personlighetsbedömning idag. Meyer lyfter i mångt och mycket samma utmaningar som Sjöberg men vidareutvecklar den dynamiska ansats som Sjöberg efterlyser.

Meyer påminner om att psykologin egentligen inte har exakta mätmetoder med jämna skalsteg, vi bara agerar som om det vore så. Våra statistiska beräkningar blir lite grann en koloss på lerfötter eftersom vi har kompromissat med själva grundförutsättningarna. Det har nu också visat sig att egenskaper, eller traits, inte kan sägas existera fristående från påverkan i situationen (sk ”true score”). Olika typer av mätmetoder kan därför inte förväntas ge jämförbara resultat på samma sätt som t ex olika metoder att mäta blodtryck. Psykologiska begrepp som t ex ”introversion” finns inte i platonsk mening utan är beroende av mätmetod, introversion skattad av personen själv i ett femfaktortest, introversion hos en person som den skattas av kollegor, eller introversion som den framstår i ett performancetest som t ex wartegg.

Meyer förespråkar därför att vi förskjuter fokus – från de egenskaper vi försöker mäta till metoderna i sig. Vi måste acceptera hur mycket metoder påverkar våra resultat och vidareutveckla en klassificering av hur olika mätmetoder fungerar och vad de kan ge. Vi  måste också vidareutveckla de teoretiska riktlinjerna för hur vi skall integrera de ofta motsägelsefulla resultat vi får fram via olika typer av test. Om vi ser olika metoder som olika situationer, så kan vi använda dem medvetet till att belysa en egenskap ur flera perspektiv. Vi får flera mätpunkter och kan via triangulering analysera resultaten, sätta dem i ett sammanhang och till slut få fram en mer dynamisk förståelse av en persons ”om … så … signatur” – ett samtidigt dynamiskt och stabilt personlighetsmönster som forskning har svårt att fånga men som utgör en mer effektiv utgångspunkt för rekommendationer.

I praktiken är det vad psykologisk personlighetsbedömning går ut på. Att välja och integrera mätmetoder för att få fram en mer komplex och dynamisk helhetsbild av en individ är en psykologisk specialitet som kräver utbildning och mycket träning. För en organisation som vill erbjuda tillfälle till utveckling, eller ha stöd i både att välja men också förvalta nya förmågor, är det en god investering på flera plan, både i effektivitet och hållbarhet.

 

Malin Holm, ordförande, leg psykolog och konsult inom personlighetsbedömning och ledarutveckling, lärare i warteggmetoden.

Facebooktwitterredditpinterestlinkedinmail

”On Methods of Knowing in Psychology”

Hur kan vi veta att vi förstått något om en annan människa, eller i alla fall att vi med våra metoder har fått en tillräcklig förståelse för att göra förutsägelser om framtida beteende i olika situationer? Människors förmåga t ex att rättvisande beskriva sig själva, eller andra, är begränsad. Vår personliga historia revideras och redigeras, saker som vi upplevt kommer vi ihåg eller inte, och våra personliga narrativ, och fakta i dem, förändras över tid. Olika testmetoder påverkar i sig vilken typ av svar som framkallas, och inte. Andras skattningar säger mycket lite om personens innersta tankar, skattningar av en själv begränsas av förmågan till introspektion och öht att minnas rätt. Tester av maxprestation som t ex WISC kan begränsas av dagsform och performancetester som Rorschach är känsliga för hur mycket personen engagerar sig i uppgiften, och säger ganska lite om värderingar och attityder.

Även om många mätmetoder inom personlighetspsykologin syftar till att undersöka fasta egenskaper eller ”traits” som om dessa vore sig lika över alla situationer, visar både forskning och erfarenhet visar att sådana egentligen inte finns. Människor varierar beroende på situationer. Vi kan vara t ex reserverade bland främlingar men utåtriktade bland vänner, eller argsinta på morgonen och lättsamma på kvällen, eller glada när vi är bland andra men få ångest i vår ensamhet. Beteendet samspelar med och påverkas av miljön.

”On Methods of Knowing in Psychology” är namnet på en föreläsning av Greg Meyer från SPA i år och den finns nu på Youtube. Meyer är en av de mer framstående forskarna idag inom personlighetsbedömning och han redogör här för några av de mest avancerade och aktuella tankarna och forskningen inom vårt område och hur ska vi egentligen gå tillväga inom personlighetsbedömning för att kunna veta något om en person? Hur vet vi att vi vet tillräckligt för att besvara t ex en remissfråga?

Meyer påminner om att det inom psykologin inte finns mätmetoder med exakta skalsteg som motsvarar exakta variationer i beteenden och som går att jämföra på det sättet. (Ändå beter vi oss inom psykologin som om de gjorde det, vilket beskrivits som en slags modern psykologis tankestörning.) Det innebär bland annat att det inte är konstigt att samma begrepp – t ex ”depression” eller ”självförtroende” – inte visar något samband över olika typer av mätmetoder. Variationerna i resultat mellan metoder kan istället ses som minst lika specifika för metoden som för det fenomen som undersöks. Inget enskilt test kan fånga hela personligheten men vi kan betrakta olika test eller bedömningsmetoder i sig som olika kontexter – vart och ett en situation, en stimulus, som framkallar vissa egenskaper eller kvalitéer.

Meyer menar att vi behöver en strukturerad klassificering av metoder där vi redovisar och räknar med varje enskild metods egenskaper, möjligheter, begränsningar och brister. Den medvetenheten är en viktig del i att välja vilket eller vilka verktyg som lämpar sig för vilken frågeställning och vilket tillfälle och hur de kan kombineras för att komplettera och belysa varandra. En central poäng är alltså att skifta fokus från att försöka ringa in fasta egenskaper eller ”traits” till vilka metoder vi har att undersöka egenskaper med, möjligheter och begränsningar med varje metod och hur våra metoder i sig påverkar vilka svar vi får.

Meyer och hans kollegor föreslår en klassificering med en bred uppdelning mellan metoder som bygger på antingen människors skattningar eller människors faktiska prestationer (performance), som sedan ytterligare delas upp i antingen skattningar av personen själv (t ex femfaktortest) eller observatörer (t ex frågeformulär riktade till anhöriga).  Prestationsbaserade metoder delas upp i antingen maximal prestation (t ex WAIS) eller typisk ”prestation” (t ex Rorschach).

En viktig och avgörande fördel som kliniken har över forskningen, enligt Meyer, är att medan forskningen håller de egenskaper som mäts konstanta, kan de i den kliniska praktiken förstås utifrån situation och kontext. Eller som Meyer uttrycker det – vi kan relatera data till kontexten och identifiera meningsfulla mönster som är på det stora hela osynliga i forskningen. Det är i dessa mönster vi kan finna en mer dynamisk förståelse. Även om miljön påverkar och människors beteende varierar beroende på situation, så är den variationen i sig relativt stabil.

Personlighet bör alltså snarare uttryckas i relativa termer eller i ”om … så … signum” (if … then … signatures) istället för i fasta egenskaper som ”extrovert” eller ”vänlig”. Genom att se olika typer testmetoder som olika kontexter kan vi alltså via triangulering komma närmare en mer dynamisk och rättvisande förståelse som grund för förutsägelser och rekommendationer, och därigenom slutligen bli lite bättre på att ”veta något om en person”.

Enjoy!

https://www.youtube.com/watch?v=VkVAnDgg6yA&t=2522s

Greg meyer http://www.utoledo.edu/al/psychology/people/faculty/meyer.html
Facebooktwitterredditpinterestlinkedinmail

Debatt om klinisk vs mekanisk personbedömning i psykologtidningen

2013-08-15

Malin Holm och Björn Sahlberg:
”Statistik är inte mer tillförlitlig
än professionellt omdöme”

När det gäller tester och chefsurval finns i samtiden en tilltagande och alltmer högljudd argumentation som menar att statistik är tillförlitligare än det professionella omdömet, att en matematisk formel som beslutsgrund är att föredra. Tonfallet är självsäkert.

Man talar om evidensbaserat urval och alternativet beskrivs ofta i termer av ett mer eller mindre kvalificerat beslutsfattande med magen. Grundläggande i denna statistiska linje – eller Big Data som den också benämnts – är att:
1) kandidater i en rekryteringsprocess bör rangordnas med hjälp av kvoten från ett traditionellt intelligenstest och vissa delskalor i ett självskattningsinventorium, och
2) erfarenhet hos en professionell yrkesperson kan – tillsammans med intervjuer, referenstagning eller försök att använda omdömesgillt tänkande – bara störa bedömningen.

Big Data-ideologin har en fördel i att den minskar utrymmet för godtycke i bedömningar, men vi menar att flera fakta manar till ödmjukhet:
• Metoden anger inte om personen även tillhör någon oönskad grupp, till exempel gruppen patologiska lögnare eller rasister
• Det som gäller för en grupp i allmänhet gäller inte med nödvändighet för alla individer i gruppen. I det enskilda fallet kan ovanliga men kritiska faktorer göra att den renodlade statistiska bedömningen blir gravt missvisande.

Hur fel det kan gå belyses till exempel av en kvinna som kontaktade en av oss och berättade att hon blev nekad ett chefsjobb i en svensk kommun eftersom hennes resultat på BASIQ ”enbart” var stanine 5 jämfört med normalpopulationen. Det hade varit okej om resultatet hade varit 5 jämfört med akademikergruppen.

Vi menar inte att begåvning är oviktigt, men man kan och bör tänka längre än en kvot eller siffra. Man bör relatera detta till annat som omdöme, strategisk förmåga, tolerans för osäkerhet och komplexitet, typen av försvarsmönster och reaktioner på stress, personlig och känslomässig mognad. Sedan – och detta är avgörande – bör man som professionell bedömare kunna väga samman intryck, ställa sig nya frågor och till sist med hjälp av sitt omdöme ta ställning. Man överlåter inte avgörandet till metoden utan tar ansvar för en egen bedömning.

Inom rättspsykiatrin, där kostnaderna för felaktiga beslut pressar på metodutvecklingen, brukar Big Data hänföras till den andra generationens bedömningar; ett redan lämnat steg på vägen mot mer användbarara system. I stället har en tredje generationens metod utvecklats; En syntes av klinisk bedömning och Big Data, ofta kallad strukturerad klinisk bedömning. Där ska bedömaren låta sig styras av checklistor med empiriskt välstuderade faktorer, men utifrån klinisk erfarenhet och även sunt förnuft kunna lägga till och dra ifrån specifika faktorer av betydelse.

Vi oroas också av den kulturella påverkan som Big Data innebär. Om tänkande och berättande helt ersätts av empiri och statistik blir det svårt att skapa begrepp kring personligt ansvar och moral. Att alla sidor hittar stöd i forskning visar bara att ämnet är komplext, och vi skulle önska att vi psykologer kunde göra gemensam sak i en verkligt vetenskaplig ansats – att ackumulera kunskap med de landvinningar vi gör i stället för att på ett arrogant sätt påstå att någon har det enda rätta synsättet.

Anders Sjöberg, Maria Åkerlund och Sara Henrysson Eidvall om tester:
”Alla metoder bör utvärderas i förhållande till målet”

Evidensbaserat urval handlar inte bara om ett intelligenstest och ett självskattnings-inventorium. Den beräkningsgrund som används har ingen begränsning hur många faktorer som vägs in, dock ska det som vägs in bygga på en rational och på belägg för att det fungerat i andra sammanhang. Det som vägs in ska naturligtvis också vara reliabelt. Det skriver psykologerna Anders Sjöberg, Maria Åkerlund och Sara Henrysson Eidvall.

När det gäller tester och chefsurval finns i samtiden en tilltagande och alltmer högljudd argumentation som menar att statistik är tillförlitligare än det professionella omdömet, skriver psykologerna Björn Sahlberg och Malin Holm. Tonfallet är självsäkert, man talar om evidensbaserat urval och alternativet beskrivs ofta i termer av ett mer eller mindre kvalificerat beslutsfattande med magen fortsätter Sahlberg och Holm, som också menar att båda sidor i denna fråga finner stöd i forskning. Vi uppfattar att huvuddragen i insändaren är att det inte är bra att rangordna kandidater i en rekryteringsprocess med hjälp av formler som väger ihop flera olika testpoäng och att erfarenhet hos en professionell yrkesperson intar en central plats i personbedömningen.

Inom arbetspsykologin har under ett antal decennier funnits två skolor inom bedömning och urval. Den ena traditionen har kallats klinisk, holistisk eller individuell bedömning och den andra mekanisk, statistisk eller psykometrisk bedömning. Det är riktigt att båda traditionerna vidhåller att data ska samlas in på ett strukturerat sätt. Det som skiljer de båda traditionerna åt är hur informationen sedan omvandlas till en rekommendation som i sin tur leder till ett urvalsbeslut.

Kliniska bedömningar kan definieras som bedömningar av olika aspekter som en expert anser vara av betydelse i ett visst sammanhang. Bedömningen är intuitiv eller åtminstone inte en standardiserad sammanvägning av dessa olika aspekter. Mekaniska bedömningar kan definieras som standardiserade sätt att mäta och sedan statistiskt sammanväga de aspekter som forskningen visat är av betydelse för urvalsbeslut. Dessa två skolor har alltså funnits parallellt under väldigt lång tid (de första artiklarna publicerade på 20-talet) och den mekaniska ansatsen är inte något som uppstått i ”samtiden”.

Det är helt rätt att evidensbaserat urval handlar om en siffra som ska ligga till grund för beslut och att denna siffra beräknas genom att man väger ihop den information om kandidaten som i forskning visat sig fungera i urval. EBU handlar emellertid inte om att begränsa detta till ett intelligenstest och ett självskattnings-inventorium. Den beräkningsgrund som används har ingen som helst begränsning hur många faktorer som vägs in, dock ska det som vägs in bygga på en rational och på belägg för att det fungerat i andra sammanhang. Det som vägs in ska naturligtvis också vara reliabelt, alltså fritt från mätfel. Således kan även intervjuer, referenstagning och omdömesgillt tänkande läggas in i samma formel tillsammans med poäng från intelligenstest och personlighetstest så länge även dessa mått är reliabla och valida. På detta sätt bildar samtliga informationskällor beslutsunderlag vid urval, i en s k kompensatorisk modell där vissa faktorer kan viktas tyngre än andra eller kompensera varandra.

Författarna argumenterar för att den mekaniska metoden inte kan upptäcka patologiska lögnare eller rasister och att det som gäller för en grupp i allmänhet inte med nödvändighet gäller för alla individer i gruppen. De ger också ett exempel på vad de anser är ett felaktigt grundat urvalsbeslut där en kvinna blev nekad ett jobb pga av att hon var normalbegåvad.

Ett urvalsunderlag som endast innehåller en intelligenspoäng och fem personlighetspoäng (av Big 5-karaktär) kan naturligtvis inte upptäcka patologiska lögnare eller rasister. Om det finns information som predicerar lögnaktighet och rasism som är reliabel kan denna emellertid vägas in i EBU. Vad gäller argumentet att det som gäller gruppen inte säkert gäller för individen är detta förvisso korrekt, men vi kan aldrig förutsäga enskilda beteenden hos en individ till 100 procent. Det är därför all bedömning handlar om sannolikhet. Det är den professionella personbedömarens (leverantörens) ansvar att redogöra för uppdragsgivaren med vilken grad av säkerhet hon eller han kan säga att det är rätt person som föreslås till anställningen. Idag upplever vi att alltför mycket tid ägnas åt oändliga beskrivningar av kandidater och att dessa beskrivningar endast är diffust kopplade till sannolikheten att lyckas i det arbete som söks.

Kvinnan som nekades anställning på grund av normalbegåvning är inte nödvändigtvis ett exempel på evidensbaserat urval. EBU förordar inte att endast en informationskälla ska användas vid urvalsbeslut.

Vi menar, till skillnad från författarna, att båda sidor inte alls får stöd i forskningen. Redan på 40-talet gjordes utvärderingar av stora urvalsprojekt i USA där det visade sig att de samlade bedömningar av testresultat och andra data som gjordes i slutet av urvalsprocessen hade lägre validitet än de enskilda testerna var för sig. Under de 70 år som följt därefter har man varje gång man jämfört kliniska/holistiska och mekaniska/psykometriska bedömningar kommit fram till samma resultat. Forskningen ger tydligt besked, mekanisk sammanvägning vinner överlägset när samma information bedöms.

När det undersökts hur bedömningsexperter inom olika områden kommer fram till beslut har man funnit att de förlitar sig på begränsad information, är oklara över och inte kan redovisa hur de har kommit fram till sina bedömningar, att interbedömar-reliabiliteten är låg samt att de blir mer säkra på sina ursprungliga slutsatser när irrelevant information tillförs. Det finns alltså inget stöd i forskningen för att den professionella bedömaren har en unik förmåga att väga samman intryck, ställa relevanta frågor och till sist med hjälp av sitt omdöme fatta bättre urvalsbeslut. Snarare visar forskningen att professionella bedömare överskattar sin förmåga.

Ett av psykologins stora bidrag till samhället är forskningen och kunskapen om människans omdöme och beslutsfattande. Genom detta bidrag har vi lärt oss mer om hur vårt omdöme påverkas av ovidkommande faktorer, hur svårt vi har att uppskatta sannolikhet och hur vi föredrar och låter oss påverkas mer av berättelser än av enstaka fakta hur relevanta de än är. Denna psykologiska kunskap förklarar varför validiteten sjunker när vi försöker ”tolka” testresultat och annan data som insamlats.

Vi menar att alla metoder bör utvärderas i förhållande till det mål man har med dem. Om målet när man gör ett urval är att exempelvis bemanna en roll med den person som med så stor sannolikhet som möjligt kommer att göra det bästa jobbet, till fromma för alla intressenter såsom medarbetare, kolleger, brukare/kunder, skattebetalare/ägare och samhället i stort, bör man välja den säkraste metoden för detta.

Den som använder metoden bör kunna göras ansvarsskyldig, det vill säga kunna redogöra för hur och med vilket stöd hon eller han kommit fram till sin slutsats. Det bör gå att spåra processen fram till beslut och om flera bedömare använder samma metod på samma data ska de komma till samma slutsats. Personligt ansvar och moral är i detta sammanhang förknippat med att vara tydlig med vad som bedöms, hur det vägs ihop och till slut ligger till grund för ett beslut baserat på empiri. Vi har alla arbetat inom urvalsområdet i ett 20-tal år. Vår erfarenhet är att urvalsbedömare sällan görs ansvarsskyldiga och i princip aldrig avkrävs en redovisning av rationalen och forskningsstödet för sina metoder. Vi uppmanar kunder och andra intressenter att avkräva oss detta och göra oss ansvarsskyldiga!

2014-01-08

Malin Holm och Björn Sahlberg:
”Finns ingen bra ursäkt att inte använda sitt professionella omdöme”

Vi skrev ett debattinlägg i Psykologtidningen nr 6/2013 samt på psykologtidningen.se med kritisk udd mot den så kallade evidensbaserade urvalsmetoden. Nu har Sara Henrysson Eidvall, Anders Sjöberg och Maria Åkerlund gått i svaromål och överskriften är: ”Alla metoder bör utvärderas i förhållande till målen”, vilket vi givetvis inte motsäger. Snarare belyser det kanske grunden i vårt resonemang – vilket värde tillför egentligen de olika metoderna?

Författarna skriver också att de slagits av att de genom åren sällan behövt ställas till svars för sina bedömningar. Vi anser också det som självklart att man ska kunna ställas till svars för sin bedömning, och är vana att ha denna diskussion med uppdragsgivare, och vi vill betona att detta inte är en diskussion om att ha en sund metodologi, robusta tester eller grunda sina metoder i forskning. Där är vi helt eniga. Vad vi vill diskutera är vad personbedömning är och vad en kvalificerad yrkesperson kan tillföra utöver själva testen.

Vi argumenterar för att psykologens/konsultens eget omdöme måste användas när vi drar slutsatser och att vi inte ska förlita oss enbart på en siffra från en formel. På detta svarar författarna att forskning entydigt visat att mekanisk/psykometrisk bedömning är bättre än klinisk/holistisk. Den senare beskrivs som intuitiv och som att konsulten inte kan redogöra för hur han/hon kommit fram till sina resultat. Hur är den forskningen genomförd? Tar den hänsyn till exempel till metodologin och skickligheten hos bedömaren?

I Psykologtidningen nr 1/2013 skriver Sara Henrysson Eidvall i en recension av Kahnemans bok Att tänka snabbt eller långsamt om vådan av hastigt vanetänkande. Vi är överens med författarna om att det är ett långsamt, analytiskt tänkande som behövs. Poängen med boken, och recensionen, är att detta inte sker bara på basis av en persons begåvning, utan mer är en fråga om insikt, professionalism och självdisciplin. Vi skulle kunna kalla det snabba tänkandet intuitivt och i vissa fall omedvetet, medan det långsamma strävar efter att vara medvetet och rationellt. Vi skulle också kunna säga att detta berör faktorn omdöme.

Vi tolkar att författarna vill bygga bort den riskfaktor som finns i den starka frestelsen att luta sig mot intuitivt tänkande, och att man därför inte ska tänka alls när man väl fastställt sin formel. Vi förstår poängerna med en sådan basnivå eftersom den rensar bort osunda metoder, men tycker att det är otillfredsställande att inte sträva vidare utifrån det kunnande som finns. Detta kräver dock specialisering, expertis och professionalism vilket berör en annan kritik vi har mot resonemanget, att frågan om olika bedömares olika skicklighet helt faller bort. Genom att kategoriskt onödiggöra bedömaren, oavsett dennes skicklighet, så tror vi man gör testbolagen en större tjänst, än kunderna.

Testresultaten är inte i sig bedömningen, utan indikationer på ett fungerande som behöver analyseras till en större helhet. För det behövs en kvalificerad personbedömare, som tar det yttersta ansvaret för att integrera relevanta testdata mot bakgrund av en personlighetsteori. En förståelse behövs av individens relativt stabila fungerande, som vi kallar personlighet, och en matchning av denna mot befattningen. En förståelse av de specifika förhållandena i organisationen, som relationer, tyst kunskap med mera ökar ytterligare träffsäkerheten. Ibland är det enkelt – alla resultat går i samma riktning/har hög konvergens – och talar ett tydligt språk. Ibland är det svårt. Testresultaten överensstämmer inte utan kräver en fördjupad analys, eller de kandidater som ska bedömas har olika styrkor och riskområden, men ingen är 100 procent matchad till kontexten. Men detta är något som är ytterst svårt att skapa en formel omkring.

En optimal formel har minst en variabel för kontext, och en för faktorn personlighetsorganisation, eller mognad. Dit känns det långt. Vi menar att det inte finns någon bra ursäkt att inte använda sitt professionella omdöme även om detta inte är hundraprocentigt.

Oavkortad version Endast på Psykologtidningen.se 2013-10-13

Anders Sjöberg, Maria Åkerlund och Sara Henrysson Eidvall om tester:
”Alla metoder bör utvärderas i förhållande till målet”

”När det gäller tester och chefsurval finns i samtiden en tilltagande och alltmer högljudd argumentation som menar att statistik är tillförlitligare än det professionella omdömet”, skriver psykologerna Björn Sahlberg och Malin Holm (Psykologtidningen 6/2013).

Vi uppfattar att huvuddragen i debattinlägget är att det inte är bra att rangordna kandidater i en rekryteringsprocess med hjälp av formler som väger ihop flera olika testpoäng och att erfarenhet hos en professionell yrkesperson intar en central plats i personbedömningen.

Inom arbetspsykologin har under ett antal decennier funnits två skolor inom bedömning och urval. Den ena traditionen har kallats klinisk, holistisk eller individuell bedömning och den andra mekanisk, statistisk eller psykometrisk bedömning. Båda traditionerna vidhåller att data ska samlas in på ett strukturerat sätt. Det som skiljer är hur informationen sedan omvandlas till en rekommendation som leder till ett urvalsbeslut.
Författarna argumenterar för att den mekaniska metoden inte kan upptäcka patologiska lögnare eller rasister och att det som gäller för en grupp i
allmänhet inte med nödvändighet gäller för alla individer i gruppen.

Ett urvalsunderlag som endast innehåller en intelligenspoäng och fem personlighetspoäng (av Big 5-karaktär) kan naturligtvis inte upptäcka
patologiska lögnare eller rasister. Vi menar att alla metoder bör utvärderas i förhållande till det mål man har med dem. Om målet när man gör ett urval är att exempelvis bemanna en roll med den person som med så stor sannolikhet som möjligt kommer att göra det bästa jobbet bör man välja den säkraste metoden. Den som använder metoden bör kunna göras ansvarsskyldig, kunna redogöra för hur och med vilket stöd hon eller han
kommit fram till sin slutsats. Personligt ansvar och moral är i detta sammanhang förknippat med att vara tydlig med vad som bedöms, hur det vägs ihop och ligger till grund för ett beslut baserat på empiri.

Vår erfarenhet är att urvalsbedömare sällan görs ansvarsskyldiga och i princip aldrig avkrävs en redovisning av rationalen och forskningsstödet för sina metoder. Vi uppmanar kunder och andra intressenter att avkräva oss detta och göra oss ansvarsskyldiga!

SKRIBENT

2014-02-26

Malin Holm och Björn Sahlberg
Den kliniska bedömningen är central

Vi startade en debatt i Psykologtidningen mot den så kallade evidensbaserade urvalsmetoden för att vi utifrån lång erfarenhet av personbedömningar fann det svårsmält att bli betraktade som felkällor. Att hävda att den rent mekaniska urvalsmetoden är den mest vetenskapliga och bästa metoden för urval som psykologer kan erbjuda är i vår mening en extremt förenklad syn på vad som driver lönsamhet och framgång i organisationer, som ju består av människor. Det medför en stor risk för att urholka respekten för både psykologisk forskning och för den kompetens psykologer med en specialiserad kunskap och skicklighet i strukturerad personbedömning kan tillföra i både urval och utveckling.

För att lugna våra opponenter Sara Eidvall, Anders Sjögren och Maria Åkerlund vill vi först säga att det naturligtvis är viktigt att vissa faktorer på metanivå visat sig relaterade till framgång och lönsamhet hos individen. En strukturerad klinisk bedömning står inte i motsats till den typen av fakta, utan allt relevant integreras i bedömningen. Personlighet förstås som ett dynamiskt system av förmågor, drivkrafter, motivation och eventuella urspårningstendenser. Intervju, självskattningar och performancebaserade test av begåvning och personlighet ger alla relevanta data som är indikationer på ett fungerande. Målet är att inte bara beskriva gränserna för personens förmåga, utan även personens motivation att utföra uppgiften.

Ibland är det enkelt – alla resultat går i samma riktning/har hög konvergens. Beroende på skillnader i testers förmåga att mäta olika fenomen, varierar dock graden av konvergens i resultaten bland annat med grad av insikt och förmåga hos en person att beskriva sig själv. Det i sin tur är relaterat till grad av struktur och mognad i personligheten, vilket i sig är en högst önskvärd faktor att fånga i en personbedömning av lämplighet.

Även den forskare som väljer att studera människan utifrån vissa konstanta faktorer torde erkänna att människor kan beskrivas som dynamiska system som påverkar och påverkas av sin omgivning i interaktion, det vill säga något mycket mer komplext som kan behöva förstås och förklaras. I författarnas synsätt verkar förståelse ha liten eller ingen relevans. Härmed tappar man hela det humanistiska perspektivet och synen på människan blir minst sagt endimensionell.
Det intressanta ligger också ofta i det man inte förstår – i den okända variansen, relaterat till förmågan att uppfatta och märka det som avviker från det man trodde. Att undantagen är irrelevanta eftersom det enligt författarna inte finns ”anledning att inte vara nöjd med … ” deras egen mekaniska metod, är ett i vår mening knappast bevisat antagande.

Vad skapar mer lönsamhet för en organisation – att de flesta sannolikt är framgångsrika som individer eller att man inte gör allvarliga felrekryteringar? Det är en relevant fråga eftersom klinisk strukturerad bedömning är bättre på att identifiera de individer som är definitivt olämpliga, på grund av olika typer av underliggande problematik som oftast inte visar sig förrän under en tid eller under ökad press. Hogan och Kaiser (2005) anser att misslyckande snarare beror på oönskade kvalitéer än brist på önskade sådana. Jackson och Parry (2008) hävdar att studier av misslyckande i ledarskapet visat att emotionella aspekter av ledarskapet varit mer avgörande än kognitiva. En chef eller medarbetare med personlighetsstörning orsakar ofta med tiden organisationen stora kostnader och lidanden till exempel på grund av oförmåga att ta ansvar för sina brister och tillkortakommanden. Som en kund uttryckte det – ”It’s 1 % (av rekryterad personal) but it’s 50 % of our costs”.

Att enbart luta sig mot korrelationer i stora metastudier räcker inte heller som perspektiv. Kunskapen om det allmänna räcker inte för att ge ledning i det enskilda chefsurvalet. Inte minst tenderar kandidaterna på högre nivåer att samtliga scora ganska högt på den nu kända formeln som, vad än författarna säger är hypotetiskt möjligt, fortfarande inskränker sig till olika kombinationer av generell begåvning, samt C och E, och kanske lite av N-faktorn i 5-faktor modellen. Generellt vilar deras mekanik mycket tungt mot faktorn begåvning, men det är inte nödvändigtvis så att den högsta begåvningen gör en person lämpligast för alla typer av jobb. Till exempel har framgångsrika ledare en god allmän intelligens, dominans, självförtroende, känslomässig balans och kontroll, självständighet, kreativitet, ansvarskänsla, prestationsbehov och god social kompetens, och det är framför allt kombinationen av dessa egenskaper man har sett ha samband med framgång, inte varje enskild egenskap för sig (Thylefors, 2007).

Våra kunder förstår att det är många olika faktorer som driver framgång och lönsamhet i en organisation. Deras rekryteringar strävar efter att inte bara selektera, utan också integrera och påverka medarbetare in i organisationen som system, där individen skall tillföra ett värde men också interagera med organisationen till ett generera ett gemensamt högre värde. Vidare finns ambitioner med rekryteringarna att vara en del i en övergripande HR-strategi och en möjlighet till utveckling hos både den som får, och den som inte får tjänsten, och i den processen menar vi att psykologisk kunskap kan tillföra värde. Det behovs inga psykologer i den typ av urvalsbedömningar som Eidvall, Sjögren och Åkerlund förespråkar eftersom bedömningen görs helt mekaniskt. För dem är den enda meningsfulla psykologen i sammanhanget forskaren. Vi menar tvärt om att psykologer inte bör abdikera ifrån uppgiften att försöka förstå och förklara mänskliga system.

2014-04-08

Om testning och personlighetsbedömningar:
Mekanisk sammanvägning har högre validitet

I sitt senaste debattinlägg skriver Holm och Sahlberg att de ”fann det svårsmält att bli betraktade som felkällor”. Det är lätt att identifiera sig och sympatisera med den reflektionen. Icke desto mindre har vi att förhålla oss till den forskning som faktiskt finns och som vi i våra inlägg refererat till.

Kuncel et al. (2013) visar i sin metaanalys att mekanisk sammanvägning har högre prediktiv validitet än klinisk och att validiteten sjunker med 25 procent när vi gör kliniska sammanvägningar jämfört med när vi gör mekaniska. Om det stämmer går stora mänskliga värden förlorade med dessa 25 procent. Vi menar att om man inte tror att det stämmer behöver man visa var felen i forskningen finns. Det räcker inte att bara bortse ifrån den.

Detsamma gäller Nobelpristagaren Daniel Kahnemans och andras forskning om bedömning och beslutsfattande som förklarar varför och hur vi alla, även urvalsexperter, faktiskt är felkällor. Det räcker inte att hävda att psykologisk forskning har fel utan att precisera vari felen ligger om vi vill bidra till områdets utveckling.

Med detta vill vi för denna gång avsluta vår medverkan i debatten med Holm och Sahlberg. Vi skulle gärna se inlägg också från andra psykologer och ser fram emot att fortsätta diskussionen vid andra tillfällen och i andra fora. Vi tackar Holm och Sahlberg för deras engagerande inlägg och för att de genom att starta debatten skapade detta tillfälle till fördjupning i en angelägen fråga.

Facebooktwitterredditpinterestlinkedinmail