Persönlichkeitstests: Zustimmung von Bewerbern messen oder konkrete Antwort forcieren?

Zwei Antwortformate in der Personalauswahl und ihre Vor- und Nachteile


Für Persönlichkeitstests im Rahmen von Personalauswahlverfahren existieren unterschiedliche Antwortformate. Konventionelle Likertskalen, bei denen Bewerber für einzelne Aussagen den Grad ihrer Zustimmung angeben sollen, haben sich zum etablierten Standard entwickelt. Eine attraktive Alternative stellt das Forced-Choice-Format dar: Hier müssen Kandidaten pro Aufgabe mehrere Aussagen zur eigenen Persönlichkeit miteinander ins Verhältnis setzen. Wir stellen beide Antwortformate gegenüber, erklären wo die Vorteile der beiden Methoden liegen und worauf Sie achten müssen.

Das klassische Antwortformat: Aussagen und Likertskalen – „Wie sehr stimmen Sie zu?“

Im klassischen Antwortformat werden Kandidaten mit einzelnen Aussagen konfrontiert, zu denen sie angeben müssen, wie sehr diese auf sie zutreffen. Die Beurteilung erfolgt über Likertskalen mit Abstufungen, beispielsweise von 1 („trifft gar nicht zu“) bis 7 („trifft voll zu“).

Likertskalen kommen in nahezu allen Persönlichkeitstests zum Einsatz und sind einfach zu bearbeiten. Kritiker bemängeln jedoch deren Anfälligkeit für Messungenauigkeiten – einerseits durch den Effekt „sozialer Erwünschtheit“, andererseits durch persönliche Antworttendenzen. Das bedeutet, dass sich Kandidaten mit Hilfe von Antwortskalen einerseits positiver darstellen können, und dass es individuelle Unterschiede zwischen Menschen gibt, eher in Extremen zu antworten oder Antwortkategorien um den Mittelwert zu bevorzugen. Diese Umstände können Testergebnisse beeinflussen und erschweren so die Vergleichbarkeit der Kandidatenantworten. Auch wenn sich Persönlichkeitstests mit Likertskalen vielfach darin bewährt haben, beruflichen Erfolg vorherzusagen, weisen die Stimmen der Kritiker auf ein mögliches Verbesserungspotenzial hin.   

Das Forced-Choice-Format – „Welche Aussage trifft eher auf Sie zu?“

Anders als bei den klassischen Likertskalen müssen Bewerber im Forced-Choice-Format nicht einzelne Aussagen beurteilen, sondern zwei oder mehrere Aussagen im Verhältnis zueinander bewerten. Die Anweisung lautet dann beispielsweise: „Bilden Sie eine Rangreihe“. 


Das Forced-Choice-Format fordert die Kandidaten dazu auf, sich intensiver mit den gestellten Aussagen auseinanderzusetzen, die ihre Persönlichkeit betreffen. So müssen Bewerber zum Beispiel reflektieren, ob es ihnen im Beruf wichtiger ist, sich mit Kollegen gut zu verstehen oder immer Höchstleistungen zu erbringen. Wie das Beispiel verdeutlicht, ist es auch im Forced-Choice-Format möglich, mehrere Merkmale (Persönlichkeitseigenschaften, im Beispiel: Verträglichkeit und Emotionale Stabilität) innerhalb einer Aufgabe zu testen, indem die Aussagen miteinander kombiniert werden.Ein zentraler Vorteil des Forced-Choice-Formats: Es ist nicht möglich, sich frei von jeglichen Makeln zu präsentieren, wie es zum Beispiel manche Bewerbungsratgeber empfehlen. Im Beispiel: Eine unattraktive Aussage zur Eigenschaft „Emotionale Stabilität“ (‘Ich fühle mich schnell bedroht’) und eine Aussage zur „Verträglichkeit“ (‘Ich interessiere mich nicht für die Probleme anderer’) werden in einer Aufgabe gemeinsam präsentiert. Statt in einer Bewerbungssituation beide Aussagen auf einer Likertskala niedrig zu bewerten, muss der Kandidat nun eine Auswahl treffen, welche Verhaltensweise bei ihm eher zutrifft – eine Information, die für Recruiter von großem Interesse ist. Folglich kann überzogene Selbstdarstellung reduziert werden, da Bewerber damit konfrontiert werden, mehrere Aussagen gegeneinander abzuwägen und eine konkrete Rangreihe zu bilden. Mögliche Verzerrungen durch Antworttendenzen innerhalb der Likertskalen erübrigen sich im Forced-Choice-Format vollständig. 

Anstrengung und Akzeptanz bei Bewerbern: Lieber per Skala oder Forced Choice antworten?

Natürlich gibt es auch Kritik am Forced-Choice-Format. So stellt sich in der Praxis die Frage, ob es für Bewerber unverhältnismäßig anstrengend ist, sich in einem Testverfahren derart intensiv mit persönlichkeitsbezogenen Aussagen auseinandersetzen zu müssen. Sicherlich ist es einfacher, einzelne Aussagen zu bewerten als mehrere Aussagen gegeneinander abzuwägen. Gleichzeitig können Bewerber beim Forced-Choice-Format keine unattraktiven Aussagen vermeiden, indem sie sie schlicht niedrig bewerten – das nährt die Sorge von Unternehmen, dass Bewerber den Test nicht akzeptieren und abspringen, bevor Recruiter die Gelegenheit bekommen, sie kennenzulernen. Um die tatsächliche Akzeptanz oder Ablehnung der Bewerber zu messen, haben wir in einer Studie dieselben Aussagen einmal im Forced-Choice-Format und einmal mit Likertskalen vorgelegt. Das Ergebnis: Die Unterschiede in der Akzeptanz waren unerheblich. Dieses Ergebnis wird auch im Realeinsatz bei einem DAX-30-Kunden bestätigt – dort absolvieren über 95% der eingeladenen Kandidaten den Test. Auch bezogen auf die kognitive Anstrengung der Testteilnehmer haben Studien ergeben, dass drei gleichzeitig zu bewertende Aussagen innerhalb einer Aufgabe angemessen sind und einen zumutbaren Test mit validen und reliablen Ergebnissen liefern. 

Der Schein kann trügen

Bei Forced-Choice-Tests lohnt es sich, genau hinzusehen. Während das Format keineswegs neu ist und in einer Vielzahl an Tests für den Arbeits- und Organisationskontext Anwendung findet, können die Ergebnisse erst seit neuesten statistischen Entwicklungen der letzten Jahre überhaupt für den direkten Vergleich unterschiedlicher Personen genutzt werden. Über diese gravierende Schwäche sehen viele Testanbieter gerne hinweg. Statt der verbreiteten konventionellen Methoden der klassischen Testtheorie kommt das komplexere Thurstonian IRT Model zum Einsatz, was eine adäquate Analyse sicherstellt.

Ergebnisinterpretation: Schwerer oder einfacher? 

Während die Testentwicklung und Auswertung erheblich höhere Anforderungen an den Testanbieter stellt, bleibt die Ergebnisinterpretation von Forced-Choice Tests auf Recruiter-Seite genauso wie bei konventionellen Fragebögen. Testergebnisse werden ebenfalls auf der Z-Skala ausgegeben und können einfach miteinander verglichen bzw. zu einem Gesamtwert verrechnet werden.  

Klassische Antwortskalen vs. Forced-Choice-Format: Was ist denn nun besser? 

Beide Antwortformate genügen den wissenschaftlichen Ansprüchen der Eignungsdiagnostik und erzielen fundierte Ergebnisse, auf deren Basis Sie die richtigen Personalentscheidungen treffen können. Es gilt also für Sie als Recruiter, die jeweiligen Vor- und Nachteile beider Formate individuell abzuwägen, um zu entscheiden. Likertskalen sind der etablierte Standard und einfach zu bearbeiten. Unterschiedliche Skalen lassen sich einfach kombinieren und eine individuelle Normierung an Ihrer Stichprobe ist auch bei geringem Bewerberaufkommen möglich. Forced-Choice-Tests erfordern für individuelle Normierungen größere Fallzahlen (N>400, davor kann auf unsere umfangreichen Normdatenbanken zurückgegriffen werden) und aktuell stehen nur die fünf zentralen Faktoren der Persönlichkeit in diesem Format zur Verfügung. Das Potenzial, soziale Erwünschtheit und Antwortverzerrungen zu reduzieren, liegt jedoch auf der Hand. Natürlich können Sie auch eine Mischung beider Formate einsetzen, um die Abwechslung bei der Testbearbeitung zu erhöhen und sich die Vorteile beider Formate sichern. Wir beraten Sie dabei gerne. 

Alle Artikel zu den Themen:

Lassen Sie uns reden

+ 49 (711) 48 60 20 10