Reliabilität, Objektivität und Validität

Was ein wissenschaftlicher Test können muss


Wissenschaftlich fundierte, psychologische Testverfahren für die Personalauswahl sollen den beruflichen Erfolg von Bewerbern für eine offene Stelle so präzise wie möglich voraussagen. Das tun sie nur dann, wenn die Ergebnisse unabhängig, verlässlich und außerdem gültig für den jeweiligen Beruf sind. Wir haben die Gütekriterien wissenschaftlicher Tests für Sie zusammengefasst.

Objektivität: Unabhängige Ergebnisse, unbeeinflusst von äusseren Bedingungen

Objektivität ist eines der drei Hauptgütekriterien, die ein wissenschaftlicher Test erfüllen muss. Ein wissenschaftlicher Test ist dann objektiv, wenn keine äußeren Rahmen- oder Randbedingungen das Verfahren und dessen Auswertung beeinflussen.

Computergestützte standardisierte Tests, in denen die Antworten Ihrer Bewerber automatisch in den entsprechenden Testwert überführt werden, erreichen eine extrem hohe Objektivität.

Zum Vergleich: Früher fanden solche Testverfahren mit Stift und Papier statt; die Testleiter mussten anschließend alle Ergebnisse aufwändig auswerten – ein fehleranfälliger Prozess, der heute durch webbasierte Testverfahren mit höchster Objektivität vollständig abgelöst werden kann.

Zudem funktionieren webbasierte Auswahlverfahren unabhängig von demografischen Informationen (zum Beispiel Geschlecht oder Ethnizität). Auf diese Weise ist eine webbasierte Vorauswahl durch Testverfahren nachweislich fairer als eine Vorauswahl mit Bewerberunterlagen – ein Prozess, der, wie Studien zeigen, als besonders anfällig für die Benachteiligung von Minoritäten gelten kann.

Reliabilität: durchgängig verlässliche Ergebnisse - auch bei Fehleingaben

Wenn ein Test reliabel ist, verfügt er über eine hohe Messgenauigkeit. Um die Reliabilität der Ergebnisse sicherzustellen, werden dem Bewerber pro abgefragtem Merkmal mehrere, relativ ähnliche Fragen oder Aufgaben (Items) gestellt, die sich später zu einer umfassenden Beschreibung verdichten lassen – die Menge der Fragen stellt sicher, dass jedes Merkmal in seiner Gänze erhoben wurde. Dies führt in der Praxis bisweilen zu einer empfundenen Redundanz der Testaufgaben, ist allerdings nötig, um Zufallseinflüsse zu minimieren.

Gleichzeitig müssen die entwickelten Fragestellungen von Merkmal zu Merkmal klar voneinander abgegrenzt sein, um ungenaue Aussagen und Überschneidungen unterschiedlicher Testdimensionen zu vermeiden. Ansonsten wäre es unmöglich, ein differenziertes Kandidatenprofil auszugeben. 

Wie hoch die Verlässlichkeit eines Testergebnisses ist, zeigt Ihnen der sogenannte Reliabilitätskoeffizient.

Er ist ein testübergreifend gültiger Maßstab, der zwischen -1 und 1 liegt. Bei der Untersuchung der Reliabilität eines Tests gibt dieser Wert Auskunft darüber, wie hoch die einzelnen Testaufgaben miteinander im Zusammenhang stehen – je höher der Reliabilitätskoeffizient, desto genauer und spezifischer ist der Test. Ein geringer Reliabilitätskoeffizient zeigt hingegen an, dass die einzelnen Antworten eine vergleichsweise geringe Ähnlichkeit der Antwortmuster aufweisen; entsprechend anfälliger ist ein Test dann für Fehlinterpretationen. Je reliabler der Test, desto genauer fasst er die gemessene Eigenschaft eines Kandidaten – Sie als Personalentscheider erhalten ein verlässliches Ergebnis, das Ihnen die Entscheidung absichert.

Reliabilität bedeutet damit auch, dass ein wissenschaftliches Testverfahren so konzipiert ist, dass selbst bei einzelnen Fehleingaben noch eine belastbare Aussage zum jeweiligen Wert getroffen werden kann.

Ein Beispiel: Kreuzt ein Bewerber bei einer von zehn Fragen zu seiner Leistungsmotivation versehentlich die falsche Antwort an, weil er aufgeregt ist, gibt der Test trotzdem eine verlässliche Auskunft darüber, ob der Bewerber als hinreichend motiviert gelten kann.

Die erhobenen Ergebnisse sind bei reliablen Tests verlässlich und würden bei einer Wiederholung des Tests unter gleichen Bedingungen auch sehr ähnlich ausfallen.

Dieses Qualitätskriterium ist deshalb bedeutsam, weil nur so eine langfristige Gültigkeit des Testresultats unterstellt werden kann – eine zentrale Voraussetzung, um Personalentscheidungen auf Testergebnissen zu begründen.

Validität: Gültige Aussagen mit hoher Vorhersagekraft

Die Validität eines Testverfahrens zeigt an, dass der Test tatsächlich die spätere Arbeitsleistung vorhersagt, die für den jeweiligen Beruf als relevant definiert wurden – die Testergebnisse sagen das voraus, was sie voraussagen sollen.

Der erste Schritt zu einem validen Testverfahren ist demnach die Frage nach dem „Was“: Was wollen Sie messen? Durch eine Anforderungsanalyse in Ihrem Unternehmen wird vorab festgelegt, welche Kriterien ein Bewerber für eine bestimmte Stelle erfüllen muss – was also die zentralen Aspekte für den beruflichen Erfolg eines Kandidaten sind, die vorhergesagt werden sollen. Aus den Ergebnissen der Anforderungsanalyse legen wir die Inhalte der Testverfahren fest. Anschließend folgt die Frage nach dem „Wie?“: Wie misst man Anforderung A, B und C?

Zentral ist der Einsatz von Testverfahren, die eine sogenannte prognostische Validität besitzen, das heißt einen statistisch signifikanten Zusammenhang mit einem relevanten Leistungskritierium aufweisen (zum Beispiel einer Vorgesetzteneinschätzung oder Kundenzufriedenheitswerte).

Darüber hinaus sollten möglichst passende Verfahren verwendet werden. Ein Beispiel: Für IT-Berufe zählen numerische Fähigkeiten und logisches Denken zu den wichtigsten Anforderungen. Die Kandidaten erhalten in ihrem Test deshalb Intelligenzaufgaben, die unter anderem numerische und figurale Inhalte umfassen. Dazu gehören beispielsweise Zahlenreihen und Matrizen – die inhaltliche Validität für diese beiden Merkmale ist damit erfüllt. Eine reine Fokussierung auf die schriftliche Ausdrucksfähigkeit wäre hier nicht zielführend, kann aber durchaus Teil der Diagnose sein, wenn zusätzliche Projektmanagement- oder Führungsaufgaben gestellt werden. Die Validität eines Tests ist somit immer abhängig von der Frage, was vorhergesagt werden soll – die Methode der Datenerhebung wird jeweils auf vorliegenden Anforderungen der Stelle hin abgestimmt. Auf diese Weise können auch Anforderungskriterien berücksichtigt werden, die weniger mit dem Job selbst als mit seinen Randbedingungen zu tun haben. So können beispielsweise Merkmale wie eine hohe Offenheit für neue Erfahrungen als zusätzliche Anforderung definiert werden, um vorherzusagen, ob die Person auch an Standorten im Ausland erfolgreich sein wird.

Der Test für den Test

Um die Qualität unserer wissenschaftlichen Testverfahren kontinuierlich zu verbessern, führen wir bei HR Diagnostics regelmäßige Evaluationsstudien durch. Gemeinsam mit unseren Kunden prüfen wir unter anderem, inwieweit die Voraussagen der Tests für beruflichen Erfolg mit der Realität übereinstimmen – ob also beispielsweise das hohe Testergebnis eines Bewerbers tatsächlich mit einer hohen Leistung im Beruf einhergeht. Dies kann in der Rückschau erfolgen oder vor der Projekteinführung, indem bereits eingestellte Kandidaten den Test durchführen und die Resultate mit den vorliegenden Leistungsdaten abgeglichen werden.

Auch die strategische Ausrichtung eines Unternehmens kann so berücksichtigt werden: Der Wunsch nach einem neuen Führungsstil, einer innovativeren Ausrichtung oder der Wechsel von reiner Vertriebs- zur Kundenorientierung verändern sowohl ein Unternehmen als auch die Anforderungen an zukünftige Mitarbeiter. Wir haben diese Entwicklungen im Blick und passen unsere Testverfahren an Ihre Unternehmensstrategie an – nach wissenschaftlichen Gütekriterien.


Alle Artikel zu den Themen:

Lassen Sie uns reden

+ 49 (711) 48 60 20 10