Klassische Testtheorie

Klassische Testtheorie

Ein Test ist a wissenschaftliches Instrument In dem Maße, in dem es misst, was es beabsichtigt, das heißt, es ist gültig und es ist gut misst, das heißt, es ist notwendig oder zuverlässig. Wenn wir ein Instrument finden, dem wir den von ihnen vorgelegten Maßnahmen nicht vertrauen können, da sie von einmal zu einem anderen variieren, wenn wir dasselbe Objekt messen, werden wir sagen, dass es nicht zuverlässig ist. Ein Instrument, um zu messen korrekt Etwas, es muss genau sein, denn wenn nicht, messen Sie, welche Maßnahme es schlecht misst. Daher ist es notwendig, notwendig zu sein, aber nicht ausreichend Zustand. Darüber hinaus muss es gültig sein, dh, welche Maßnahmen mit Präzision sein sollen, was zu messen ist, und sonst nichts.

Sie können auch interessiert sein: Elementantworttheorie - Anwendungen und Tests

Zuverlässigkeit:

Absolute und relative Zuverlässigkeit: Wir können das Problem der Zuverlässigkeit eines Tests auf zwei verschiedene Arten angehen, wenn auch im zufälligen Hintergrund.

Zuverlässigkeit als Ungenauigkeit seiner Maßnahmen: Wenn ein Subjekt auf einen Test reagiert. Wenn es keinen Fehler gäbe, würde das Thema seine wahre Punktzahl bekommen. Der Test ist ungenau, da die empirische Punktzahl nicht mit der authentischen echten Punktzahl übereinstimmt. Dieser Unterschied zwischen beiden Bewertungen ist der Beispielfehler, der Messfehler. Er Typischer Messfehler Sei Die typische Abweichung von Messfehlern. Er Typischer Messfehler Zeigt die absolute Genauigkeit des Tests an, da es ermöglicht, die Differenz zwischen der erhaltenen Maßnahme und der zu erhalten, die erhalten wird, wenn es keinen Fehler gäbe.

Zuverlässigkeit als Stabilität der Maßnahmen: Ein Test ist zuverlässiger, je konstaner oder stabiler die Ergebnisse, die sie bei der Wiederholung liefern. Je stabiler die Ergebnisse doppelt sind, desto größer ist die Korrelation zwischen ihnen. Diese Korrelation heißt Zuverlässigkeitskoeffizient. Dies drückt uns nicht die Fehlermenge aus, sondern die Kohärenz des Tests selbst und den Nachweis der von ihm angebotenen Informationen. Er Zuverlässigkeitskoeffizient drückt die relative Zuverlässigkeit des Tests aus.

Der Zuverlässigkeitskoeffizient und der Zuverlässigkeitsindex: - Der Zuverlässigkeitskoeffizient eines Tests ist die Korrelation des Tests selbst, der zum Beispiel in zwei parallelen Formen erhalten wurde: RXX. - Der Präzisionsindex Es ist die Korrelation zwischen den empirischen Bewertungen eines Tests und seinen wahren Bewertungen: RXV Der Präzisionsindex ist immer größer als der Zuverlässigkeitskoeffizient, um herauszufinden, dass der Zuverlässigkeitskoeffizient diese drei klassischen Methoden hervorhebt:

  • Finden Sie die Korrelation zwischen dem Test und seiner Wiederholung: die Wiederholungsmethode oder die Test-Retest. Diese Korrelation ist der Zuverlässigkeitskoeffizient. Diese Methode ergibt normalerweise einen höheren Zuverlässigkeitskoeffizienten als diejenigen, die durch andere Verfahren erhalten wurden, und kann durch die störenden Faktoren kontaminiert werden.
  • Ermitteln Sie die Korrelation zwischen zwei parallelen Formen des Tests: die Methode parallel. Die Korrelation zwischen den beiden Formen ist der Zuverlässigkeitskoeffizient. Bei dieser Methode wird der gleiche Test nicht wiederholt, die störenden Quellen der Wiederverkehrszuverlässigkeit werden vermieden.
  • Finden Sie die Korrelation zwischen zwei parallelen Hälften des Tests: die Methode der beiden Hälften: Der Test wird in zwei äquivalente Hälften unterteilt und die Korrelation zwischen ihnen wird gefunden. Es ist die bevorzugte Methode, da sie einfach ist und die Einschränkungen der vorherigen Verfahren vermeidet. Sie können die merkwürdigen Elemente des Tests auswählen, um eine Hälfte und die sogar Elemente zu bilden, um die andere zu bilden.

Der Zuverlässigkeitskoeffizient und die Korrelation zwischen parallelen Tests

Er Zuverlässigkeitskoeffizient eines Tests gibt den Anteil an, dass die wahre Varianz der empirischen Varianz ist: Graph33 Der Zuverlässigkeitskoeffizient eines Tests variiert zwischen 0 und 1 . Zum Beispiel: Wenn die Korrelation zwischen zwei parallelen Tests Rxx´ = 0'80 beträgt, bedeutet dies, dass 80% der Varianz des Tests auf die authentische Maßnahme und den Rest zurückzuführen sind, dh 20% der Varianz der Varianz der Der Test ist auf Fehler zurückzuführen. Er Zuverlässigkeitsindex Ein Test ist die Korrelation zwischen seinen empirischen Bewertungen und seinen trugen Bewertungsindex -Zuverlässigkeit = Der Zuverlässigkeitsindex ist gleich der Quadratwurzel des Zuverlässigkeitskoeffizienten

Sobald zwei parallele Formen eines Tests ausgearbeitet wurden. Wenn die Abweichungen homogen sind, ist der Unterschied zwischen den Strümpfen nicht signifikant und die beiden Formen werden mit der gleichen Anzahl von Elementen desselben Typs und des gleichen psychologischen Inhalts gebaut, kann bestätigt werden, dass sie parallel sind. Wenn nicht, müssen Sie sie reformieren, bis sie es sind. Das Fehlen von Zuverlässigkeit wird mit dem Wert rxx´ = 0 4 identifiziert.- Der typische Messfehler: Der Unterschied zwischen empirischer und wahrer Bewertung ist der zufällige Fehler, der als Messfehler bezeichnet wird. Die typische Abweichung von Messfehlern wird als typischer Messfehler bezeichnet. Er Typischer Messfehler Ermöglicht Schätzungen über die absolute Zuverlässigkeit des Tests, dh Schätzung der Schätzung, wie viel Messfehler eine Punktzahl beeinflusst.

Zuverlässigkeit und Länge: Die Länge des Tests bezieht sich auf die Anzahl seiner Elemente. Diese Länge hängt von Ihrer Zuverlässigkeit ab. Wenn ein Test aus drei Elementen besteht, kann ein Subjekt eine Punktzahl von 1 und eine andere oder in paralleler Form erhalten, eine Punktzahl von

Von einer Gelegenheit zum anderen hat die Punktzahl einen Punkt variiert; Ein Punkt über drei ist eine Variation von 33%, eine hohe Variation. Wenn die Probanden zufällige Variationen dieser Art erhalten, ist die Korrelation des Tests selbst oder die der beiden parallelen Formen des Tests stark reduziert und kann nicht hoch sein. Wenn der Test viel länger ist, kann ein Subjekt beispielsweise 100 Elemente beispielsweise 70 Punkte und 67 in paralleler Form erhalten. Wieder hat es 3 Punkte variiert; Es ist eine relativ geringe Varianz in Bezug auf den Gesamttest, insbesondere 3%. Diese kleinen lässigen Veränderungen dieser Größenordnung, die bei den Probanden der Probanden auftreten, sind relativ unwichtig und nehmen nicht so stark ab wie vor der Korrelation zwischen den beiden.

Der Zuverlässigkeitskoeffizient ist viel größer als im vorherigen Fall. Die Spearman-Brown-Gleichung drückt die Beziehung zwischen Zuverlässigkeit und Länge aus. Die Genauigkeit eines Tests ist ungültig, wenn die Länge 0 beträgt, und er steigt mit zunehmender Länge. Obwohl der Anstieg relativ niedriger ist, da die Länge größer ist. Dies bedeutet, dass Präzision zu Beginn und relativ weniger danach viel wächst. Wenn die Länge der Unendlichkeit tendiert, tendiert der Zuverlässigkeitskoeffizient dazu

Durch Erhöhen der Länge eines Tests steigt die Präzision, da die tatsächliche Varianz mit höherer Geschwindigkeit zunimmt als die Fehlervarianz. Dies bedeutet, dass die Genauigkeit des Tests zunimmt, da der Varianzanteil aufgrund des Fehlers abnimmt. Die Rulon -Formel sowie die Flanagan- und Guttman -Formel sind besonders anwendbar, wenn der Zuverlässigkeitskoeffizient von den beiden Hälften berechnet wird. Dies sind Formeln, die zur Berechnung des Zuverlässigkeitskoeffizienten verwendet werden.

Zuverlässigkeit und Konsistenz: Der Zuverlässigkeitskoeffizient kann auch auf andere Weise gefunden werden, es ist der sogenannte SO Alpha -Koeffizient entweder Generalisierbarkeit oder Repräsentativitätskoeffizient (Cronbach). Dieser Alpha -Koeffizient zeigt die Genauigkeit an, mit der einige Elemente einen Aspekt der Persönlichkeit oder des Verhaltens messen. Es kann interpretiert werden als: eine Schätzung der durchschnittlichen Korrelation aller möglichen Elemente in einem bestimmten Aspekt. Ein Maß für die Genauigkeit des Tests basierend auf seiner Kohärenz oder internen Konsistenz (Wechselbeziehung zwischen seinen Elementen; inwieweit die Elemente des Tests gleich messen) und seiner Länge). Angeben der Repräsentativität des Tests, dh der Menge, in der die Stichprobe von Elementen, die es bestehen. Er Alpha -Koeffizient Spiegelt hauptsächlich zwei grundlegende Konzepte in der Präzision eines Tests wider: 1. Die Wechselbeziehung zwischen seinen Elementen: das Ausmaß, in dem jeder das Gleiche gut misst.

Die Länge des Tests: Durch Erhöhen der Anzahl der Fälle einer Stichprobe und wenn systematische Fehler beseitigt werden, repräsentiert die Stichprobe besser die extrahierte Population und es ist unwahrscheinlicher, dass sie den Freizeitfehler eingreifen wird. Wenn die Testelemente Dichotomik sind (Ja oder Nein, 1 oder 0, Übereinstimmung oder Meinungsverschiedenheiten usw.), wird die Alpha -Koeffizientengleichung vereinfacht und entsteht die Gleichungen von von Kuder-Richardson (KR20 und KR21). Bei einer bestimmten Anzahl von Elementen ist ein Test umso zuverlässiger, desto homogener ist es. Der Alpha -Koeffizient zeigt die Zuverlässigkeit an, sobald er Homogenität und Kohärenz oder interne Konsistenz der Elemente eines Tests darstellt.

Zuverlässigkeitsstandards und Kriterien

Gemäß dem Gegenstandsprobenraummodell besteht das Ziel des Tests darin, die Maßnahme zu schätzen, die erhalten wird, wenn alle Elemente des Probenraums verwendet würden. Diese Maßnahme wäre die wahre Punktzahl, der sich die realen Maßnahmen mehr oder weniger nähern. Nach dem Grad, in dem eine Stichprobe von Elementen mit echten Bewertungen korreliert, ist der Test mehr oder weniger zuverlässig. In diesem Modell ist die Korrelationsmatrix zwischen allen Elementen des Probenraums zentral.Dieses Beispielmodell besteht direkter auf interne Konsistenz und in dem Maße, in dem es es erreicht, garantiert es indirekt die Stabilität.

Das lineare Modell der parallelen Tests besteht mehr auf der Stabilität der Bewertungen und in dem Maße, in dem es die Stabilität erreicht, bevorzugt die indirekte Konsistenz indirekt. Wenn wir einen Test anwenden, um einzelne Diagnosen und Prognosen festzulegen, muss der Zuverlässigkeitskoeffizient 0,90 hoch sein. In kollektiven Prognosen und Klassifizierungen ist die Nachfrage nicht so.

Manchmal ist es in einer bestimmten Art von Tests wie Persönlichkeit schwierig, Koeffizienten von mehr als 0'70 zu erreichen. Wenn parallele Formen oder parallele Hälften angewendet werden, können Casualfehler nach mehr oder weniger großer Intervall zahlreicher sein als solche, die den Alpha -Koeffizienten beeinflussen. Dies liegt daran das kann sich in zahlreichen Details unterscheiden. Daher ist der Alpha -Koeffizient normalerweise größer als die anderen Koeffizienten.

Mit Ausnahme des durch Wiederholung desselben Tests gefundenen Koeffizienten, da es wahrscheinlicher ist. Es muss sichergestellt werden, dass die zweite Anwendung völlig unabhängig von der ersten ist. Wenn wir dies erreichen, ist dies die einfachste und wirtschaftlichste und ratsamste Methode, wenn Sie versuchen, die Stabilität der Bewertungen zu schätzen, insbesondere über lange Zeiträume und mit komplexen Tests. > Weiter: Gültigkeit der Tests

Dieser Artikel ist lediglich informativ. In der Psychologie-Online haben wir keine Befugnis, eine Diagnose zu stellen oder eine Behandlung zu empfehlen. Wir laden Sie ein, zu einem Psychologen zu gehen, um Ihren speziellen Fall zu behandeln.

Wenn Sie mehr Artikel ähneln möchten wie Klassische Testtheorie, Wir empfehlen Ihnen, unsere Kategorie der experimentellen Psychologie einzugeben.