Validità di un test: 6 tipi

I seguenti sei tipi di validità sono comunemente in uso vale a dire. Validità del volto, Validità del contenuto, Validità predittiva, Validità concomitante, Construct e Fattoriale. Di questi, il contenuto, la validità predittiva, concorrente e costruttiva sono quelli importanti usati nel campo della psicologia e dell'educazione.

Questi sono discussi di seguito:

Tipo # 1 Validità viso:

Validità del viso nella misura in cui il test sembra misurare ciò che deve essere misurato.

La validità del viso si riferisce a se un test sembra essere valido o meno, cioè dall'aspetto esterno se gli elementi sembrano misurare l'aspetto richiesto o meno. Se un test misura ciò che l'autore del test desidera misurare, noi diciamo che il test ha validità. Pertanto, la validità del volto non si riferisce a ciò che il test misura, ma a ciò che il test "sembra misurare". Il contenuto del test non dovrebbe ovviamente sembrare inappropriato, irrilevante.

Ad esempio, un test per misurare "Abilità in aggiunta" dovrebbe contenere solo oggetti aggiunti. Quando si passa attraverso gli oggetti e si sente che tutti gli elementi sembrano misurare l'abilità in aggiunta, allora si può dire che il test è convalidato dalla faccia.

Sebbene non sia un metodo efficiente per valutare la validità di un test e in quanto tale non viene solitamente utilizzato ancora, esso può essere utilizzato come primo passo nella convalida del test. Una volta che il test è stato convalidato a faccia, possiamo procedere ulteriormente al calcolo del coefficiente di validità.

Inoltre, questo metodo aiuta un test maker a rivedere gli elementi del test in base allo scopo. Quando un test deve essere costruito rapidamente o quando c'è un bisogno urgente di un test e non c'è il tempo o la possibilità di determinare la validità con altri metodi efficienti, è possibile determinare la validità del volto.

Questo tipo di validità non è adeguato in quanto opera a livello del viso e quindi può essere utilizzato come ultima risorsa.

Digitare # 2. Validità del contenuto:

Contenuto Validità un processo di abbinamento degli elementi di prova con gli obiettivi didattici.

La validità del contenuto è il criterio più importante per l'utilità di un test, in particolare di un test di rendimento. È anche chiamato Rational Validity o Logical Validity o Curricular Validity o Internal Validity o Intrinsic Validity.

La validità del contenuto si riferisce al grado o all'estensione a cui un test consiste di elementi che rappresentano i comportamenti che il test maker desidera misurare. La misura in cui gli elementi di un test sono veri rappresentativi dell'intero contenuto e gli obiettivi dell'insegnamento si chiama validità del contenuto del test.

La validità del contenuto viene stimata valutando la pertinenza degli elementi del test; cioè gli elementi di prova devono coprire adeguatamente tutto il contenuto e le aree comportamentali del tratto da misurare. Dà l'idea di materia o cambiamenti nel comportamento.

In questo modo, la validità del contenuto si riferisce alla misura in cui un test contiene elementi che rappresentano il comportamento che stiamo per misurare. Gli elementi del test dovrebbero includere tutte le caratteristiche rilevanti dell'intera area del contenuto e gli obiettivi nella giusta proporzione.

Prima di costruire il test, il test maker prepara una tabella bidirezionale di contenuti e obiettivi, popolarmente conosciuta come "Tabella delle specifiche".

Supponiamo che un test di successo in Matematica sia preparato. Deve contenere elementi di Algebra, Aritmetica, Geometria, Mensurizzazione e Trigonometria e inoltre gli item devono misurare i diversi obiettivi comportamentali come la conoscenza, la comprensione, l'abilità, l'applicazione, ecc. Pertanto è imperativo dare il giusto peso a diversi contenuti e obiettivi.

Un esempio di "tabella delle specifiche" in Matematica è mostrato nella seguente tabella:

La tabella riflette il campione di compiti di apprendimento da misurare. Più gli articoli di prova si avvicinano al campione specificato, maggiore è la possibilità di avere una validità soddisfacente del contenuto. Pertanto, è auspicabile che gli elementi di un test vengano sottoposti a screening da un team di esperti. Dovrebbero controllare se il posizionamento dei vari elementi nelle celle della tabella è appropriato e se tutte le celle della tabella hanno un numero adeguato di elementi.

L'adeguatezza deve essere valutata in base al peso attribuito alla diversa tabella dei contenuti per obiettivo in base al gruppo di esperti che hanno progettato il curriculum.

Di seguito sono riportati alcuni punti generali per garantire la validità del contenuto:

1. Il test dovrebbe servire il livello richiesto di studenti, né al di sopra né al di sotto del loro standard.

2. La lingua dovrebbe essere al livello degli studenti.

3. Tutto ciò che non è nel curriculum non dovrebbe essere incluso negli articoli di prova.

4. A ciascuna parte del curriculum dovrebbe essere attribuito il peso necessario. Più elementi dovrebbero essere selezionati da parti più importanti del curriculum.

limitazioni:

1. La ponderazione da assegnare a parti diverse del contenuto è soggettiva.

2. È difficile costruire la prova oggettiva perfetta.

3. La validità del contenuto non è sufficiente o adeguata per i test di Intelligenza, Achievement, Attitude e in una certa misura test di Personalità.

4. Il peso attribuito al diverso cambiamento di comportamento non è obiettivo.

Tipo n. 3. Validità predittiva:

Validità predittiva in che misura il test predice le prestazioni future degli studenti.

La validità predittiva riguarda la capacità predittiva di un test. Indica l'efficacia di un test nella previsione o nella previsione di esiti futuri in un'area specifica. L'utente del test desidera prevedere le prestazioni future di un individuo. I punteggi dei test possono essere utilizzati per prevedere il comportamento o le prestazioni future e quindi denominati come validità predittiva.

Per trovare la validità predittiva, il tester correla i punteggi dei test con le prestazioni successive del soggetto, tecnicamente noto come "criterio". Il criterio è una misura indipendente, esterna e diretta di ciò che il test è progettato per prevedere o misurare. Quindi, è anche noto come "Validità relativa al criterio".

La validità predittiva o empirica è stata definita da Cureton (1965) come una stima del coefficiente di correlazione tra i punteggi del test e il vero criterio.

Un esempio può chiarire meglio il concetto.

Esempio:

Il test di ammissione medica è costruito e amministrato per selezionare il candidato per l'ammissione ai corsi MBBS. Basandoci sui punteggi fatti dai candidati su questo test, ammettiamo i candidati.

Dopo il completamento del corso vengono visualizzati all'esame MBBS finale. Il punteggio dell'esame MBBS finale è il criterio. I punteggi del test d'ingresso e dell'esame finale (criterio) sono correlati. L'alta correlazione implica un'elevata validità predittiva.

Esempi simili come altri test di assunzione o test di ingresso in agricoltura, ingegneria, attività bancarie, ferrovie ecc. Potrebbero essere citati qui che devono avere un'elevata validità predittiva.

Questo significa che i test utilizzati per il reclutamento, la classificazione e l'esame di ammissione devono avere una validità predittiva elevata. Questo tipo di validità viene talvolta indicato come "validità empirica" ​​o "validità statistica" poiché la nostra valutazione è principalmente empirica e statistica.

Limitazione:

Se otteniamo una misura di criterio adatta con cui i nostri risultati del test devono essere correlati, possiamo determinare la validità predittiva di un test. Ma è molto difficile ottenere un buon criterio. Inoltre, potremmo non avere misure di criterio per tutti i tipi di test psicologici.

Tipo # 4 Validità concorrente:

Validità concorrente correlando i punteggi del test con un altro insieme di punteggi dei criteri.

La validità concorrente si riferisce alla misura in cui i punteggi dei test corrispondono a prestazioni già stabilite o accettate, note come criterio. Per conoscere la validità di un test di nuova costruzione, è correlato o confrontato con alcune informazioni disponibili.

Pertanto un test è convalidato rispetto ad alcune informazioni disponibili contemporaneamente. I punteggi ottenuti da un test di nuova costruzione sono correlati con le prestazioni prestabilite del test. Supponiamo di aver preparato un test di intelligenza.

Lo somministriamo a un gruppo di alunni. Il test Stanford-Binet viene anche somministrato allo stesso gruppo. Ora i punteggi dei test effettuati sui nostri test e punteggi dei test costruiti di recente dagli studenti sul test di intelligenza Stanford-Binet sono correlati. Se il coefficiente di correlazione è elevato, si dice che il nostro test di intelligenza abbia una elevata validità simultanea.

Il significato di dizionario del termine "concurrent" è "esistente" o "fatto allo stesso tempo". Pertanto, il termine "validità concorrente" viene utilizzato per indicare il processo di convalida di un nuovo test correlando i suoi punteggi con alcune fonti di informazioni esistenti o disponibili (criterio) che potrebbero essere state ottenute poco prima o poco dopo il nuovo test.

Per accertare la validità concomitante di un test di rendimento costruito di recente, i suoi punteggi sono correlati con i punteggi ottenuti da quegli stessi studenti nel loro recente esame del primo terminale o del terminale. Pertanto un test è convalidato rispetto ad alcune informazioni disponibili contemporaneamente. Per ottenere una misura di criterio, non è necessario attendere per molto tempo.

La validità predittiva differisce dalla validità concorrente nel senso che, in passato, attendiamo che il futuro ottenga la misura del criterio. Ma in facilità di validità concorrente non è necessario attendere lacune più lunghe.

Il termine "concurrent" qui implica le seguenti caratteristiche:

1. I due test - quello di cui si sta esaminando la validità e quello con comprovata validità - dovrebbero coprire la stessa area di contenuto ad un dato livello e lo stesso obiettivo;

2. La popolazione per entrambi i test rimane la stessa e i due test sono somministrati in ambienti quasi simili; e

3. I dati sulle prestazioni di entrambi i test sono ottenibili quasi contemporaneamente.

Questo tipo di validità è anche noto come "Validità esterna" o "Validità funzionale". La validità concomitante è rilevante per i test utilizzati per la diagnosi e non per la previsione del successo futuro.

Tipo # 5. Validità del manufatto:

Costruisci la validità della misura in cui il test può essere detto per misurare un costrutto teorico o una variabile psicologica.

Un costrutto è principalmente psicologico. Di solito si riferisce a un tratto o processo mentale. Costruire la convalida è il processo per determinare in che misura un determinato test misura i costrutti psicologici che il testatore intende misurare.

Indica la misura in cui un test misura gli attributi o le qualità astratti che non sono definiti operativamente.

Gronlund e Linn affermano: "La convalida della costruzione può essere definita come il processo per determinare in che misura la performance del test può essere interpretata in termini di uno o più costrutti psicologici".

Ebel e Frisbie descrivono: "La convalida della costruzione è il processo di raccolta delle prove a sostegno della tesi secondo cui un determinato test misura effettivamente la struttura psicologica che i test maker intendevano misurare".

La validità della costruzione è anche conosciuta come "Validità psicologica" o "Validità dei tratti" o "Validità logica". Costruisci validità significa che i punteggi dei test sono esaminati in termini di un costrutto. Studia il costrutto o attributi psicologici che un test misura.

La misura in cui il test misura i tratti della personalità oi processi mentali definiti dal test-maker è nota come validità del test.

Durante la costruzione di test sull'intelligenza, l'attitudine, l'attitudine matematica, il pensiero critico, le abilità di studio, l'ansia, il ragionamento logico, la comprensione della lettura, ecc., Dobbiamo andare a costruire la validità. Prendi ad esempio "una prova di sincerità".

Prima di costruire questo tipo di test, il test maker deve confrontarsi con le domande:

1. Quale dovrebbe essere la definizione del termine sincerità?

2. Quali tipi di comportamento ci si deve aspettare da una persona sincera?

3. Quale tipo di comportamento distingue tra sincerità e insincerità?

Ogni costrutto ha una teoria sottostante che può essere utilizzata per descrivere e prevedere il comportamento di un alunno.

Gronlund (1981) suggerisce i seguenti tre passaggi per determinare la validità del costrutto:

(i) Identificare i costrutti che si presume siano responsabili delle prestazioni del test.

(ii) Ricavare ipotesi riguardanti le prestazioni del test dalla teoria alla base di ogni costrutto.

(iii) Verificare le ipotesi con mezzi logici ed empirici.

Va notato che la validità del costrutto è inferenziale. Viene utilizzato principalmente quando altri tipi di validità non sono sufficienti per indicare la validità del test. La validità della costruzione è solitamente implicata in termini di abitudini di studio, apprezzamento, onestà, stabilità emotiva, simpatia ecc.

Tipo # 6. Validità fattoriale:

Validità fattoriale l'estensione della correlazione dei diversi fattori con l'intero test.

La validità del fattore è determinata da una tecnica statistica nota come analisi fattoriale. Usa i metodi di spiegazione delle intercorrelazioni per identificare i fattori (che possono essere verbalizzati come abilità) che costituiscono il test.

In altre parole, i metodi di interconnessione e altri metodi statistici sono usati per stimare la validità fattoriale. La correlazione del test con ciascun fattore viene calcolata per determinare il peso apportato da ciascun fattore alla performance totale del test.

Questo ci dice del load factor. Questo rapporto tra i diversi fattori e l'intero test è chiamato validità fattoriale. Guilford (1950) ha suggerito che la validità fattoriale è la descrizione più chiara di ciò che un test misura e con tutti i mezzi dovrebbe essere data la preferenza rispetto ad altri tipi di validità.