Costruzione di un test standardizzato: 4 passaggi

Questo articolo getta luce sulle quattro fasi principali coinvolte nella costruzione di un test standardizzato. I passaggi sono: 1. Pianificazione 2. Preparazione del test 3. Provare fuori dal test 4. Valutare il test.

Fase 1. Pianificazione:

"La pianificazione del test comprende tutte le varie operazioni necessarie alla produzione dei test. Non solo implica il funzionamento di una struttura o di una tabella che specifica il contenuto o le opzioni da includere nel test, ma deve anche comportare un'attenzione particolare alla difficoltà dell'articolo, al tipo di elementi, alla direzione dell'esaminatore, ecc. " (Lindquist )

Per i test standardizzati è necessaria una pianificazione sistematica e soddisfacente. Secondo il parere di Ross, "i buoni test non si verificano solo, né sono il risultato di alcuni momenti di grande ispirazione ed esaltazione".

È il costruttore di test che è assolutamente responsabile di dare una forma adeguata ai suoi articoli di prova e che costruisce il test con tutte le premure e sincerità.

Comprende le seguenti attività:

1. Fissare gli obiettivi / scopi.

2. Determinazione del peso rispetto a diversi obiettivi didattici.

3. Determinazione della ponderazione in diverse aree di contenuto.

4. Determinazione dei tipi di articoli da includere.

5. Preparazione della tabella delle specifiche: Blue Print.

6. Prendere una decisione sui suoi aspetti meccanici come durata del tempo, dimensioni del test, punteggio totale, stampa, dimensione delle lettere, ecc.

7. Fornire istruzioni per il punteggio del test e la sua procedura di amministrazione.

8. È necessario fissare la ponderazione per le diverse categorie di livello di difficoltà delle domande.

(Le attività di cui ai punti da 1 a 5 necessitano di ulteriori chiarimenti)

1. Fissare gli obiettivi / scopi:

Prima della costruzione del test è necessario che i suoi oggetti siano formulati. L'attenzione dovrebbe essere rivolta alla capacità dei test di misurare in modo efficiente la misura in cui gli obiettivi dell'istruzione sono stati raggiunti. Gli obiettivi dell'istruzione possono essere classificati in molti modi. Ma qualunque sia la classificazione, il curriculum deve comportare quei cambiamenti nel bambino che sono previsti per mezzo di obiettivi.

Il test dovrebbe essere inquadrato in modo tale da indicare la misura in cui gli obiettivi, per apportare cambiamenti nel comportamento del bambino, sono stati raggiunti attraverso il curriculum insegnato loro.

L'attenzione dovrebbe essere rivolta anche allo scopo per cui è richiesto il test. Se il test è costruito per classificare gli studenti, allora nella sua attenzione da prestare alla sua capacità di classificazione. Ma se il suo scopo è diagnostico, dovrebbe essere costruito in modo tale da poter diagnosticare le difficoltà individuali degli studenti.

2. Determinazione del peso di diversi obiettivi didattici:

Il passo più importante nella pianificazione di un test è identificare gli obiettivi didattici. Ogni soggetto ha una serie diversa di obiettivi didattici. Negli argomenti di Scienza, Scienze Sociali e Matematica gli obiettivi principali sono classificati come conoscenza, comprensione, applicazione e abilità, mentre nelle lingue i principali obiettivi sono classificati come conoscenza, comprensione ed espressione.

L'obiettivo della conoscenza è considerato il livello più basso di apprendimento, mentre la comprensione, l'applicazione della conoscenza nella scienza o le scienze comportamentali sono considerati più elevati livelli di apprendimento.

3. Determinazione della ponderazione in diverse aree di contenuto:

L'attività più importante nella costruzione di un test sui risultati è specificare un profilo dell'area del contenuto. Indica l'area in cui ci si aspetta che gli studenti mostrino le loro prestazioni. Aiuta a ottenere un campione rappresentativo dell'intera area del contenuto.

Inoltre impedisce la ripetizione o l'omissione di qualsiasi unità. Ora sorge una domanda sulla quantità di peso da assegnare a quale unità. Alcuni esperti dicono che dovrebbe essere deciso dall'insegnante interessato a tenere presente l'importanza del capitolo.

Altri dicono che dovrebbe essere deciso in base all'area coperta dall'argomento nel libro di testo. Generalmente viene deciso sulla base di pagine dell'argomento, pagine totali nel libro e numero di elementi da preparare.

4. Determinazione dei tipi di articoli:

Gli elementi utilizzati nella costruzione del test possono essere suddivisi in due tipi, ad esempio oggetti di tipo oggettivo e articoli di tipo saggio. Per alcuni scopi didattici, gli item tipo oggettivi sono i più efficaci mentre per gli altri le domande del saggio si dimostrano soddisfacenti.

I tipi di articoli appropriati dovrebbero essere selezionati in base ai risultati di apprendimento da misurare. Ad esempio, quando il risultato è in scrittura, gli elementi del tipo di offerta sono utili.

Se il risultato è l'identificazione di una corretta risposta, i tipi di selezione o gli elementi del tipo di riconoscimento sono utili. Quindi, deve essere deciso e pianificato in questa fase.

LA = Risposta lunga

SA = Risposta breve

VSA = Risposta molto breve

5. Preparazione di "BLUEPRINT" o grafico tridimensionale:

Preparazione della stampa blu o tabella delle specifiche nel grafico tridimensionale: contenuto, obiettivo e tipo di articoli, che indica il numero di elementi in ciascuna cella o compartimento. È solo una cornice che fornisce un'immagine chiara del design del test e funge da guida.

Le tre dimensioni del progetto consistono in aree di contenuto in righe orizzontali e obiettivi e forme di domande in colonne verticali. Una volta preparato il progetto, il responsabile della carta può scrivere / selezionare gli articoli e preparare la carta per le domande.

Di seguito è riportato un esempio di modello di progetto:

Nota:

Si prega di inserire il numero di domande tra parentesi e i segni al di fuori delle parentesi.

E = Tipo di domanda tipo, SA = Tipo a risposta breve, VS A = Risposta molto breve.

Passaggio 2. Preparazione del test:

Il prossimo passo dopo la finalizzazione del progetto sta scrivendo domande appropriate in conformità con i parametri generali definiti nel progetto. Uno dovrebbe prendere un piccolo blocco del progetto alla volta e scrivere le domande richieste.

Quindi, per ogni blocco di progetto che viene compilato, le domande devono essere scritte una per una. Una volta fatto, abbiamo tutte le domande che soddisfano i requisiti necessari stabiliti nel progetto.

La scrittura di test standardizzata richiede tutto il tipo di cure e considerazioni. Deve essere dedicato abbastanza tempo per riflettere sul peso dei contenuti e delle aree da coprire.

In questo passaggio discuteremo le regole specifiche per la costruzione di diversi tipi di elementi di prova.

A questo punto dobbiamo preparare:

(i) Gli elementi di prova.

(ii) Le indicazioni per testare gli articoli.

(iii) Le istruzioni per l'amministrazione.

(iv) Le direzioni per il punteggio.

(v) Una tabella di analisi a livello di domanda.

(i) Preparazione degli articoli di prova:

La preparazione degli articoli di prova è il compito più importante nella fase di preparazione. Pertanto è necessario prestare attenzione nella preparazione di un articolo di prova. La costruzione di articoli di prova non è così facile. È compito di specialisti di test ed esperti. Un insegnante con esperienza e sufficientemente preparato nella costruzione di test può preparare gli elementi di prova appropriati.

Ci sono alcune regole e linee guida per la costruzione di articoli di prova. Per questo deve avere accesso a tutte queste linee guida e anche un accesso alla tassonomia degli obiettivi. In generale, gli elementi di prova devono essere chiari, completi e privi di ambiguità.

La lingua degli elementi deve essere scelta in modo che il contenuto e non la forma degli elementi determini la risposta. Gli oggetti che hanno significati nascosti, non dovrebbero essere inclusi. La dichiarazione degli articoli non dovrebbe essere data a caso dai libri. Tutti gli elementi di un particolare tipo dovrebbero essere messi insieme.

Il vocabolario usato negli articoli dovrebbe essere abbastanza semplice da essere compreso da tutti. Una sequenza regolare nel modello di risposte corrette dovrebbe essere evitata. Ci possono essere più di un tipo di elementi di prova nel test.

Il test deve essere sottoposto a revisione critica ad intervalli di tempo. Spesso, è auspicabile che nel test vengano inclusi più articoli rispetto al numero effettivamente necessario. Nella bozza preliminare è preferibile includere il doppio numero di elementi necessari.

Nella costruzione degli elementi di prova, non dovrebbero essere inclusi solo quegli elementi che enfatizzano la memoria o il riconoscimento. Gli oggetti dovrebbero essere scelti in modo che gli studenti apprendano l'abitudine di correlare le loro conoscenze con la loro vita reale.

Dopo che gli elementi del test sono stati incorniciati, devono essere sistemati correttamente e assemblati in un test. Se vengono utilizzate forme diverse di articoli di prova, dovrebbero essere preferibilmente raggruppati in termini di forma. Inoltre, agli oggetti facili deve essere assegnato un posto all'inizio, gli elementi di media difficoltà nella parte centrale e quelli difficili alla fine.

Gli elementi di prova possono essere disposti in ordine di difficoltà prevista. Naturalmente, ci sono vari modi di assemblare le domande e possiamo riunire le domande che si adattano al nostro scopo e alla nostra convenienza nell'interpretazione.

(ii) Preparazione della direzione agli elementi di prova:

Questo è l'aspetto più trascurato della costruzione del test. Generalmente tutti prestano attenzione alla costruzione di articoli di prova. Quindi i test maker non allegano indicazioni con gli elementi di prova. Ma la validità e l'affidabilità degli articoli di prova dipendono in gran parte dalle istruzioni per il test.

NE Gronlund ha suggerito che il test maker dovrebbe fornire indicazioni chiare su:

1. Lo scopo del test.

2. Il tempo concesso per rispondere.

3. La base della risposta.

4. La procedura per registrare le risposte.

5. I metodi per affrontare le supposizioni.

A volte le istruzioni per testare gli oggetti sono così ambigue che il bambino non può seguirle e in quanto tale risponde agli oggetti in un modo che riterrà opportuno in quell'istante o semplicemente passa sull'oggetto successivo lasciandolo senza risposta.

A causa della mancanza di chiarezza delle indicazioni, il bambino risponderà in modo diverso in momenti diversi, riducendo l'affidabilità del test.

(iii) Preparazione delle istruzioni per l'amministrazione:

Deve essere fornita una guida chiara e dettagliata su come deve essere somministrato il test. Le condizioni alle quali deve essere somministrato il test, quando il test deve essere somministrato (se nel mezzo della sessione o alla fine della sessione, ecc.), Entro quale limite di tempo deve essere somministrato, ecc. per essere dichiarato chiaramente.

Se il test ha sezioni separate, devono essere menzionati i limiti di tempo per coprire ciascuna sezione. Devono essere menzionati i materiali necessari (se ce ne sono) per il test come carte millimetrate, tabelle Logaritmo ecc.

Le istruzioni devono indicare chiaramente quali precauzioni deve prendere l'amministratore al momento dell'amministrazione. Quindi, deve essere preparata una direzione appropriata e chiara per l'amministrazione del test.

(iv) Preparazione della direzione per il punteggio:

Per facilitare l'obiettività nel punteggio, devono essere fornite "chiavi di punteggio". La chiave del punteggio è un elenco preparato di risposte a un determinato insieme di domande di tipo obiettivo. Una chiave di valutazione viene preparata elencando in serie la chiave (o la risposta corretta) a ciascuna domanda rispetto a ciascun elemento.

Per domande a risposta breve tipo e tipo di saggio, è necessario preparare schemi di marcatura. Tali chiavi di punteggio e schemi di marcatura devono essere accuratamente preparati. Aiutano come guide al momento del punteggio del test e assicurano l'obiettività nel punteggio.

(v) Preparazione di un grafico di analisi in base alle domande:

Si può preparare una tabella di analisi a livello di domande in cui ogni domanda viene analizzata. Questo grafico mostra l'area del contenuto che copre la domanda, l'obiettivo (con le specifiche) che intende misurare, il tipo, i contrassegni assegnati, il livello di difficoltà previsto e il tempo necessario per rispondere.

Questo grafico non solo analizza le voci, ma ci fornisce anche una panoramica della copertura dei contenuti, degli obiettivi, del tipo di domanda e una copertura del diverso livello di difficoltà, ecc. Inoltre, questo ci dà un'idea del tempo totale da dedicare per prendere test. Questo grafico ci aiuta a verificare se il test è stato preparato secondo il modello o no.

Passaggio 3. Provare fuori dal test:

Poiché il test viene preparato da un gruppo di persone ed esperti, non può essere completamente privo di errori. Pertanto, tutta la standardizzazione richiede la preparazione di una prova del test e il suo test su una popolazione campione.

Gli scopi della prova sono i seguenti:

1. Identificare gli articoli difettosi o ambigui.

2. Per scoprire la debolezza del meccanismo di amministrazione del test.

3. Identificare i distrattori non funzionanti o non plausibili in caso di test a scelta multipla.

4. Fornire dati per determinare il livello di difficoltà degli articoli.

5. Fornire dati per determinare il valore discriminante degli articoli.

6. Determinare il numero di elementi da includere nella forma finale del test.

7. Per determinare il limite di tempo per il modulo finale.

Lo scopo principale di provare è selezionare gli oggetti buoni e rifiutare gli elementi poveri.

La prova è fatta in tre fasi:

1. Prova preliminare.

2. Prova corretta.

3. Prova finale.

1. Prova preliminare:

La prova preliminare viene eseguita individualmente per migliorare e modificare le difficoltà linguistiche e l'ambiguità degli oggetti. Questa prova viene eseguita su 10 o 15 individui. Si osserva la lavorabilità degli articoli. Sulla base dell'osservazione e delle reazioni individuali, gli oggetti possono essere migliorati e modificati simultaneamente. In questo modo la bozza iniziale viene preparata e stampata o ciclostilata per la prova corretta o per la prova di gruppo.

2. The Proper Tryout:

La prova corretta viene eseguita su un gruppo di almeno 40 studenti / individui. Lo scopo è selezionare buoni articoli per il test e rifiutare articoli poveri.

Questo passaggio include le seguenti attività:

(A) Analisi articolo.

(B) Preparazione della bozza finale del test.

(A) Analisi articolo:

Un test non dovrebbe essere né troppo facile né troppo difficile; e ogni articolo dovrebbe discriminare la validità tra gli studenti con alti e bassi risultati. La procedura utilizzata per giudicare la qualità di un articolo si chiama analisi articoli.

La procedura di analisi degli articoli segue i seguenti passi:

1. I documenti di prova devono essere disposti dal punteggio più alto al più basso.

2. Seleziona il 27% di documenti di test dal più alto e il 27% dalla fascia più bassa. Ad esempio, se il test viene somministrato su 120 studenti, selezionare 32 documenti di prova dall'estremità più alta e 32 fogli di test dall'estremità inferiore.

3. Tenere da parte gli altri documenti di prova in quanto non sono necessari nell'analisi degli articoli.

4. Tabulare il numero di alunni nel gruppo superiore e inferiore che hanno selezionato ciascuna alternativa per ciascun elemento di prova. Questo può essere fatto sul retro della carta reattiva o può essere usata una scheda di prova separata come mostrato nella Tabella (14.1).

Come sappiamo, la qualità o il merito di un test dipende dai singoli elementi che lo costituiscono. Quindi, solo gli articoli adatti al nostro scopo devono essere mantenuti. L'analisi degli articoli è parte integrante dell'affidabilità e validità di un test.

Il valore di un oggetto è valutato da tre angoli principali:

(i) Indice di difficoltà dell'articolo,

(ii) potere discriminante dell'articolo,

(iii) Efficacia dei distrattori.

Un'illustrazione ipotetica:

Se un test viene somministrato a 120 studenti, il 27% dei documenti di test dall'estremità più alta è il 32 e il 27% dei documenti di test dall'estremità inferiore è 32.

(i) Indice di difficoltà della difficoltà articolo / oggetto:

L'indice di difficoltà dell'articolo è una parte importante della costruzione del test. Se un particolare oggetto è troppo facile, tutti gli studenti rispondono. Se tutti gli alunni ottengono punteggi uguali, lo scopo del test è sconfitto. Se a un partecipante non è possibile rispondere a un articolo, l'oggetto è troppo difficile o costruito male. A che serve avere questi oggetti in una prova? Quindi è evidente che elementi troppo facili e troppo difficili devono essere totalmente scartati.

È auspicabile che elementi di livello di difficoltà medio debbano essere inclusi in un test. All'analisi effettuata nella fase di prova, i tester in genere conservano gli oggetti nell'intervallo tra il 16% e l'84% di difficoltà.

La difficoltà dell'articolo (ID) viene calcolata utilizzando la formula.

ID = R / NX 100

dove R = No. dei partecipanti che rispondono correttamente.

N = Numero totale di persone testate ha provato l'oggetto.

Nel nostro esempio su 64 studenti di entrambi i gruppi superiori e inferiori, 40 studenti hanno risposto correttamente alla voce e 60 studenti hanno provato l'oggetto. Quindi la difficoltà dell'elemento è calcolata come

Difficoltà dell'oggetto = 40/60 x 100 = 66, 67

Poiché è consuetudine seguire la regola dal 16% al 84% per considerare la difficoltà dell'articolo, il nostro ID calcolato rientra in tale intervallo. Quindi l'oggetto ha il giusto livello di difficoltà. Significa che se un oggetto ha un ID superiore all'84%, allora è un oggetto troppo facile, se è inferiore al 16%, l'oggetto è un oggetto troppo difficile.

(ii) Potere discriminante dell'articolo:

Il potere discriminante (cioè l'indice di validità) di un articolo si riferisce al grado in cui un dato elemento discrimina tra gli studenti che differiscono nettamente nelle funzioni misurate dal test nel suo insieme.

Una stima dell'indice di discriminazione di un articolo può essere ottenuta con la formula:

dove

RU = Numero di risposte corrette dal gruppo superiore.

RL = numero di risposte corrette dal gruppo inferiore.

N = Numero totale di allievi che li hanno provati.

Nel nostro esempio 30 studenti del gruppo superiore hanno risposto correttamente alla voce e 10 dal gruppo inferiore hanno risposto correttamente alla voce.

Quindi R U = 30, R L = 10 e N = 60

Indice Discriminante = (30 - 10) / (60/2) = 20 / 30, 67

Un indice di discriminazione è solitamente espresso come un decimale. Se ha un valore positivo, l'oggetto ha una discriminazione positiva. Ciò significa che una percentuale maggiore di studenti più esperti rispetto agli studenti poveri ha corretto l'articolo. Se il valore è zero, l'elemento ha zero discriminazione.

Questo può accadere:

io. Perché l'oggetto è troppo facile o troppo difficile; o

ii. Perché è ambiguo.

Se più studenti cattivi di buoni studenti ottengono la voce corretta si otterrebbe una discriminazione negativa. Con un numero limitato di studenti, questo potrebbe essere un risultato casuale; ma potrebbe indicare che l'oggetto è ambiguo o errato.

L'articolo con indice di discriminazione zero o negativo deve essere scartato o rivisto. In generale, maggiore è l'indice di discriminazione, migliore è l'articolo.

(iii) Efficacia dei distrattori:

Un distrattore è considerato un buon distrattore quando attrae più alunni dal gruppo inferiore rispetto al gruppo superiore.

Esempio:

Assumere un totale di 40 libri di risposta (sia in gruppo superiore che in quello inferiore, 20 in ciascuno).

Di seguito viene riportata un'ipotetica illustrazione, in cui l'asterisco indica la risposta corretta:

Nell'illustrazione, le alternative A e C sono efficaci nel senso che attraggono più studenti dal gruppo inferiore rispetto al gruppo superiore. Ma l'alternativa D è un povero distrattore perché non attrae nessuno e quindi è inutile. L'oggetto ha solo opzioni e le possibilità di successo con la semplice ipotesi sono migliorate. L'alternativa E è anche povera perché attrae una percentuale maggiore del bene rispetto a quella degli studenti cattivi.

L'autore dell'articolo deve chiedersi:

"Perché gli studenti più brillanti erano attratti da E? Era a causa dell'ambiguità? Era perché c'erano due risposte ugualmente corrette? "In breve, questo articolo dovrebbe essere rivisto modificando le alternative D ed E.

(B) Preparazione della bozza finale del test:

Dopo l'analisi degli articoli, vengono conservati solo articoli con livello di difficoltà appropriato e con potere discriminante soddisfacente e questi elementi costituiscono il test finale. Di conseguenza, gli articoli buoni sono selezionati tra il gran numero di articoli.

Alcuni di essi possono essere modificati e il numero desiderato di elementi è selezionato per la bozza finale in base alla stampa blu. Gli articoli sono disposti in ordine di difficoltà nella bozza finale. Il tempo richiesto per il test è determinato. Ora il test è gestito da un campione rappresentativo di grandi dimensioni e i fogli di prova sono valutati.

3. Prova finale:

La prova finale viene eseguita su un ampio campione di circa 400 individui per stimare l'affidabilità e la validità del test. Il suo scopo è quello di decidere anche la durata del test. Lo scopo di questo tentativo è identificare i difetti e le carenze degli articoli di prova. Durante l'analisi degli articoli, gli oggetti troppo facili e troppo difficili vengono scartati. Solo gli elementi di livello medio di difficoltà sono inclusi o conservati.

Quasi tutte le precauzioni in fase di prova dovrebbero essere prese durante la somministrazione del test finale. Il foglio di risposta completato deve essere valutato con l'aiuto della chiave di punteggio e i punteggi devono essere tabulati per assegnarlo al trattamento statistico.

Passaggio 4. Valutazione del test:

La standardizzazione e la valutazione del test vengono eseguite nel modo seguente:

1. Viene stampata la forma finale del test. Anche il foglio delle risposte è stampato.

2. Il tempo richiesto per il test è determinato prendendo in media un tempo di tre alunni per rispondere al test. Gli alunni selezionati per lo scopo rappresentano tre gruppi: luminoso, medio e inferiore alla media.

3. Le istruzioni alle persone che amministreranno il test sono preparate e stampate.

4. I punteggi sono tabulati e vengono rilevate varie misure delle tendenze centrali, la mediana e la modalità e le misure di variabilità - deviazione standard, deviazione del quartile, ecc.

I punteggi sono tracciati su un foglio grafico per confrontare la normalità della distribuzione e disegnare e dare per ottenere vari punteggi percentili. I punteggi derivati ​​come T-score e Z-score ecc. Sono stimati.

Norme come le norme sull'età, le norme di classe, le norme del sesso, le norme rurali-urbane, ecc., Sono calcolate secondo il requisito.

5. La validità dei punteggi del test è stimata correlando i punteggi del test con qualche altro criterio. La validità del costrutto può essere rilevata mediante l'analisi fattoriale. Diversi metodi di determinazione della validità sono stati discussi in unità separate.

6. Nel valutare il test di nuova costruzione viene anche valutata l'affidabilità. Nel caso di due forme parallele possiamo calcolare l'affidabilità correlando i punteggi su queste due forme parallele.

Se non sono state preparate forme parallele, l'affidabilità può essere determinata dal metodo della metà divisa o dal metodo dell'equivalenza razionale. Il test può essere letto a regola d'arte e l'affidabilità può essere stimata con il metodo test-retest.

7. Infine, dovremo valutare fino a che punto un test è utilizzabile dal punto di vista dell'amministrazione, del punteggio, del tempo e dell'economia. Il test deve fornire norme percentili, norme del punteggio standard, norme di età e norme di livello che faciliteranno l'interpretazione dei punteggi.