Sistemi a scelta forzata: utilizzati per ottenere valutazioni delle prestazioni di lavoro

Uno dei metodi più popolari per ottenere valutazioni delle prestazioni è attraverso la tecnica nota come "scelta forzata". Questo metodo di valutazione, che era una conseguenza dei soliti problemi incontrati nello sviluppo di strumenti di misurazione della personalità, è stato rapidamente adattato per l'uso in termini di prestazioni valutazione.

Storicamente, il metodo sembra aver avuto origine con Horst nei primi anni '40 e fu usato anche da Wherry all'incirca nello stesso periodo. Il metodo è stato utilizzato in un'ampia varietà di situazioni e per un'ampia varietà di scopi. In un'eccellente critica del metodo della scelta forzata, Zavala (1965, p.117) riassume come segue:

La tecnica FC è stata utilizzata per classificare personale professionale come ufficiali e militari dell'Air Force (Gough, 1958, Wherry, 1959), pattugliatori e ufficiali di polizia (Peres, 1959, Stander, 1960), ingegneri (Lepkowski, 1963), insegnanti (Leftwich, 1962, Tolle e Murray, 1958) e medici (Newman and Howell, 1961, Newman, Howell e Harris, 1957). Il concetto di FC è stato anche utilizzato per sviluppare test per valutare o misurare interessi (Bendig, 1958, Peel, 1961), leadership e supervisione (Izard e Rosenberg, 1958, Wollack, 1959) e atteggiamenti dei dipendenti (Miller e Gekoski, 1959) .

Gordon (1951), Denton (1954) e Hatch (1962) hanno utilizzato le tecniche FC nella misurazione della personalità e per ottenere misure di empatia. L'approccio FC è stato utilizzato anche nei problemi relativi alla rilevabilità del segnale e alle soglie uditive (Lukaszew ski ed Elliott, 1962, Swets, 1959). Blackwell (1952) ha utilizzato il metodo FC per la misurazione psicofisica delle funzioni sensoriali. Webster (1959) ha sviluppato un test sulla preferenza delle figure usando la tecnica FC.

Costruzione della scala di valutazione a scelta forzata:

Guilford (1954, 275) ha delineato molto chiaramente i passi appropriati da seguire nello sviluppo di uno strumento a scelta forzata, così chiaramente che valgono la pena di reiterare qui.

Suggerisce i seguenti otto passaggi:

1. Vengono fornite descrizioni relative alle persone che sono riconosciute come agli estremi più alti e più bassi del continuum di rendimento per il particolare gruppo da valutare.

2. Le descrizioni sono analizzate in semplici qualità comportamentali, espresse in frasi o frasi molto brevi o in nomi di tratti, che possono essere chiamati elementi per costruire oggetti.

3. Due valori sono determinati empiricamente per ciascun elemento: un valore di discriminazione e un valore di preferenza. Il valore di discriminazione è un indice di validità e il valore di preferenza è un indice del grado in cui la qualità viene valutata da persone come i valutatori che useranno lo strumento.

4. Nel formare un oggetto, gli elementi sono accoppiati. Due istruzioni o termini con lo stesso valore di preferenza elevato sono associati, uno dei quali è valido e l'altro no. Entrambi dovrebbero avere "validità del viso" per il valutatore, cioè il valutatore dovrebbe pensare di essere entrambi favorevoli per prestazioni superiori nel gruppo valutato. Anche due dichiarazioni o termini con valore di preferenza altrettanto basso sono accoppiati, uno valido e l'altro no.

5. Due coppie di istruzioni, una coppia con un valore di preferenza elevato e una con un valore di preferenza basso, vengono combinate in un gruppo di quattro per formare un elemento. La ragione di questo tipo di combinazione è che, sebbene il valutatore medio non obietti a scegliere una delle due descrizioni favorevoli per una persona che conosce, a volte si rifiuta di scegliere una delle due descrizioni sfavorevoli. A volte viene aggiunta una quinta, neutra descrizione per formare un pentad, ma questo è meno comune.

Segue un esempio di una tetrade:

Negligente

Serious-minded

energico

Snob

I tratti "seri" e "energico" avrebbero avuto pari valore di preferenza perché erano applicati su altrettanto spesso come tratti favorevoli nel descrivere il tipo di personale per il quale è stata sviluppata la scala. La caratteristica "seria", tuttavia, è risultata valida, dal momento che è stata applicata al gruppo di criteri elevato in modo significativamente più frequente rispetto al gruppo con criteri bassi. I tratti "incurante" e "snob" sono stati trovati ugualmente impopolari, ma "disattento" discrimina il basso dal gruppo di criteri alto.

6. L'istruzione per il valutatore è preparata. Il valutatore deve reagire a ciascun tetrad come un oggetto, dicendo quale dei quattro si adatta meglio al valutatore e quale uno dei quattro è meno appropriato.

7. Una prova sperimentale dello strumento viene provata in un campione per il quale esiste un criterio esterno, allo scopo di convalidare le risposte quando le descrizioni vengono visualizzate in questa forma. Le risposte discriminanti sono determinate e, se lo si desidera, i pesi differenziali vengono assegnati.

8. Una chiave di valutazione è concepita, in base ai risultati al punto 7. Normalmente, un tratto positivo valido contrassegnato come più descrittivo del valutatore riceve un peso positivo, anche un tratto valido e sfavorevole giudicato meno descrittivo.

Fondamento logico:

Naturalmente, dalla descrizione di cui sopra la logica del nome "scelta forzata" è immediatamente evidente, in quanto il valutatore è continuamente costretto a scegliere tra alternative altrettanto favorevoli (o sfavorevoli). Ciò presumibilmente impedisce al valutatore di controllare deliberatamente solo i tratti più favorevoli nel valutare quei lavoratori a cui potrebbe voler mostrare un certo grado di favoritismo.

Se sceglie le sue risposte rigorosamente sulla base di quanto sembrano essere favorevoli, in teoria non avrà alcun motivo per selezionare una caratteristica sull'altra in nessuna coppia poiché sono state equiparate su questa base. Quindi, la sua scelta sarebbe casuale e, per caso, finirà per selezionare la caratteristica discriminante per metà del tempo.

Poiché ogni tetrad ha una coppia favorevole (con un discriminatore positivo in essa) e una coppia sfavorevole (con un discriminatore negativo in essa), una selezione casuale in ogni coppia significherebbe che il valutatore tenderebbe a scegliere un discriminatore favorevole circa la metà del tempo e discriminatore sfavorevole circa la metà del tempo.

Pertanto, un punteggio casuale o casuale sarebbe pari a zero (supponendo che diamo un +1 per ogni discriminatore positivo e un -1 per ogni discriminatore negativo controllato). Nella misura in cui il valutatore sta veramente tentando di fornire una valutazione accurata del lavoratore, tenderà a selezionare i tratti che discriminano nella coppia positiva e non a selezionare i tratti che discriminano nella coppia negativa (supponendo che stia valutando un buon lavoratore) .

Se giudica un lavoratore povero, il suo schema si inverte in quanto tende a selezionare il tratto discriminante più spesso del caso tra la coppia negativa e seleziona il tratto non discriminante più spesso del caso nella coppia positiva. I buoni lavoratori dovrebbero, quindi, finire con punteggi alti positivi e lavoratori poveri con punteggi negativi elevati.

Indici a scelta forzata:

La chiave per una scala di scelta forzata di successo risiede nei diversi tipi di indici ottenuti per ogni tratto prima di costruire la versione finale della scala di valutazione.

I diversi indici sono i seguenti:

A. Indici discriminatori

B. Indicatori equivalenti

1. Indice di preferenza

2. Indice di gradimento

3. Indice di importanza

4. Indice di desiderabilità

Indici discriminanti:

L'indice discriminatorio è semplicemente una misura del grado in cui si trova un tratto per distinguere tra lavoratori buoni e poveri. Tutti gli indici normalmente impiegati nell'analisi degli item sono potenzialmente appropriati per l'uso come misure della criminalità caratteristica, dal momento che uno riguarda esclusivamente la validità di ciascun tratto nel predire quanto può essere buono un dipendente. Per una discussione sui metodi di analisi degli articoli, consultare qualsiasi testo di base nei test psicologici.

Indici equatoriali:

La logica del sistema di scelta forzata richiede che i tratti siano abbinati in modo tale che siano ugualmente "attraenti" per il valutatore. In altre parole, un tratto non deve possedere più di una caratteristica che porterebbe al suo essere colto sull'altro tratto da un valutatore che ha il desiderio di influenzare le sue risposte. La selezione dei tratti in ogni coppia deve basarsi esclusivamente sul loro potere discriminante piuttosto che sui termini di qualsiasi stereotipo di popolazione sui tratti stessi.

Siamo immediatamente portati al problema di tentare di determinare quali tipi di caratteristiche dei tratti sono in grado di influenzare la risposta di un valutatore che desidera distorcere le sue risposte.

Quattro di queste caratteristiche potrebbero essere considerate potenzialmente importanti:

1. Preferenza per un tratto:

Questo può essere meglio definito come la tendenza generale per i valutatori di usare il tratto con tutte le persone, indipendentemente dal fatto che siano lavoratori buoni o poveri. Sisson (1948) ha definito questa caratteristica come "la misura in cui le persone, in generale, tendono ad usarlo nel descrivere altre persone". In un certo senso, la preferenza di tratto è una misura della comunanza di un tratto nel vocabolario descrittivo dei valutatori. L'equiparare le coppie di tratti in termini di preferenza generale sembrerebbe certamente un passo logico se si tentasse di rimuovere le caratteristiche estranee degli oggetti che probabilmente avrebbero influenzato la scelta di un valutatore.

2. Favourability di un tratto:

I tratti differiscono chiaramente in termini di apparente preferenza per l'uso come descrittore di persone. Come è stato detto, il formato di scelta forzata di solito accoppia due tratti favorevoli con due tratti sfavorevoli. È anche importante che i due tratti favorevoli appaiano ugualmente favorevoli e che i due tratti sfavorevoli siano ugualmente sfavorevoli, oppure che il valutatore possa essere tentato di selezionare il più favorevole in ciascuna coppia nel tentativo di rendere il tasso il più buono possibile.

La preferenza per i tratti è probabilmente l'indice più comunemente utilizzato per equiparare le coppie a scelta forzata. Si tratta di un indice che è relativamente facile da ottenere poiché un certo numero di giudici valuta ogni tratto in termini di gradevolezza per la persona che verrà utilizzata per descrivere e utilizzare il valore medio della scala come indice di preferenza.

3. Indice di importanza:

Questo indice è stato menzionato da Zavala (1965) ed è una misura di "l'importanza dell'affermazione come una qualifica per la posizione in questione" (Zavala, 1965, p 118). Questo indice riconosce che una persona con una tendenza di inclinazione è più propensa a utilizzare una situazione specifica come quadro di riferimento piuttosto che un riferimento più generale. Cioè, un valutatore che desidera rendere un buon aspetto può essere più adatto a scegliere quel tratto specifico che ritiene sia più importante per il lavoro in questione piuttosto che a scegliere quel tratto che è il descrittore generale più favorevole.

La scelta del valutatore di quale trait sia il migliore da utilizzare è, quindi, probabile che sia specifica del lavoro. Al fine di eguagliare correttamente i tratti per la loro importanza, è necessario ottenere valori di scala di importanza (solitamente nello stesso modo generale in cui si ottengono valori di scala di preferenza) per ciascuna situazione di rating - un compito che a volte può essere difficile realizzare.

4. Indice di desiderabilità:

La nozione di desiderabilità sociale è stata discussa come influenza nel determinare le risposte degli individui agli inventari della personalità. L'effetto di questa caratteristica caratteristica è probabilmente altrettanto importante nelle situazioni di valutazione. Differenziare tra la preferenza e la desiderabilità sociale non è sempre una cosa facile da fare.

Certamente, i tratti giudicati favorevoli possono anche essere considerati socialmente desiderabili. La distinzione potrebbe essere illustrata considerando la preferenza di un tratto come intelligenza che potrebbe essere abbastanza elevato, mentre la sua desiderabilità sociale potrebbe tendere ad essere un po 'più bassa a causa di una reazione culturale generale contro "teste d'uovo", ecc.

Fotogrammi di riferimento:

Non solo ci sono una varietà di diversi indici che possono essere usati per equiparare coppie di tratti in un formato a scelta forzata, ma ci sono anche diversi insiemi di istruzioni o quadri di riferimento che possono essere dati ai giudici quando si ottengono valori di scala per scopi di equazione . Di conseguenza, diverse istruzioni tendono ad essere piuttosto critiche.

Per esempio, se uno è interessato a ottenere indici di importanza, potrebbe dare ai giudici uno dei seguenti gruppi di istruzioni:

(I) Dà ad ogni tratto un punteggio basato su quanto importante ritieni che quel tratto sia per un rendimento lavorativo di successo, o

(2) Assegnare a ciascun tratto un punteggio basato sull'importanza che si ritiene che il valutatore, eventualmente utilizzando la scala, ritenga che il tratto sia per prestazioni lavorative di successo.

Nel primo caso, si ottengono valori di scala basati sul proprio schema di riferimento dei giudici. In seconda istanza, i giudici sono invitati a mettersi nei "panni" della persona alla quale verrà eventualmente chiesto di utilizzare lo strumento di valutazione della performance e di esprimere giudizi come se fossero quella persona. I valori di scala di importanza ottenuti in queste due serie di condizioni potrebbero rivelarsi alquanto diversi.

La strategia "Ideal-Man":

Un problema correlato alla struttura della domanda di riferimento è la strategia del valutatore denominata strategia "uomo-ideale". Un modo molto tipico di influenzare le risposte a una scala di valutazione della scelta forzata è che il valutatore selezioni il suo miglior lavoratore e sostituisca mentalmente le sue caratteristiche a quelle del lavoratore che sta effettivamente valutando e di chi desidera avere un punteggio.

Se non ha un lavoratore abbastanza bravo da essere utilizzato come guida nella valutazione, il valutatore può trarre un'immagine mentale di un lavoratore ideale e usarlo come la sua struttura di riferimento nel fare le sue valutazioni. Questo tipo di distorsione deliberata è estremamente difficile da affrontare in quanto, in un certo senso, il valutatore non presta alcuna attenzione ai tipi di caratteristiche dei tratti che la scala della scelta forzata tende a proteggere contro.

Cioè, il valutatore tende a fare un lavoro "onesto" di valutazione, tranne che "l'uomo" che sta valutando quando completa la scala è una persona piuttosto diversa da quella che dovrebbe essere valutata. Quando un valutatore è abbastanza intelligente da adottare questa strategia di valutazione come metodo per aumentare i punteggi delle prestazioni dei suoi amici, ecc., C'è poco da fare per evitare il pregiudizio che ne deriva, anche con la scelta forzata.

Ricerca sul metodo della scelta forzata:

Il metodo di scelta forzata è stato oggetto di molte ricerche sin dalla sua introduzione negli anni '40. Come con molti metodi più recenti, si è rivelato essere un po 'meno un toccasana di quanto molti sperassero, ma sembra ancora essere uno dei modi più efficaci per ridurre i pregiudizi di valutazione disponibili per lo psicologo industriale. Una breve panoramica di alcuni dei risultati relativi ai vari aspetti del metodo di scelta forzata darà un'idea dello stato generale del metodo.

Formato oggetto scelta forzata:

In quello che è diventato uno degli studi classici sul metodo della scelta forzata, Highland e Berkshire (1951) hanno confrontato sei diversi tipi di formati di articoli in termini di (1) la loro affidabilità pari / dispari, (2) la loro suscettibilità a pregiudizio quando i valutatori sono stati istruiti per assicurare un punteggio elevato, (3) la loro validità rispetto a un criterio composto da ordini di rango degli istruttori degli studenti, e (4) la loro popolarità generale come determinato dai valutatori.

I sei diversi tipi di formati di oggetti usati erano:

1. Due dichiarazioni per articolo, sia favorevoli che entrambe sfavorevoli. A Rater è stato chiesto di selezionare la maggior parte descrittiva della coppia di affermazioni.

2. Tre affermazioni per articolo, tutte favorevoli o tutte sfavorevoli. A Rater è stato chiesto di selezionare la dichiarazione più o meno descrittiva.

3. Quattro dichiarazioni per articolo, tutte favorevoli. A Rater è stato chiesto di selezionare le due dichiarazioni più descrittive.

4. Quattro dichiarazioni per articolo, tutte favorevoli. A Rater è stato chiesto di selezionare il più descrittivo e il meno descrittivo.

5. Quattro dichiarazioni per articolo, due favorevoli e due sfavorevoli. A Rater è stato chiesto di selezionare sia la dichiarazione più o meno descrittiva.

6. Cinque dichiarazioni per articolo, due favorevoli, due sfavorevoli e una neutra. A Rater è stato chiesto di selezionare sia la dichiarazione più o meno descrittiva.

I risultati dello studio hanno portato Highland e Berkshire alle seguenti conclusioni:

Affidabilità:

Tutti i formati hanno portato a coefficienti di affidabilità elevati, sebbene i formati 5 e 6 possano essere considerati come la migliore da mostrare su questo criterio.

Validità:

Il formato 4 è risultato generalmente il più valido, con il formato 3 che esegue un secondo forte. Ciò indica che l'uso di sole alternative favorevoli sembra incidere sulla validità.

Preferenza del valutatore:

La preferenza dei valutatori per i sei formati come (dal più al meno preferito) 3, 1, 6, 5, 4 e 2.

Suscettibilità al pregiudizio:

Le forme differivano considerevolmente in termini di grado in cui erano resistenti a tentativi deliberati di polarizzazione. L'ordine di resistenza di polarizzazione (dal più al meno) era 3, 2, 1, 4, 5 e 6.

Highland e Berkshire suggeriscono che il formato 3 è il migliore dei sei studiati quando vengono considerati i quattro criteri sopra elencati.

Validità comparata della scelta forzata:

Lo studio di Highland e Berkshire ha esaminato diversi formati di scelta forzata tra di loro. Una domanda altrettanto importante riguarda la validità e l'affidabilità del metodo rispetto ad altre procedure di valutazione delle prestazioni.

Nel rivedere gli studi che hanno preteso di esaminare il vantaggio della scelta forzata in termini di validità, Zavala (1965) fa i seguenti punti:

1. Troppi studi sulla validità della scelta forzata hanno avuto la tendenza ad utilizzare altre forme di valutazione come criterio. Probabilmente è più una misura di affidabilità che una misura di validità.

2. La maggior parte degli studi comparativi sembra mostrare una leggera superiorità per la scelta forzata rispetto ai metodi di valutazione convenzionali.

3. Più le scale di valutazione sono lunghe, più è adatto il metodo di scelta forzata.

4. Anche la validità di una scala a scelta forzata è una funzione del tipo di indice di equazione utilizzato nella costruzione degli oggetti.

Suscettibilità alla distorsione:

Sebbene la questione della validità sia probabilmente la più importante che possa essere utilizzata per valutare il metodo della scelta forzata, la questione del grado in cui il metodo è soggetto a distorsioni o distorsioni deliberate è anch'essa critica. Infatti, il metodo è stato specificamente progettato per ridurre i bias di risposta, poiché la polarizzazione della risposta tende a ridurre la validità.

L'evidenza sull'efficacia della procedura di scelta forzata come un bias riduttore è in qualche modo equivoca. Sembrano esserci pochi dubbi sul fatto che il fingere resti possibile in un formato a scelta di forza, come indicato da Sisson (1948), Howe (1960) e Howe e Silverstein (1960).

Tuttavia, sembra che vi siano prove sostanziali che il grado di fattibilità sia ridotto da elementi di scelta forzata. Karr (1959), Taylor e Wherry (1951) e Izard e Rosenberg (1958) offrono tre esempi di studi di ricerca che indicano una resistenza alla falsificazione per scelta forzata che supera quella di altri tipi di scale.

Waters (1965) ha recentemente suggerito che una delle maggiori difficoltà con la ricerca sulla possibilità di fare scelte forzate è stata che il "set" di fingere il test che è stato stabilito di solito differiva dal "set" sotto il quale gli indici di equazione erano originariamente ottenuto. Pertanto, gli indici non sono mai realmente del tutto appropriati per la situazione reale di valutazione. Suggerisce che ci sono tre diversi gruppi di risposta in base ai quali è possibile ottenere indici di equazione (indipendentemente dall'indice utilizzato).

1. Valutazione onesta:

Risposta in quanto il rispondente crede veramente che la dichiarazione si applichi alla persona che viene valutata

2. Accettabilità sociale:

Rispondere in modo da apparire accettabile per se stessi e per gli altri in generale

3. Aspetto di successo:

Rispondere in modo tale da far apparire la persona in possesso delle qualità necessarie o desiderabili in relazione a un particolare lavoro o attività

Inoltre, Waters suggerisce che gli studi di fattibilità possono essere classificati in tre classi generali, a seconda di come varia la serie di risposte e la composizione del gruppo.

Per citare da Waters (1965, p 189), abbiamo:

1. Studi di fakability:

Insiemi e gruppi almeno simili nelle situazioni in cui gli indici di attrattività sono ottenuti e la scala è amministrata.

2. Studi di generalizzazione:

Sia gli insiemi che i gruppi, ma non entrambi, sono passati dalla situazione in cui si ottengono gli indici di attrattiva alla situazione in cui viene amministrata la scala.

3. Studi di estensione:

Sia gli insiemi che i gruppi sono cambiati rispetto alla situazione in cui si ottengono gli indici di attrazione rispetto alla situazione in cui viene gestita la scala.

Gli studi di Fakability non devono essere confusi con questi ultimi tipi di studi. Sono l'unico tipo che fornisce direttamente un test di quanto siano adeguati gli indici di equazione nel loro lavoro. Gli ultimi due semplicemente valutano la generalità dell'indice ad altre situazioni. Sfortunatamente, secondo la Waters, la maggior parte degli studi sulla falsificazione fino ad oggi sono stati studi di generalizzazione o di estensione; c'è un forte bisogno di qualche ricerca che attacca direttamente la questione della falsificazione.

Studio normanno:

Uno degli studi più interessanti sul problema della contraffazione e della rilevazione forzata è lo studio di Norman (1963). Era interessato alle dinamiche degli indici di popolarità degli oggetti e di discriminazione degli oggetti in condizioni normali e in condizioni simulate. Inoltre, era interessato a determinare fino a che punto la falsificazione, se avvenisse, potesse essere controllata e / o rilevata.

I principali risultati della ricerca relativa al comportamento degli indici di popolarità e discriminazione sono riportati di seguito:

1. Gli indici di discriminazione in condizioni normali e false sono stati correlati approssimativamente

2. Gli indici di popolarità in condizioni normali e false sono risultati correlati (0, 24 e 0, 23).

3. L'affidabilità degli indici di discriminazione in condizioni false era pari a zero.

4. L'affidabilità degli indici di discriminazione in condizioni normali era moderatamente elevata.

5. L'affidabilità degli indici di popolarità era quasi perfetta in condizioni normali e false (0.97 e 0.98).

L'ultimo di questi risultati (la ricerca del numero 5) implica che la differenza di popolarità tra condizioni normali e false sia anche molto affidabile (la ricerca del numero 2, che dice che ci sono differenze sostanziali, può essere modificata per implicare che tali differenze siano affidabili e coerente). Tuttavia, questo non è stato valutato direttamente nello studio.

Norman suggerisce quindi una procedura per lo sviluppo di uno strumento a scelta forzata che avrà la stessa media in condizioni false, come in condizioni normali, con una varianza minore in condizioni false e una scala di rilevamento estremamente sensibile per identificare i falsi.

Per ottenere ciò, descrive i seguenti passaggi:

1. Selezionare le voci con indici di discriminazione elevata in condizioni normali (selezionare più di quanto sarà necessario alla fine).

2. Ordinare gli articoli selezionati in termini di dimensioni delle loro differenze di popolarità in condizioni normali e false (vedere il numero 2 nell'elenco precedente).

3. Seleziona gli elementi da entrambi i lati dello zero (tanti quanti ne vuoi), assicurandoti che la somma algebrica delle differenze di popolarità sia uguale a zero una volta completata.

La fase 3 garantirà (dal momento che sappiamo che le differenze di popolarità sono affidabili) che il punteggio medio di prova delle persone nelle condizioni normali sarà uguale a quello delle condizioni false. Ciò si verifica poiché la media della distribuzione dei punteggi dei test è uguale alla somma delle divulgazioni degli articoli. Pertanto, i punteggi medi in condizioni normali e false sono equiparati. I test costruiti con questa procedura tenderanno anche a variazioni delle loro distribuzioni del punteggio del test se prese sotto un set di false. Questo è un risultato che tende a ridurre la possibilità che le persone che sono in grado di fingere ottengano punteggi abbastanza alti da essere accettati.

Per illustrare, prendere in considerazione lo schema mostrato di seguito (Figura 7.4) in cui è disponibile la distribuzione dei punteggi dei test in condizioni normali. (7.4a), la distribuzione dei punteggi dei test presi sotto un set per falso (7.4b), e una distribuzione composita composta da fakers e non-fakers (7.4c).

L'esame della figura 7.4c fornisce un'indicazione dell'effetto di controllo che questo metodo esercita sui falsi intenzionali. Nella solita impostazione della valutazione delle prestazioni, siamo interessati a premiare quelle persone che ottengono un punteggio elevato nel modulo di scelta forzata. Poiché la varianza della distribuzione falsa è ridotta, è possibile selezionare le persone con punteggio più alto (quelle a destra della linea di demarcazione in 7.4c) senza il rischio di includere troppi falsi nel gruppo selezionato o premiato.

La figura 7.5 mostra cinque diverse dimostrazioni empiriche di questa restrizione in varianza ottenuta nello studio normanno.

Una caratteristica finale del metodo Norman è che è molto facile costruire una scala di "rilevamento" per determinare chi sta fingendo e chi no.

Uno semplicemente include sulla scala un numero di articoli che soddisfano i seguenti requisiti:

1. Devono avere validità quasi nulla per le variabili del criterio.

2. Devono aver mostrato un grande cambiamento di popolarità dalla condizione normale a quella falsa.

3. La loro popolarità in condizioni normali deve essere molto alta o molto bassa.

Uno quindi costruisce una chiave che classifica la risposta infrequente sotto la condizione normale per ciascun elemento (ovvero, la risposta frequente sotto la condizione falsa), poiché una risposta tende a indicare la falsificazione e l'altra risposta indica la risposta normale.

Un altro modo di descrivere questi elementi di rilevamento è che la loro popolarità si correla con la tendenza al falso. La Figura 7.6 mostra la distribuzione dei punteggi sulla scala del rilevatore ottenuta da Norman in condizioni normali e in condizioni false. Si noti il ​​grande spostamento di punteggi quando alle persone è stato chiesto di fingere. Un limite di circa 20 tenderebbe a identificare la maggior parte dei falsari senza accusare falsamente molte delle normali.