Previsione del successo del lavoro (con diagramma e statistiche)

La previsione del successo del lavoro implica la determinazione della misura in cui il predittore è correlato al criterio. Ad esempio, supponiamo che uno fosse interessato a impostare un programma di selezione per assumere nuovi impiegati di file. Supponiamo inoltre che sia stato deciso di utilizzare un test cartaceo di attitudine clericale come potenziale predittore dell'efficienza dell'archivista, e che l'efficienza doveva essere determinata dalle valutazioni dei supervisori. La Tabella 2.3 mostra alcuni dati ipotetici per questa situazione ipotizzata, fornendo punteggi per dodici impiegati di file sia sul test clericale che sulla misura del criterio di efficienza. La Figura 2.5 mostra un grafico dei dati nella Tabella 2.3.

Si noti che sembra esserci una tendenza sistematica. In generale, più alta è la persona che ha ottenuto un punteggio nel test clericale, più alto è il punteggio sulla misura della competenza lavorativa. Possiamo quindi dedurre che esiste una relazione definita tra la prestazione del test (il predittore) e l'abilità lavorativa (il criterio). Possiamo anche dedurre che se selezioniamo quelle persone che ottengono punteggi più alti nel test, siamo più propensi ad assumere persone che saranno più abili di se assumiamo persone indipendentemente dal punteggio del test.

Stabilire il grado di relazione:

Il grado di relazione tra due variabili qualsiasi può essere definito come la misura in cui queste due variabili variano insieme in modo sistematico. Il termine più tecnico per questo è il grado di covarianza esistente tra le variabili. Una misura formale del grado di covarianza tra due insiemi di punteggi è fornita da una statistica nota come coefficiente di correlazione. Quando due insiemi di punteggi sono altamente correlati, diciamo che sono altamente correlati. La misura di correlazione più comune è il coefficiente di correlazione del momento del prodotto Pearson, contrassegnato dal simbolo r.

Come misura della relazione, r varia tra +1, 00 e -1, 00. Quando r è + 1.00, i due gruppi di punteggi sono positivi e perfettamente correlati tra loro. Quando r è -1, 00, i due gruppi di punteggi sono negativamente e perfettamente correlati tra loro. Quando r = 0.00, le due serie di punteggi non hanno alcuna relazione tra loro. La Figura 2.6 mostra grafici di diverse grandezze di r.

Nel predire il successo del lavoro il segno del coefficiente di correlazione non è importante, ma la magnitudine lo è. Maggiore è la dimensione assoluta di r, migliore è la previsione dei punteggi dei criteri sulla base delle informazioni ottenute dal predittore.

Per comprendere la logica della correlazione può essere utile considerare una rappresentazione pittorica della covarianza e la sua relazione con r. Qualsiasi serie di punteggi avrà una certa quantità di variazione, infatti, come abbiamo già visto, i punteggi delle persone su molti tratti seguono una distribuzione normale con un piccolo numero di punteggi molto alti, un piccolo numero di punteggi molto bassi e la maggior parte dei punteggi che si verificano nel mezzo della distribuzione.

Supponiamo di rappresentare questa varianza in una serie di punteggi dei criteri come mostrato sopra dove l'area totale è definita come 1, 00. Possiamo fare ciò poiché è possibile trasformare qualsiasi serie di punteggi grezzi in modo che la loro varianza diventi uguale a 1.00 usando quella che è nota come trasformazione del punteggio az.

Allo stesso modo, supponiamo di avere una serie di punteggi predittivi che variano anche e che sono normalmente distribuiti, e ancora una volta l'area viene definita uguale alla quantità 1.00. Possiamo ora rappresentare r geometricamente come correlato alla quantità di sovrapposizione (covarianza) delle due serie di punteggi.

Una definizione più precisa di r come statistica è che è il rapporto tra la quantità di covarianza tra due variabili e la radice quadrata del prodotto delle rispettive varianze (a volte chiamata media geometrica) che può essere schematizzata come mostrato di seguito:

Tornando ai dati riportati nella Tabella 2.3, è possibile calcolare la correlazione tra queste due serie di punteggi utilizzando la formula

Si consiglia al lettore che r non possa essere interpretato come una percentuale. Se r = 0, 50, ciò non implica che il 50 percento della varianza nel criterio sia prevedibile dalla variabile di selezione. Il quadrato di r, tuttavia, può essere interpretato in questo modo. Una correlazione di 0, 50, al quadrato, fornisce r 2 = 0, 25, che può essere interpretata come la percentuale di varianza nel criterio previsto dalla variabile di selezione.

La statistica r 2 è talvolta chiamata il coefficiente di determinazione perché rappresenta la quantità di varianza in una variabile che può essere "determinata" conoscendo i punteggi su una seconda variabile. La Figura 2.7 mostra la relazione tra r (la misura della relazione) e r 2 . Si noti che è possibile ottenere r di dimensioni piuttosto consistenti e rappresentare ancora solo una piccola parte della varianza del criterio.

Regressione:

Come abbiamo visto, il coefficiente di correlazione r misura il grado di relazione tra due variabili. Di per sé, tuttavia, non ci fornisce una procedura con la quale possiamo prevedere un set di punteggi da un altro set. La tecnica con cui questo viene fatto è chiamata analisi di regressione. La regressione può essere considerata correlata alla correlazione come segue: La correlazione misura la grandezza o il grado della relazione tra due variabili, mentre la regressione fornisce una descrizione del tipo di relazione tra variabili che a sua volta può essere usata per fare previsioni.

Per illustrare la regressione, considera i punteggi tracciati nella Figura 2.8a. Ovviamente esiste una sostanziale relazione positiva esistente tra il predittore e il criterio in questo caso. Sfortunatamente, la Figura 2.8a non ci fornisce alcuna informazione sulla relazione esatta diversa dal fatto che è lineare (r misura sempre solo il grado di relazione lineare, opposta a curvilinea, tra due variabili). Se vogliamo prevedere i punteggi dei criteri di alcuni dispositivi di selezione, è chiaro che dobbiamo descrivere in modo più specifico la relazione osservata tra predittore e criterio.

Questo si ottiene individuando la linea o la funzione che meglio descrive i punti dati. Questo è chiamato adattare una "linea di miglior adattamento" ai dati. Dato che stiamo assumendo che la relazione sia lineare (abbiamo usato r per misurare la sua grandezza), il tipo di linea che usiamo deve essere lineare, cioè non sono consentite linee curve. Questa retta che si adatta meglio è chiamata linea di regressione e può essere utilizzata per prevedere il criterio dal predittore.

La Figura 2.8b mostra due diverse linee di miglior adattamento che potrebbero essere ottenute se chiedessimo a due persone diverse di esaminare i dati e quindi tracciare una linea attraverso i punti che a loro avviso sembrano meglio descrivere la tendenza o la relazione tra le variabili. Mentre la tendenza generale è simile, troviamo che le due persone non sono completamente d'accordo nella loro stima della relazione.

Questo disaccordo porterebbe a disaccordo nel punteggio del criterio previsto a seconda della linea di regressione stimata utilizzata. Dato un candidato di lavoro con un punteggio x sullo strumento di selezione, prevediamo un punteggio di criterio di y 1 per questo candidato se dovessimo usare la linea di regressione della prima persona; se usassimo la linea di regressione della seconda persona, prevedessimo y 2 come il punteggio di criterio più probabile. Quale regressione è corretta?

Questa è una domanda difficile a cui rispondere a meno che non vi sia una base per decidere cosa sia veramente una "migliore corrispondenza". Fortunatamente, gli statistici hanno generalmente convenuto che una linea che meglio si adatta è quella che attraversa i punti in modo tale da ridurre al minimo la somma delle distanze quadrate (nella dimensione y) dei punti dalla linea, come mostrato nella Figura 2.9.

Una linea che realizza la minimizzazione di Σd 2 è detta linea di regressione "minimi quadrati". Tali linee di regressione sono matematicamente direttamente correlate a r. L'utilizzo del metodo dei minimi quadrati per ottenere la nostra linea di predizione assicurerà che persone diverse finiranno con la stessa linea (supponendo che non facciano errori nel calcolo). Allo stesso modo, il punteggio del criterio previsto per ogni particolare valore di x non varierà a seconda di chi si adatta alla linea di predizione (vedi Figura 2.8c).

A questo punto il lettore potrebbe chiedere: "Perché abbiamo bisogno di prevedere i punteggi dei criteri quando li abbiamo già?" La risposta è abbastanza semplice. La misurazione iniziale dell'estensione della relazione tra predittore e criterio richiede ovviamente entrambe le serie di punteggi altrimenti la relazione non potrebbe essere stata stabilita. Se il dispositivo di selezione si rivela utile, può essere utilizzato con tutti i nuovi candidati per i quali può esserci un punteggio predittivo ma per il quale non esiste un punteggio di criterio.

Il nostro obiettivo è di prevedere il rendimento dei criteri dei futuri candidati. Se un nuovo candidato ottiene un punteggio elevato in un test che è risultato avere una relazione altamente positiva con il criterio, allora dovremmo aspettarci che abbia un'alta probabilità di risultare un noleggio di successo.