Test non parametrici: concetti, precauzioni e vantaggi

Dopo aver letto questo articolo imparerai a conoscere: - 1. Concetti di test non parametrici 2. Assunzioni di test non parametrici 3. Precauzioni 4. Alcuni test non parametrici 5. Vantaggi 6. Svantaggi.

Concetti di test non parametrici:

Un po 'più di recente abbiamo visto lo sviluppo di un gran numero di tecniche di inferenza che non fanno ipotesi numerose o stringenti sulla popolazione da cui abbiamo campionato i dati. Queste tecniche di distribuzione libere o non parametriche portano a conclusioni che richiedono meno qualifiche.

Avendo usato uno di questi, potremmo essere in grado di dire che, "Indipendentemente dalla forma della popolazione (o dalle popolazioni), possiamo concludere che ...".

I due nomi alternativi che vengono spesso dati a questi test sono:

Distribuzione-Free:

I test non parametrici sono "senza distribuzione". Non presuppongono che i punteggi in analisi siano tratti da una popolazione distribuita in un certo modo, ad esempio da una popolazione normalmente distribuita.

Quando si effettuano test sul significato della differenza tra due mezzi (in termini di CR o t, per esempio), si assume che i punteggi su cui si basano le nostre statistiche siano normalmente distribuiti nella popolazione. Quello che realmente fanno-sotto l'ipotesi nulla-è di stimare dalle nostre statistiche campionarie la probabilità di una vera differenza tra i due parametri.

Quando N è piuttosto piccolo oi dati sono malamente distorti, così che l'assunzione di normalità è dubbia, i "metodi parametrici" hanno un valore dubbio o non sono affatto applicabili. Ciò di cui abbiamo bisogno in questi casi sono le tecniche che ci permetteranno di confrontare i campioni e di fare inferenze o test di significatività senza dover assumere la normalità nella popolazione.

Tali metodi sono definiti non parametrici o privi di distribuzione. Il test X 2 del test chi-quadrato, ad esempio, è una tecnica non parametrica. Il significato di X 2 dipende solo dai gradi di libertà nella tabella; non è necessario formulare alcuna ipotesi sulla forma di distribuzione per le variabili classificate nelle categorie della tabella X 2 .

Il coefficiente di correlazione di rango-differenza (rho) è anche una tecnica non parametrica. Quando p è calcolato da punteggi classificati in ordine di merito, la distribuzione da cui vengono presi i punteggi può essere distorta in modo errato e N è quasi sempre piccola.

Test di classifica:

In alternativa, molti di questi test sono identificati come "test di classificazione", e questo titolo suggerisce l'altro merito principale: le tecniche non parametriche possono essere utilizzate con punteggi che non sono esatti in alcun senso numerico, ma che in effetti sono semplicemente gradi.

Presupposti di test non parametrici:

Un test statistico non parametrico si basa su un modello che specifica solo condizioni molto generali e nessuna riguardante la forma specifica della distribuzione da cui è stato tratto il campione.

Alcune ipotesi sono associate alla maggior parte dei test statistici non parametrici, in particolare:

1. Che le osservazioni siano indipendenti;

2. La variabile oggetto di studio ha una continuità sottostante;

3. procedure non parametriche per ipotesi diverse sulla popolazione rispetto alle procedure parametriche;

4. A differenza dei test parametrici, esistono test non parametrici che possono essere applicati in modo appropriato ai dati misurati in scala ordinale e altri ai dati in scala nominale o categoriale.

Precauzioni nell'uso di test non parametrici:

Nell'uso di test non parametrici, lo studente viene messo in guardia contro i seguenti errori:

1. Quando le misure sono in termini di intervalli di intervallo e rapporto, la trasformazione delle misure su scale nominali o ordinali porterà alla perdita di molte informazioni. Quindi, per quanto possibile i test parametrici dovrebbero essere applicati in tali situazioni. Usando un metodo non parametrico come scorciatoia, stiamo buttando via dollari per risparmiare pochi centesimi.

2. In situazioni in cui sono soddisfatte le ipotesi sottostanti a un test parametrico e si possono applicare sia test parametrici che non parametrici, la scelta dovrebbe essere sul test parametrico poiché la maggior parte dei test parametrici ha maggiore potenza in tali situazioni.

3. I test non parametrici, senza dubbio, forniscono un mezzo per evitare l'assunzione di normalità della distribuzione. Ma questi metodi non fanno nulla per evitare le assunzioni di indipendenza sulla omoscedasticità, laddove applicabile.

4. Lo scienziato comportamentale deve specificare l'ipotesi nulla, l'ipotesi alternativa, il test statistico, la distribuzione del campionamento e il livello di significatività in anticipo rispetto alla raccolta di dati. La ricerca di un test statistico dopo che i dati sono stati raccolti tende a massimizzare gli effetti di eventuali differenze casuali che favoriscono un test rispetto ad un altro.

Di conseguenza, la possibilità di rifiutare l'ipotesi nulla quando è vera (errore di tipo I) è notevolmente aumentata. Tuttavia, questa precauzione è applicabile sia ai test parametrici che non parametrici.

5. Non abbiamo il problema di scegliere test statistici per variabili categoriali. I soli test non parametrici sono adatti per i dati enumerativi.

6. I test F e t sono generalmente considerati test robusti perché la violazione delle ipotesi sottostanti non inficia le conclusioni.

È consuetudine giustificare l'uso di un normale test teorico in una situazione in cui la normalità non può essere garantita, sostenendo che è solida sotto la non-normalità.

Alcuni test non parametrici:

Discuteremo alcuni test non parametrici comuni.

1. Test di accesso:

Il test del segno è la più semplice di tutte le statistiche prive di distribuzione e presenta un livello molto elevato di applicabilità generale. È applicabile in situazioni in cui il rapporto critico, t, test per campioni correlati non può essere utilizzato perché le ipotesi di normalità e omoschedasticità non sono soddisfatte.

Gli studenti sono consapevoli del fatto che determinate condizioni nell'impostazione dell'esperimento introducono l'elemento di relazione tra i due insiemi di dati.

Queste condizioni sono generalmente una situazione pre-test e post-test; una situazione di test e re-test; test di un gruppo di soggetti su due test; formazione di "gruppi abbinati" accoppiando alcune variabili estranee che non sono oggetto di indagine, ma che possono influenzare le osservazioni.

Nel test del segno testiamo il significato del segno di differenza (come più o meno). Questo test viene applicato quando N è inferiore a 25.

Il seguente esempio ci chiarirà il test dei segni:

Esempio:

I punteggi spesso soggetti in due condizioni diverse, A e B sono indicati di seguito. Applicare il test del segno e verificare l'ipotesi che A sia superiore a B.

Escludendo 0 (zero) abbiamo nove differenze, di cui sette sono più.

Dobbiamo ora espandere il binomio, (p + q) 9

(p + q) 9 = p 9 + 9p 8 q + 36p 7 q 2 + 84p 6 q 3 + 126 p 5 q 4 + 126 p 4 q 5 + 84p 3 q 6 + 36 p 2 q 7 + 9 pq 8 + q 9 .

Il numero totale di combinazioni è 2 9 o 512. Aggiungendo i primi 3 termini (vale a dire, p 9 + 9p 8 q + 36 p 7 q 2 ), abbiamo un totale di 46 combinazioni (cioè, 1 di 9, 9 di 8 e 36 di 7) che contengono 7 o più segni più.

Circa 46 volte in 512 prove 7 o più segni più su 9 si verificheranno quando il numero medio di segni + sotto l'ipotesi nulla è 4, 5. La probabilità di 7 o più segni, quindi, è 46/512 o .09, ed è chiaramente non significativa.

Questo è un test a una coda, poiché la nostra ipotesi afferma che A è migliore di B. Se l'ipotesi fosse stata che A e B differiscono senza specificare quale sia superiore, avremmo avuto un test a 2 code per il quale P = .18.

Sono disponibili tabelle che forniscono il numero di segni necessari per la significatività a diversi livelli, quando N varia in termini di dimensioni. Quando il numero di coppie è pari a 20, la curva normale può essere utilizzata come approssimazione all'espansione binomiale o al test x 2 applicato.

2. Test mediano:

Il test mediano viene utilizzato per confrontare le prestazioni di due gruppi indipendenti come ad esempio un gruppo sperimentale e un gruppo di controllo. Innanzitutto, i due gruppi vengono lanciati insieme e viene calcolata una mediana comune.

Se i due gruppi sono stati estratti a caso dalla stessa popolazione, 1/2 dei punteggi in ciascun gruppo dovrebbero trovarsi sopra e 1/2 sotto la mediana comune. Per testare questa ipotesi nulla, dobbiamo elaborare una tabella 2 x 2 e calcolare x 2 .

Il metodo è mostrato nel seguente esempio:

Esempio:

Uno psicologo clinico vuole investigare gli effetti di una droga tranquillizzante al tremore della mano. Quattordici pazienti psichiatrici ricevono il farmaco e ad altri 18 pazienti viene somministrata una dose innocua. Il primo gruppo è sperimentale, il secondo il gruppo di controllo.

Il farmaco aumenta la stabilità, come dimostrato dai punteggi più bassi nel gruppo sperimentale? Poiché siamo preoccupati solo se il farmaco riduce il tremore, questo è un test a una coda.

Test mediano applicato a gruppi sperimentali e di controllo. I segni più indicano punteggi sopra la mediana comune, meno segni sotto la media comune.

N = 14 N = 18

Mediana comune = 49, 5

La mediana comune è 49, 5. Nel gruppo sperimentale 4 i punteggi sono sopra e 10 sotto la mediana comune invece dei 7 sopra e 7 sotto per essere attesi per caso. Nel gruppo di controllo, 12 punteggi sono sopra e 6 sotto la mediana comune invece dei 9 attesi in ciascuna categoria.

Queste frequenze sono inserite nella seguente tabella e X 2 è calcolato dalla formula (indicata sotto) con correzione per la continuità:

AX 2 c di 3, 17 con 1 grado di libertà produce ap che giace a 0, 08 circa a metà strada tra 0, 05 e 0, 10. Volevamo sapere se la mediana del gruppo sperimentale era significativamente inferiore a quella del controllo (indicando quindi più stabilità e meno tremore).

Per questa ipotesi, un test a una coda, p / 2, è approssimativamente 0, 04 e X 2 c è significativo a livello 0, 5. Se la nostra ipotesi fosse che i due gruppi differiscono senza specificare la direzione, avremmo avuto un test a due code e X 2 sarebbe stato contrassegnato come non significativo.

La nostra conclusione, fatta a titolo di prova, è che il farmaco produce una riduzione del tremore. Ma a causa dei piccoli campioni e della mancanza di una scoperta molto significativa, lo psicologo clinico avrebbe quasi certamente ripetuto l'esperimento, forse diverse volte.

X 2 è generalmente applicabile nel test mediano. Tuttavia, quando N 1 e N 2 sono piccoli (ad es. Meno di circa 10) e il test di X 2 non è accurato e dovrebbe essere usato il metodo esatto di calcolo delle probabilità.

Vantaggi dei test non parametrici:

1. Se la dimensione del campione è molto piccola, potrebbe non esserci alternativa all'utilizzo di un test statistico non parametrico a meno che la natura della distribuzione della popolazione non sia nota esattamente.

2. I test non parametrici tipicamente fanno meno ipotesi sui dati e potrebbero essere più rilevanti per una particolare situazione. Inoltre, l'ipotesi testata dal test non parametrico può essere più appropriata per l'indagine di ricerca.

3. Sono disponibili test statistici non parametrici per analizzare dati che sono intrinsecamente in ranghi e dati i cui punteggi apparentemente numerici hanno la forza dei ranghi. Cioè, il ricercatore può solo essere in grado di dire dei suoi soggetti che uno ha più o meno delle caratteristiche di un altro, senza poter dire quanto più o meno.

Ad esempio, nello studio di una variabile come l'ansia, potremmo essere in grado di affermare che il soggetto A è più ansioso del soggetto B senza sapere esattamente quanto A è più ansioso.

Se i dati sono intrinsecamente in ranghi, o anche se possono essere categorizzati solo come più o meno (più o meno, meglio o peggiori), possono essere trattati con metodi non parametrici, mentre non possono essere trattati con metodi parametrici a meno che non siano precari e, forse, ipotesi irrealistiche sono fatte sulle distribuzioni sottostanti.

4. Sono disponibili metodi non parametrici per trattare dati che sono semplicemente classificatori o categoriali, cioè misurati in scala nominale. Nessuna tecnica parametrica si applica a tali dati.

5. Esistono test statistici non parametrici adatti per il trattamento di campioni costituiti da osservazioni di diverse popolazioni. I test parametrici spesso non sono in grado di gestire tali dati senza richiedere a noi di assumere asserzioni apparentemente irrealistiche o di richiedere calcoli ingombranti.

6. I test statistici non parametrici sono in genere molto più facili da imparare e da applicare rispetto ai test parametrici. Inoltre, la loro interpretazione è spesso più diretta dell'interpretazione dei test parametrici.

Svantaggi dei test non parametrici:

1. Se tutti i presupposti di un metodo statistico parametrico sono, infatti, soddisfatti nei dati e l'ipotesi di ricerca potrebbe essere testata con un test parametrico, i test statistici non parametrici sono dispendiosi.

2. Il livello di spreco è espresso dall'efficienza energetica del test non parametrico.

3. Un'altra obiezione ai test statistici non parametrici è che non sono sistematici, mentre i test statistici parametrici sono stati sistematizzati, e test diversi sono semplicemente variazioni su un tema centrale.

4. Un'altra obiezione ai test statistici non parametrici riguarda la convenienza. Le tabelle necessarie per implementare i test non parametrici sono ampiamente disperse e appaiono in diversi formati.