Errore standard della media

Dopo aver letto questo articolo imparerai lo standard della media.

L'inferenza statistica ci aiuta anche a verificare l'ipotesi che "la statistica basata sul campione non è significativamente diversa dal parametro della popolazione e che la differenza se rilevata è solo dovuta alla variazione casuale" .

Errore standard della media (SE M o σ M )

L'errore standard della media (SE M ) è abbastanza importante per testare la rappresentatività o l'attendibilità o il significato della media.

Supponiamo di aver calcolato che il punteggio medio di 200 ragazzi di 10 ° grado di Delhi nel test di abilità numerica sia 40. Quindi 40 è la media di un solo campione prelevato dalla popolazione (tutti i ragazzi che leggono in classe X a Delhi).

Possiamo anche disegnare diversi campioni casuali di 200 ragazzi della popolazione. Supponiamo di scegliere casualmente 100 campioni diversi, ciascun campione costituito da 200 ragazzi della stessa popolazione e calcolare la media di ciascun campione.

Sebbene "n" sia 200 in ciascun caso, 200 ragazzi scelti casualmente per costituire i diversi campioni non sono identici e quindi a causa della fluttuazione nel campionamento otterremmo 100 valori medi da questi 100 diversi campioni.

Questi valori medi tenderanno a differire l'uno dall'altro e formerebbero una serie. Questi valori formano la distribuzione campionaria dei mezzi. Può essere espresso matematicamente che questi mezzi campione sono distribuiti normalmente.

I 100 valori medi (nel nostro esempio) cadranno in una distribuzione normale attorno a M pop, il M pop essendo la media della distribuzione campionaria dei mezzi. La deviazione standard di questi 100 campioni è denominata SE M o Errore standard della media che sarà uguale alla deviazione standard della popolazione divisa per radice quadrata di (dimensione del campione).

La SE M mostra la diffusione dei mezzi campione attorno a M pop . Quindi SE M è una misura della variabilità dei mezzi campione. È una misura della divergenza dei mezzi campione da M pop . SE M è anche scritto come σ M.

L'errore standard della media (SE M o σ M ) viene calcolato utilizzando la formula (per campioni di grandi dimensioni)

(A) Calcolo di SE M in campioni di grandi dimensioni :

dove σ = deviazione standard della popolazione e

n = numero di casi inclusi nel campione

(Dato che raramente abbiamo la SD di una popolazione, per σ usiamo il valore di SD delle medie campionarie).

Intervallo di confidenza:

I due intervalli di confidenza, vale a dire il 95% e il 99% sono in uso generale. RA Fisher indica i limiti dell'intervallo di confidenza che contiene il parametro come "limiti fiduciari" e indica la fiducia riposta nell'intervallo come probabilità fiduciaria.

(a) 95% dell'intervallo di confidenza:

Riferendosi alla tabella di area sotto una curva normale, troviamo che il 95% dei casi si trova tra M ± 1, 96 SE M. Che siamo sicuri al 95% o corretto dire che M pop si troverebbe nell'intervallo M + 1.96 SE M e M + 1.96 SE M e siamo sbagliati del 5% per dire che M pop si troverà in questo intervallo.

In altre parole, la probabilità di M pop è compresa nell'intervallo M ± 1, 96 SE M è 95% (o .95) e la probabilità che M pop sia al di fuori dell'intervallo è del 5% (o .05). Il valore, 1, 96 è il valore critico a 0, 05 del livello di significatività.

(b) 99% dell'intervallo di confidenza:

Riferendosi alla tabella di area sotto una curva normale, troviamo che il 99% dei casi si trova tra M ± 2, 58 SE M. Che siamo sicuri al 99% o esatti nel dire che M pop si troverebbe nell'intervallo tra M - 2.58 SE M e M + 2.58 SE M e ci sbagliamo all'1% per dire che M pop giace fuori da questo intervallo.

In altre parole, la probabilità di M pop è compresa nell'intervallo M ± 2.58 SE M è 99% (o .99) e la probabilità che M pop sia al di fuori dell'intervallo è 1% (o .01). Il valore, 2, 58 è il valore critico con un livello di significatività di 0, 1.

Qui troviamo che il livello di significatività è inversamente correlato all'estensione della precisione. Nel livello di significatività 05 saremmo precisi nel 95% dei casi e nel livello .01 di significatività saremmo accurati nel 99% delle facilitazioni.

La tabella riportata di seguito ti precederà ulteriormente:

Esempio 1:

La media e l'SD di 225 ragazzi della classe XII di Delhi in un test di Abilità numerica erano rispettivamente 48 e 6. Quanto bene questo mezzo rappresenta il M pop o stima M pop . (n = 225, σ = 6, Media = 48]

Facendo riferimento alla tabella della distribuzione normale (Tabella A) troviamo che tutti i casi più (99, 7) si trovano in ± 3σ. Nel caso del nostro esempio, tutti i mezzi di campionamento saranno compresi tra M pop + 3σ m e M pop - 3σ M. Quindi, qualsiasi media campionaria sarà migliore 3σ m in meno di M pop su 3σ M in più rispetto a M pop .

Quindi se conosciamo il valore di σ M possiamo dedurre circa il M pop dalla nostra media campionaria. Qui 4 è la deviazione standard della distribuzione dei mezzi campione di cui la nostra media è una. Tutti i mezzi campione che sono normalmente distribuiti attorno a M pop si troveranno tra M pop + 3 SE M e M pop - 3 SE M.

3 SE M = 3 x .4 = 1.2

Sebbene non conosciamo il valore esatto di M pop, possiamo almeno dire con sicurezza che M pop si trova nel mezzo

(48 -1.2) e (48 + 1.2) o 46.8 → 49.2

Dalla tabella A troviamo che il 95% delle eases si trova tra ± 1.96 σ. Nel caso del nostro esempio l'intervallo di confidenza al 95% per M pop varia da M - 1, 96 SE M a M + 1, 96 SE M.

Ora, 1, 96 SE M = 1, 96 x .4 = 0, 78

. . . M- 1.96 SE M = 48 - .78 = 47.22 e M + 1.96 SE M = 48 + .78 = 48.78

. . . L'intervallo di confidenza del 95% varia da 47, 22 a 48, 78. L'intervallo di confidenza del 99% per M pop va da M - 2, 58 SE M a M + 2, 58 SE M.

Ora 2, 58 SE M = 2, 58 X, 4 = 1, 03

. . . M - 2, 58 SE M = 48 -1, 03 = 46, 97 e M + 2, 58 SE M = 48 + 1, 03 = 49, 03

. . . L'intervallo di confidenza del 99% per M pop varia da 46.97 a 49.03.

Esempio 2:

La media e la DS di 400 studenti in un test sono risultate essere 42 e 8. Riesci a stimare il punteggio medio della popolazione con un intervallo di confidenza del 99% e del 95%?

Soluzione:

(i) intervallo di confidenza al 95% per intervalli M pop da M - 1, 96 SE M a M + 1, 96 SE M.

Ora 1, 96 SE M = 1, 96 x .4 = .784

. . . M-1.96 SE M = 42-.784 = 41.22

e M + 1, 96 SE M = 42 + .784 = 42, 78 (fino a due decimali).

Quindi l'intervallo di confidenza al 95% varia da 41, 22 a 42, 78. Siamo precisi al 95% che M pop si trova tra 41.22 e 42.78.

(ii) intervallo di confidenza del 99% per intervalli M pop da M - 2, 58 SE M a M + 2, 58 SE M

Ora 2, 58 SE M = 2, 58 x 4 = 1, 03

. . . M - 2, 58 SE M = 42- 1, 03 = 40, 97

e M +2, 58 SE M = 42 + 1, 03 = 43, 03

Pertanto l'intervallo di confidenza del 99% varia tra 40, 97 e 43, 03. Siamo sicuri al 99% che M pop si trova tra 40.97 e 43.03.

Esempio 3:

I mezzi e la DS di un campione di 169 ragazzi in un test di Abilità Numerica sono rispettivamente 50 e 6:

(i) Determina l'intervallo del 95% per la media della popolazione e interpretala.

(ii) Determinare l'errore di campionamento accettabile al livello di significatività 0, 05 e 0, 01.

(iii) Determinare l'intervallo di confidenza del 99% per M pop .

Soluzione:

M = 50

(i) intervallo di confidenza al 95% per intervalli di Mp 0p da M - 1, 96 SE M a M + 1, 96 SE M.

Ora 1.96 SE m = 1.96 x .46 = .90

Quindi M-1.96 SE M = 50-.90 = 49.10

e M + 1, 96 SE M = 50 + 90 = 50, 90

. . . L'intervallo di confidenza del 95% per M pop varia da 49, 10 a 50, 90. Dalla media campionaria di 50 stimiamo che il M pop abbia un valore fisso compreso tra 49, 10 e 50, 90 e nel dire che siamo sicuri al 95%.

In altre parole, la nostra media campionaria di 50 non mancherà il M pop di oltre il .90 e questo sarà vero per 95 casi su 100. In alternativa, solo in 5 casi su 100 il nostro campione di 50 mancherà il M pop di più di .90.

(ii) Valore critico con un livello di significatività di 0, 05 = 1, 96

Valore critico con un livello di significatività di 0, 01 = 2, 58

"Errore campionamento = valore critico x SE M "

Quindi l'errore di campionamento con un livello di significatività di 0, 05 è 1, 96 SE M e quello con un livello di significatività di 0, 02 2, 58 SE M

Errore di campionamento accettabile a livello .05 = 1, 96 SE M = 1, 96 x .46 = 0, 90

Errore di campionamento ammesso a livello .01 = 2, 58 SE M = 2, 58 X, 46 = 1, 19

(iii) L'intervallo di confidenza del 99% varia da M - 2, 58 SE M a M + 2, 58 SE M

Ora 2, 58 SE M = 2, 58 X, 46 = 1, 19

Quindi M-2.58 SE M = 50- 1.19 = 48.81

e M +2, 58 SE M = 50 + 1, 19 = 51, 19

L'intervallo di confidenza del 99% varia da 48, 81 a 51, 19.

Esempio 4:

Per un dato gruppo di 500 soldati il ​​punteggio medio AGCT è 95, 00 e l'SD è 25.

(ii) Determinare l'intervallo di confidenza .99 per la media vera.

(ii) È improbabile che la media vera sia più grande di quale valore?

Soluzione:

(i) L'intervallo di confidenza del 99% va da M - 2, 58 SE M a M + 2, 58 SE M.

Ora 2, 58 SE M = 2, 58 x 1, 12 = 2, 89

Quindi M-2.58 SE M = 95.0-2.89 = 92.11

e M + 2, 58 SE M = 95, 0 + 2, 89 = 97, 89

. . . L'intervallo di confidenza del 99% varia da 92, 11 a 97, 89.

Dalle nostre medie campionarie di 95.0 stimiamo la media reale per un valore fisso compreso tra 92, 11 e 97, 89 e, per così dire, siamo sicuri al 99%.

(ii) La media campionaria di 95.0 non mancherà alla media vera di oltre 2, 89, ovvero il vero non è maggiore di 97, 89.

(B) Calcolo di SE M in un piccolo campione:

È convenzionale chiamare qualsiasi campione maggiore di 30 come campione grande. Quando N è grande, non vale la pena apportare la correzione. Ma quando N è "piccolo" (meno di 30), è consigliabile usare (N - 1), ed è imperativo quando N è piuttosto piccolo - per esempio, meno di 10.

Lo studente deve ricordare (i) che teoricamente (N - 1) dovrebbe sempre essere usato quando SD deve essere una stima della popolazione a; e che (ii) la distinzione tra "grandi statistiche campionarie" e "piccole statistiche campionarie" in termini di un punto di taglio di N = 30 è arbitraria, ed è in parte una questione di convenienza.

Quando N è inferiore a circa 30 la formula per σ M o SE M dovrebbe contenere:

Esempio 5:

A seguito di cinque studenti hanno ottenuto punteggi in una prova:

Determina i limiti del limite di confidenza del 95% per la media della popolazione.

I punteggi sono - 11, 13, 9, 12, 15:

Soluzione:

M = 12

Qui df = n- 1 = 5-1 = 4

Facendo riferimento alla Tabella D, con df = 4, il valore- t al livello di significatività di 0, 05 (ossia il livello di confidenza del 95%) è 2, 78.

L'intervallo di confidenza del 95% definisce M ± 2, 78 SE M

2, 78 SE M = 2, 78 x 1, 0 = 2, 78

M - 2, 78 SE M = 12 - 2, 78 x 1, 0 = 9, 22 e

M + 2, 78 SE M = 12 + 2, 78 x 1, 0 = 14, 78

. . . I limiti dell'intervallo di confidenza del 95% sono 9.22 e 14.78.

Ciò significa che P = .95 che M pop si trova nell'intervallo da 9.22 a 14.78.

Esempio 6:

Dieci misure di tempo di reazione alla luce sono prese da un osservatore esperto. La media è 175, 50 ms (millisecondi) e la S è 5, 82 ms. Determina l'intervallo di confidenza .95 per il pop M; l'intervallo di confidenza .99.

Soluzione:

n = 10, S = 5, 82 ms, M = 175, 50 ms

I df (gradi di libertà) disponibili per determinare t sono (n - 1) o (10 - 1) = 9

(i) Determinazione dell'intervallo di confidenza del 95% (o 95):

Inserendo la Tabella D con 9 df, leggiamo che t = 2.26 al punto .05.

Intervallo di confidenza del 95% per intervalli M pop da M - 2.26 SE M a M + 2.26 SE M.

Ora 2, 26 SE M = 2, 26 x 1, 84 = 4, 16

Quindi M - 2, 26 SE M = 175, 50 -4, 16 = 171, 34

e M + 2, 26 SE M = 175, 50 + 4, 16 = 179, 66

. . . L'intervallo di confidenza del 95% per M pop va da 171.34 a 179.66. La P è .95 che il M pop non è inferiore a 171.34 né superiore a 179.66. Se deduciamo che M pop si trova all'interno di questo intervallo, nel corso di una lunga serie di esperimenti dovremmo avere ragione il 95% delle volte e il 5% sbagliato.

(ii) Determinazione dell'intervallo di confidenza del 99% (o .99):

Entrando nella Tabella D con 9 df leggiamo che t = 3.25 al punto .01. L'intervallo di confidenza del 99% per M pop varia da M - 3, 25 SE M a M + 3, 25 SE M.

Ora 3, 25 SE M = 3, 25 x 1, 84 = 5, 98

Quindi M - 3, 25 SE M = 175, 50 - 5, 98 = 169, 52

e M + 3, 25 SE M = 175, 50 + 5, 98 = 181, 48

. . . L'intervallo di confidenza del 99% per M pop varia da 169, 52 a 181, 48.

La P è .99 che il M pop non è inferiore a 169.52 né superiore a 181.48. Se deduciamo che M pop si trova all'interno di questo intervallo, nel corso di una lunga serie di esperimenti dovremmo avere ragione -99% delle volte e sbagliato 1%.

Inferenze riguardanti altre statistiche:

Poiché tutte le statistiche hanno distribuzioni campionarie e errori standard, il significato della mediana, della deviazione del quartile, della deviazione standard, delle percentuali e di altre statistiche può essere interpretato come quello della media e possiamo stimare il parametro.

(i) Errore standard della mediana (o SE Mdn -):

In termini di SD e Q, la SE della mediana per campioni di grandi dimensioni può essere calcolata attraverso le seguenti formule:

in cui σ = SD del campione, n = dimensione del campione e Q = Deviazione quartile del campione.

Un esempio illustrerà l'uso e l'interpretazione delle formule:

Esempio 7:

Sulla scala Trabue Language A, 801 ragazzi di undici anni hanno realizzato il seguente disco:

Mediano = 21, 40 e Q = 4, 90. Quanto bene questa mediana rappresenta la mediana della popolazione da cui è tratto questo campione?

Soluzione:

n = 801, Mdn = 21, 40, Q = 4, 90.

Applicando la seconda formula, il

Poiché N è grande, la distribuzione campionaria può essere considerata normale e l'intervallo di confidenza rilevato dall'ultima riga nella Tabella D. L'intervallo di confidenza di 099 per il pop Mdn è 21, 40 ± 2, 58 x .32 o 21, 40 ± 0, 83.

Possiamo essere sicuri che la mediana della popolazione non sia inferiore a 20.57 né superiore a 22.23. Questo intervallo ristretto mostra un alto grado di affidabilità nella mediana del campione.

(ii) Errore standard della deviazione standard (SE σ ):

L'errore standard della deviazione standard, come SE M, viene rilevato calcolando la probabile divergenza della SD campione dal suo parametro (popolazione SD). La formula per SE σ è

Esempio 8:

n = 400, σ = 6

Quanto bene questa SD rappresenta la SD della popolazione da cui viene estratto il campione?

Soluzione:

Quando i campioni sono grandi e prelevati a caso dalla loro popolazione, la formula sopra può essere applicata e interpretata allo stesso modo di SE M.

Poiché N è grande, l'intervallo di confidenza di 0, 99 per SD pop può essere preso in modo sicuro ai limiti ± 2, 58 σ σ . Sostituendo per σ σ abbiamo 6 ± 2.58 x .21 cioè i limiti tra (6 - .54) e (6 + .54) o 5.46 e 6.54.

Se supponiamo che il pop di SD si collochi tra i limiti 5.46 e 6.54, dovremmo avere ragione il 99% delle volte e sbagliato 1%.

(iii) Errore standard della deviazione del quartile (o SE Q o σ q ):

SE Q può essere trovato dalle formule:

Esempio 9:

n = 801, Q = 4, 90

Quanto bene questa Q rappresenta la Deviazione Quartile della popolazione?

Soluzione:

Applicando la formula

L'intervallo di confidenza di .99 per il pop Q è da 4, 90 ± 2, 58 x 0, 203, cioè da 4, 38 a 5, 42. Questo intervallo mostra che l'esempio Q è una statistica altamente affidabile.

(iv) Errore standard di percentuale (o SE% o σ%):

Dare la percentuale di occorrenza di un comportamento, sorge spesso la domanda di quanta fiducia possiamo mettere nella figura. Quanto è affidabile un indice la nostra percentuale dell'incidenza del comportamento a cui siamo interessati? Per rispondere a questa domanda,

Dobbiamo calcolare il SE di una percentuale con la formula:

in quale

p = la percentuale di occorrenza del comportamento, q = (1 - p)

n = numero di casi.

Esempio 10:

In uno studio sugli imbrogli tra i bambini delle scuole elementari, è stato riscontrato che il 100 o il 25% dei 400 bambini provenienti da famiglie di alto livello socio-economico hanno subito degli ingannevoli test. Quanto bene rappresenta la percentuale di popolazione?

Soluzione:

p = 25% (occorrenza percentuale)

q = 75% (100% - 25%)

L'intervallo di confidenza del 99% per la percentuale di popolazione varia da

25% ± 2, 58 x 2, 17%.

25% - 2, 58 x 2, 17% = 25% - 5, 60% = 19, 4%

e 25% + 2, 58 x 2, 17% = 25% + 5, 60 = 30, 60%

Possiamo assumere con il 99% di confidenza che i bambini delle scuole elementari di alto status socio-economico potrebbero barare con almeno il 19, 4% e non saranno più grandi del 30, 60%.

(v) Errore standard del coefficiente di correlazione (SE r o σ r ):

La formula classica per la SE di a- è

(SE di un coefficiente di correlazione r quando N è grande)

Esempio 11:

n = 120, r = .60.

Quali sono i limiti dell'intervallo di confidenza del 99% per la popolazione r

Soluzione:

Intervallo di confidenza del 99%

= r ± 2, 58 SE r = .60 ± 2, 58 SE r

= .60 ± .15 o .45 a .75

Termini statistici importanti:

(i) Livelli:

.05:

Probabilità di sbagliare in 5 campioni su 100 campioni.

.01:

Probabilità di sbagliare in 1 campione su 100 campioni.

(ii) Fiducia:

In .05 livello di significatività lo sperimentatore ha il 95% di confidenza che i dati devono rappresentare la popolazione.

In .01 livello di significatività lo sperimentatore ha il 99% di confidenza che la statistica campionaria deve rappresentare la popolazione.

(iii) Livelli di significatività:

Prima di testare l'ipotesi, dobbiamo decidere i criteri con i quali vogliamo accettare o rifiutare l'ipotesi nulla. Dobbiamo impostare il livello di significatività prima del test. Due livelli di significatività sono in generale, vale a dire, .05 livello e .01 livello.

(a) .05 livello di significatività:

Leggiamo dalla tabella A che il 95% dei casi in una distribuzione normale rientra nei limiti ± 1.96 SE M. Se prendiamo i limiti specificati da M ± 1, 96 SE M, definiamo un intervallo per il quale il livello di confidenza è .95. Basando il nostro giudizio come la dimensione di M pop su questi limiti, abbiamo ragione per il 95% delle volte e il 5% sbagliato.

L'area compresa tra - 1.96 SE M e + 1.96 SE M è nota come area di accettazione di H o e l'area oltre - 1.96 SE M e + 1.96 SE M è nota come area di rifiuto. Se qualsiasi media campionaria si trova nell'area dell'accettazione, accettiamo l'H o . Nel respingere l'H o ammettiamo che la media campionaria potrebbe non superare ± 1.96 SE M.

Quindi nel rifiutare H o facciamo un errore del 5% perché nel 5% su 100 facilita la media del campione. Siamo disposti a rischiare fino al 5% nel rifiutare H o quando è vero. Quindi i criteri per rifiutare H o sono inveiti sul livello di significatività.

(b). 01 livello di significatività:

Leggiamo dalla tabella A che il 99% delle facilitazioni in una distribuzione normale rientra nei limiti ± 2, 58 SE M. Se specchiamo i limiti specificati da M ± 2.58 SE M, definiamo un intervallo per il quale il livello di confidenza è pari a .99. Basando il nostro giudizio sulla dimensione di M pop su questi limiti, abbiamo ragione per il 99% delle volte e sbagliato 1%.

L'area compresa tra - 2, 58 SE M e + 2, 58 SE M sarebbe l'area di accettazione di H 0 e l'area oltre quella sarebbe l'area di rifiuto di H o . Siamo disposti a prendere il rischio dell'1% nel rifiutare H o quando è vero.

0, 01 livello di significatività è più esigente del livello .05 perché nel livello 0, 01 l'errore nel rifiuto di H o è 1% mentre nel livello .05 tale errore è 5%.

(iv) distribuzione t:

Ogni volta che N è inferiore a circa 30, ovvero quando il campione è piccolo, la distribuzione campionaria è chiamata "distribuzione t ".

La distribuzione t non differisce molto dalla normale a meno che N sia piuttosto piccola. Man mano che N aumenta di dimensioni, la distribuzione t si avvicina sempre più alla forma normale.

Proprietà della distribuzione t:

1. Sembra una curva a forma di campana. Ma la sua distribuzione è più variabile con zero skewness e 'Ku' maggiore di 3.

2. È simmetrico rispetto alla linea t = 0.

3. Non è unimodale con l'ordinata massima at = 0.

4. Quando N è piccolo, la distribuzione t si trova sotto la curva normale, ma le code o le estremità della curva sono più alte delle corrispondenti parti della curva normale.

5. Le unità lungo la linea di base della distribuzione t sono in realtà σ punteggi, cioè,

(v) Gradi di libertà (df):

Il concetto di gradi di libertà è molto importante nelle piccole statistiche campionarie. È anche cruciale, nell'analisi della varianza e in altre procedure. Gradi di libertà significa libertà di variare.

Scegliamo cinque punteggi la cui media deve essere 15. Supponiamo ora che i quattro punteggi siano 18, 10, 20, 15. Per il valore medio uguale a 15, il quinto punteggio deve essere 12. Abbiamo, ovviamente, libertà di scegliere qualsiasi quattro punteggi.

Ma non abbiamo la libertà di scegliere il 5 ° punteggio perché il 5 ° punteggio apporta aggiustamenti nella variazione determinata dai primi quattro punteggi e con l'assunto che la media sarà 15. Qui viene imposto N = 5 e una restrizione media deve essere 15. Pertanto, il grado di libertà è N - 1 o 4.

Se abbiamo 5 punteggi 5, 6, 7, 8 e 9, la media è 7; e le deviazioni dei nostri punteggi da 7 sono - 2, - 1, 0, 1 e 2. La somma di queste deviazioni è zero. Delle 5 deviazioni, solo 4 (N - 1) possono essere selezionate "liberamente" in quanto la condizione in cui la somma uguale a zero limita immediatamente il valore del 5 devia.

La SD è, ovviamente, basata sui quadrati delle deviazioni prese attorno alla media. Ci sono N df per calcolare la media, ma solo (N - 1) disponibile per la 'S' (la SD) come un df è perso nel calcolo della media.

In un altro esempio, dove N = 10, il df disponibile per la stima del M pop è stato dato come 9 o (N - 1) cioè uno in meno del numero di osservazioni, vale a dire 10. Un df è perso nel calcolo della M e di conseguenza ne restano solo 9 per stimare il M pop tramite 'S' e la distribuzione t.

Ogni volta che una statistica viene utilizzata per stimare un parametro, la regola è che il df disponibile è uguale a N meno il numero di parametri già stimati dal campione. La M è una stima di M pop e nel calcolo perdiamo 1 df .

Per stimare l'affidabilità di una r, per esempio (che dipende dalle deviazioni da due medie), i df sono (N - 2). In caso di test del chi quadrato e analisi della varianza, vengono seguite le procedure separate per determinare il df .

(vi) ipotesi nulla:

L'ipotesi nulla è uno strumento utile per testare il significato delle differenze. Questa ipotesi afferma che non esiste una vera differenza tra due medie di popolazione, e che la differenza riscontrata tra i mezzi campione è, quindi, accidentale e non importante.

L'ipotesi nulla è legata al principio legale secondo cui "un uomo è innocente finché non viene provato colpevole". Rappresenta una sfida e la funzione di un esperimento è quella di dare ai fatti la possibilità di confutare (o non riuscire a smentire) questa sfida.

Per illustrare, si suppone che si affermi che "gli standard educativi delle scuole a turno singolo sono migliori delle scuole a doppio turno". Questa ipotesi è vagamente dichiarata e non può essere verificata con precisione.

Se affermiamo che "le scuole a turno unico non producono migliori standard di istruzione rispetto alle scuole a doppio turno" (la vera differenza è zero). Questa ipotesi nulla è esatta e può essere testata. Se la nostra ipotesi nulla è non tassabile, deve essere respinta. La dichiarazione di non-differenza presuppone che i due gruppi saranno testati e trovati uguali.

La forma nulla è preferita dalla maggior parte del personale di ricerca esperto. Questa forma di affermazione definisce più facilmente il modello matematico da utilizzare nel test statistico dell'ipotesi.

Un'ipotesi nulla non viene mai dimostrata o smentita. Può essere accettato o respinto con un certo grado di sicurezza (o ad un certo livello di importanza).

Prima di testare un'ipotesi, dobbiamo tener conto di quanto segue:

1. Se il campione è grande o piccolo.

2. Qual è il livello di significatività.

3. Se il test è un test a due code o a coda singola.

(vii) Errori nel fare inferenze:

Pur accettando o rifiutando l'ipotesi nulla, vi è la possibilità di commettere due tipi di errori e di concupiscenze da parte dei ricercatori.

Di seguito sono descritti i cosiddetti errori di Tipo I e Tipo II:

Errori di tipo I:

Tali errori vengono commessi quando rifiutiamo un'ipotesi nulla contrassegnando una differenza significativa, sebbene non vi sia alcuna differenza reale. Supponiamo che la differenza tra due medie di popolazione (M pop - M pop = 0) sia effettivamente zero. (Ad esempio, si può pensare che ragazzi e ragazze costituiscano la stessa popolazione rispetto alla maggior parte dei test mentali). Se il test di significatività di due medie campionarie riflette il fatto che la differenza di mezzi di popolazione è significativa, commettiamo errori di Tipo I.

Errori di tipo II:

Questo tipo di errore viene commesso quando accettiamo un'ipotesi nulla contrassegnando una differenza non significativa, sebbene ci sia una vera differenza. Supponiamo che ci sia una vera differenza tra i due mezzi di popolazione.

Se il nostro test di significatività applicato ai due mezzi di campionamento ci porta a credere che la differenza di mezzi di popolazione non sia significativa, commettiamo un errore di tipo II.

Varie precauzioni possono essere prese per evitare entrambi i tipi di errori. Se impostiamo un basso livello di significatività (P è maggiore di .05), aumentiamo la probabilità di errori di Tipo I; mentre, se impostiamo un alto livello di significatività (P è inferiore a 0, 05), gli errori di tipo I saranno inferiori. La possibilità di disegnare inferenze erronee di tipo II è migliorata quando stabiliamo un livello molto alto di significatività.

(viii) Prove di rilevanza a due code e a una coda:

Nell'ipotesi nulla le differenze tra i mezzi ottenuti (cioè, M 1 - M 2 ) possono essere più o meno. Nel determinare le probabilità prendiamo entrambe le code della distribuzione campionaria.

(ix) Rapporto critico (CR):

Il rapporto critico (CR) viene rilevato dividendo la differenza tra il mezzo campione per il suo errore standard (CR = D / SE D ). Quando N dei campioni sono grandi (30 o più è "grande"), la distribuzione di CR è nota per essere normale attorno alla vera differenza tra i mezzi di popolazione, t è un rapporto critico in cui una stima più precisa di σ D viene usato. La distribuzione campionaria di t non è normale quando N è piccolo (meno di 30, per esempio), t è un CR; ma tutti i CR non sono t.

Test a due code:

1. Nel test a due code prendiamo in considerazione entrambe le code della curva normale.

2. In caso di ipotesi alternativa senza coda effettuiamo un test a due code.

3. Esempio:

Un test di interesse viene somministrato a determinati ragazzi in ambito professionale. Corso di formazione e alcuni ragazzi in una classe latina. La differenza media tra i due gruppi è significativa al livello di 0, 05?

4. La media campionaria si discosta da M pop in entrambe le direzioni + o -.

5. H 0 : M 1 - M 2 = 0

H A : M 1 = M 2

6. Valore per essere significativo:

1, 96 a livello .05

2, 58 a livello 01

7. L'area di rifiuto è divisa in entrambe le estremità (code) della curva normale (ad esempio 05 in .025 e .025, 01 in .005 e .005).

Test a una coda:

1. Dobbiamo prendere in considerazione un tall cioè alla sinistra o al lato destro della curva normale.

2. Nel caso di ipotesi alternative direzionali facciamo un test a una coda, M 1 > M 2 . In tal caso, la direzione è molto chiara, a senso unico.

3.Example:

Dieci soggetti ricevono 5 scie consecutive su un test con simboli numerici di cui vengono mostrati solo i punteggi per le tracce 1 e 5. Il guadagno medio dalla fase iniziale a quella finale è significativo?

4. La media campionaria si discosta dalla media della popolazione in una direzione.

5. H 0 : M 1 = M 2

H A : M 1 > M 2 o M 1 <m 2

6. Valore per essere significativo:

1, 62 a livello .05

2, 33 a livello 01

7. C'è una zona di rifiuto sulla coda destra della distribuzione o sulla coda sinistra della distribuzione.