Tecniche utilizzate nelle statistiche

In questo articolo parleremo di alcune tecniche di statistica. Alcune delle tecniche sono: 1. Le misure della tendenza centrale 2. Variabilità 3. Probabilità 4. Distribuzione della frequenza 5. Serie temporali.

Le misure della tendenza centrale:

medie:

Qualsiasi misura statistica che dia un'idea della posizione del punto attorno al quale si raggruppano altre osservazioni è chiamata misura della tendenza centrale. La misura più comunemente utilizzata è la media o la media aritmetica.

I guadagni giornalieri di due lavoratori per una settimana sono come sotto:

1 ° lavoratore Rs 70, 50, 100, 90, 50 Guadagno medio = Rs 76

Secondo lavoratore Rs 200, 250, 50, 300, 150 Guadagno medio = Rs 190

Quindi, dall'esempio sopra, possiamo concludere che in media il secondo lavoratore guadagna più del primo. Lo scopo di calcolare una media - come si può facilmente vedere - è sostituire la serie di osservazioni con un singolo valore, che è considerato il rappresentante di tutte le osservazioni. Dall'esempio sopra riportato, si può osservare che la media aritmetica è un valore vicino al centro e alcune delle osservazioni sono maggiori di quelle mentre alcune sono più piccole.

Quindi, si può dire che la media aritmetica delle osservazioni su una variabile è definita come la somma delle osservazioni divisa per il numero di osservazioni.

Per il primo lavoratore, la media aritmetica è stata calcolata come sotto:

(Rs 70 + 50 + 100 + 90 + 50) ÷ 5 = Rs 76

Media geometrica (GM) La media geometrica di un gruppo di osservazioni è definita come l'ennesima radice del prodotto di tutte le osservazioni. Supponiamo che le osservazioni siano x ₁, x ₂, x ₃, ..., x _n .

GM può essere calcolato come sotto:

Questo può essere calcolato con l'aiuto di una tabella di registro.

Modalità:

La modalità è definita come il valore delle variabili o delle osservazioni che si verificano più frequentemente. Ad esempio, se le osservazioni sono -2, 9, 6, 2, 8, 2, 2, 7, 2 e 3, allora la modalità è vista come 2, che si è verificata per il numero massimo di volte, cioè 5 volte.

Mediano:

La mediana è il valore della variabile al centro più, quando le osservazioni sono disposte in ordine ascendente o discendente. È ovvio che metà dei valori sarà inferiore alla media e metà dei valori sarà maggiore. Quindi, se le osservazioni sono 3, 9, 6, 4, 5, 7 e 10, quindi disponendo i valori in ordine ascendente 3, 4, 5, 6, 7, 9 e 10, il valore medio è visto come il 4a osservazione ed è uguale a 6.

Tuttavia, se il numero di osservazioni è pari, allora ci sono due valori medi e è consuetudine prendere la media aritmetica di questi due valori. Ad esempio, se l'osservazione 10 viene omessa dalle suddette variabili, ci sono due valori al centro 5 e 6 e il valore mediano è 5 + 6 ÷ 2 = 5.5.

Gli altri importanti strumenti statistici per misurare e analizzare i dati e l'elemento di variabilità in essi includono il calcolo di (i) Intervallo, (ii) Intervallo semi-interquartile, (iii) Deviazione assoluta media, (iv) Deviazione standard, (v ) Distribuzione di frequenza (sia simmetrica che asimmetrica).

La distribuzione simmetrica è caratterizzata dall'esistenza di una linea di simmetria che divide l'istogramma in due parti e una parte è l'immagine speculare dell'altro. Tuttavia, la maggior parte delle distribuzioni in commercio ed economia non sono di questo tipo. Le distribuzioni asimmetriche sono anche conosciute come distribuzioni distorte. L'asimmetria significa mancanza di simmetria e le distribuzioni distorte sono caratterizzate da una coda più lunga su un lato dell'istogramma.

Misurazione della variabilità:

Mezzi aritmetici e geometrici o mediani servono come base per confrontare due o più popolazioni o osservazioni. Ma anche le altre misure di variabilità o deviazione sono importanti per esprimere la misura in cui le osservazioni differiscono l'una dall'altra. In statistica, la dispersione è sinonimo di variabilità o deviazione.

Di seguito sono le importanti misure di variabilità:

Gamma:

La differenza tra i valori più grandi e più piccoli di un insieme di osservazioni è chiamata "intervallo".

Gamma Semi-Inter quartile :

La differenza tra il valore delle osservazioni nel 2 ° e 3 ° quartile è chiamato intervallo semi-interquartile. Questo rimuove l'influenza di valori molto bassi e molto alti delle osservazioni, che sono pochi in numero.

Deviazione assoluta media:

La deviazione assoluta media indica la variazione delle osservazioni dalla media aritmetica delle osservazioni.

Esempio: le osservazioni sono x ₁, x ₂ ... x _n e la media aritmetica è x.

La formula è:

e, quindi, la media è

Ma Σ (x ₁ - x̅) = 0, qualunque sia il valore di x ₁, x ₂, ... .x _n

Quindi, la formula Σ (x _i - x̅) non può essere usata come misura di variabilità. Questa difficoltà può essere evitata se i segni (+ o -) vengono ignorati. Questo è logico, poiché il segno di una particolare deviazione x _i - x̅ indica semplicemente se l'osservazione x _i, è a sinistra di x o alla sua destra e questo non ha rilevanza nel calcolo delle deviazioni, dal punto centrale (x), di qualsiasi osservazione.

Deviazione standard:

La deviazione delle osservazioni dalla loro media aritmetica (x̅) può essere positiva (+) o negativa (-). Nella statistica, i segni di deviazioni dalla media aritmetica indicano solo la direzione dell'osservazione dalla tendenza centrale (x̅) e quindi ignorati. I segni negativi (-) tra la deviazione dalla x possono anche essere evitati se invece di prendere i valori assoluti i quadrati delle deviazioni sono presi come sotto:

Poiché la misura della variabilità dovrebbe essere nella stessa unità delle osservazioni originali, la deviazione standard viene calcolata con la seguente formula:

Per una distribuzione di frequenza, con x ₁ x ₂, ..., x _n come i valori medi delle classi e f ₁ f ₂, ..., f _n come le frequenze, la deviazione standard (SD) viene calcolata dal seguente miglioramento del sopra la formula:

La deviazione standard è di gran lunga la misura di variabilità più utilizzata nelle statistiche. Ha molte proprietà che lo rendono la misura più preferita nei problemi statistici.

Esempio:

I livelli di QI di cinque studenti di Business Management sono i seguenti:

pertanto, la deviazione standard è: 13.22

13.22 è la deviazione standard espressa nelle stesse unità delle osservazioni stesse. Il valore 13.22 è un punto sulla stessa scala numerica.

La deviazione standard di cui sopra è stata elaborata dalle differenze di una popolazione di 5 studenti. Tuttavia, nella pratica, la deviazione standard spesso non può essere calcolata dalla popolazione, poiché la maggior parte delle volte la popolazione è così grande che di solito il campione viene preso allo scopo di calcolare la deviazione.

Per i dati di esempio, la variabilità è misurata dalla varianza campionaria e la deviazione standard viene calcolata utilizzando la seguente formula:

Si noti che, poiché i dati del campione sono stati utilizzati, 'n' indica la dimensione del campione al posto di 'N' che denota l'osservanza della popolazione.

Concetto di probabilità:

Spesso, nella nostra vita quotidiana, prevediamo certi eventi futuri con parole come - questo probabilmente accadrà ", " probabilità di questo è molto alto ", o" questo avverrà con ogni probabilità ", con una certa quantità di vaghezza in tale dichiarazioni. Queste affermazioni sono in gran parte soggettive e dipendono principalmente dal nostro potere di analizzare situazioni simili in passato. L'importanza della nozione di probabilità di un evento e alcuni mezzi per misurarla con strumenti statistici è immensa per le banche commerciali.

Mentre concede un prestito a un cliente, il banchiere vorrebbe conoscere la probabilità di inadempienza da parte del cliente stesso, che viene misurata sulla base dello studio della probabilità utilizzando i calcoli statistici. Sebbene sia abbastanza difficile definire la probabilità precisamente a livello elementare, si può fare uno sforzo per prevedere la stessa usando le tecniche dell'esperimento casuale e la definizione della frequenza.

Esperimento casuale: un esperimento in cui tutti i possibili risultati sono noti e che possono essere ripetuti in condizioni identiche, ma la previsione esatta del risultato è impossibile. Il prezzo di una merce in vari giorni può essere considerato come risultato di un esperimento casuale. I risultati saranno generalmente indicati con E ₁, E ₂, E ₃ ..., E _n e si presume che abbiano un numero finito.

Distribuzione di frequenza:

Se l'esito E _{1 si} verifica r volte quando l'esperimento casuale viene ripetuto n volte, allora la probabilità di E ₁ è definita dal rapporto 'r / n', poiché il numero di ripetizioni viene aumentato indefinitamente. Quindi, la probabilità è definita come un limite di frequenza relativa quando l'esperimento viene ripetuto un numero infinito di volte.

Serie temporali:

Una serie di osservazioni in diversi punti del tempo su una variabile, che dipende dal tempo, costituiscono una serie temporale. Quindi, tali serie di osservazioni danno i cambiamenti o le variazioni di una quantità in un periodo di tempo e sono spesso chiamate dati storici o cronologici. Per questo tipo di dati, una delle variabili è il tempo rappresentato da "t" e l'altro, che dipende dal tempo, è rappresentato da "Yt".

Ad esempio, la resa del raccolto in diverse stagioni, la produzione di acciaio in diversi mesi, l'esportazione trimestrale di tè, la vendita di gelati in diversi mesi dell'anno, ecc. Tutti gli esempi sopra riportati si riferiscono ad alcune attività economiche o commerciali e una serie di osservazioni su tali variabili sono solitamente chiamate dati di serie temporali economiche. Un altro esempio di dati di serie temporali sono le precipitazioni in pollici in vari giorni dell'anno.

Pertanto, è chiaro che qualsiasi variabile, che dipende dal tempo, forma i dati delle serie temporali. Le conclusioni importanti tratte dalle parti interessate come la comunità imprenditoriale, i banchieri, gli industriali, ecc. Delle serie temporali portano alla misurazione della tendenza dai dati, che influenzano in modo significativo le loro decisioni.