Statistica matematica

Da Wikiversità, l'apprendimento libero.
lezione
lezione
Statistica matematica
Tipo di risorsa Tipo: lezione
Materia di appartenenza Materia: Statistica

Con la statistica matematica studieremo qual è il comportamento teorico della popolazione studiata. Ci occuperemo perciò di probabilità teorica, studiata a priori partendo da delle ipotesi e dei processi definiti senza utilizzare dei campioni reali e senza utilizzare dati provenienti da esperimenti o prove.

Introduzione alla probabilità[modifica]

La probabilità è un valore che, riferito ad una ben precisa categoria di eventi, rappresenta quanti eventi di un certo tipo si verificano rispetto al totale degli eventi possibili.

La definizione classica di probabilità di un evento è il rapporto tra il numero dei casi favorevoli all'evento e il numero dei casi possibili, purché questi ultimi siano tutti equiprobabili. Questa definizione è spesso attribuita a Pierre Simon Laplace.

La probabilità varia sempre e comunque tra 0 ed 1, in quanto un evento con probabilità negativa non avrebbe senso logico (sarebbe un evento più che impossibile?!), come nemmeno un evento con probabilità maggiore di 1 (sarebbe un evento più che certo?!). Difatti un evento con probabilità zero è detto evento impossibile, mentre quando un evento ha probabilità 1 è detto evento certo.

Esempio del dado a sei facce[modifica]

Probabilità del lancio di un dado a sei facce

Lanciando un classico dado a sei facce, che idealizziamo come un cubo esattamente bilanciato e non truccato in nessun modo, la probabilità di uscita di ognuno dei numeri da uno a sei, delle sei facce, è sempre di 1/6.

La probabilità che si verifichi un certo evento A su un numero di n eventi totali si indica come:

che, per esempio, nel caso dell'uscita del valore 4 nel lancio del dado a sei facce vale:
o, per fare un altro esempio, nel caso dell'uscita di un numero pari nel lancio di un dado a sei facce vale:
perché i numeri pari possibili sono 3 (2,4,6) sempre su un totale di 6 possibili esiti.

Spazio di probabilità[modifica]

Lo spazio delle probabilità è l'insieme di tutti i possibili eventi.

Esempio dello spazio di probabilità del lancio di una o più monete[modifica]

Lo spazio di probabilità del lancio di una moneta è costituito da due eventi, Testa e Croce.Possiamo scrivere {T, C}

Lo spazio di probabilità del lancio di due monete insieme è costituito da quattro eventi.Possiamo scrivere {TT, CC, TC, CT}

Lo spazio di probabilità del lancio di tre monete insieme è costituito da otto eventi, Testa e Croce. Possiamo scrivere {TTT, CTT, CCT, TCC, TTC, CTC, TCT, CCC}

Eventi indipendenti e dipendenti[modifica]

Diversi eventi si dicono indipendenti quando il verificarsi o meno di un evento non influisce sul verificarsi degli altri. Quando diversi eventi invece dipendono l'uno dall'altro allora si parla di probabilità condizionata

Se due eventi p (A) e p (B) sono indipendenti, la probabilità che si verifichino entrambi è:

Se due eventi sono invece dipendenti, il verificarsi dell'uno influisce sul verificarsi dell'altro e la probabilità che si verifichino entrambi vale:

Variabili aleatorie[modifica]

Una variabile aleatoria (o variabile casuale, stocastica, random. Spesso indicata con lettera maiuscola: X, Y etc.) è una variabile che può assumere valori diversi in dipendenza da qualche fenomeno casuale - è una legge che informa sui risultati di un esperimento prima che l'esperimento sia realizzato. Ad esempio, il risultato del lancio di un dado a sei facce può essere matematicamente modellato come una variabile casuale che può assumere uno dei sei possibili valori 1, 2, 3, 4, 5, 6.

Variabili discrete e continue[modifica]

Lo studio della probabilità tiene conto di due tipi fondamentali di variabili, le variabili discrete e le variabili continue, e in funzione di questa distinzione formalizza il calcolo probabilistico in modo lievemente diverso.

Sono variabili discrete tutte quelle che rappresentano eventi che hanno un numero di esiti possibili necessariamente intero, ovvero che possono essere elencati tramite i numeri naturali (ovvero sono numerabili): ). L'insieme degli eventi possibili è dunque un insieme discreto S numerabile con dei numeri naturali: .

Esempi di variabili discrete sono l'esito dei lanci di un dado, il numero di passeggeri di un treno, i possibili colori di un set di sedie etc. Sono tutti elementi non frazionabili e che non prevedono valori intermedi tra due diversi esiti (un treno non può trasportare 210 passeggeri e mezzo!).

Sono invece variabili continue tutte le variabili che rappresentano un insieme continuo di valori, appartenenti ad un insieme .

Esempi di variabili continue sono l'altezza di una popolazione umana, la distanza temporale tra due avvenimenti casuali, l'umidità relativa in una stanza, la temperatura di un motore etc. Sono tutti elementi frazionabili all'infinito e che prevedono infinite sfumature di valore tra diversi eventi.

Definizioni di concetti ed elementi di base[modifica]

Funzione e densità di probabilità[modifica]

Come anticipato, distinguiamo tra variabili discrete e continue.

Funzione di probabilità discreta

La funzione di probabilità discreta (o distribuzione discreta di probabilità, distribuzione di frequenza, o funzione di massa di probabilità, o ancora densità discreta) è la funzione matematica che rappresenta come sono distribuite le probabilità sugli esiti possibili. Visto che stiamo parlando di variabili discrete (quindi con eventi numerabili), è facile intuire che la funzione sarà una funzione a punti, che associa ad ogni esito la propria frequenza relativa (rapporto tra numero di eventi positivi e numero di eventi totali).

Ad esempio (in figura):

Ogni funzione discreta di probabilità è caratterizzata da valori di probabilità appartenenti all'intervallo [0,1] e da una sommatoria di tutte le probabilità discrete degli N possibili esiti uguale a 1:

Distribuzione continua uniforme: uno dei più semplici tipi di distribuzione, caratterizzata da probabilità costante in ogni punto dell'intervallo [a, b]

La densità di probabilità continua (o distribuzione continua di probabilità ) è, similmente alla densità discreta, la funzione matematica che descrive come sono distribuite le probabilità su tutto l'intervallo continuo (che rappresenta lo spazio di tutti gli esiti possibili).

Per esempio la distribuzione continua uniforme è così definita:

Come per le funzioni di probabilità discreta, anche le densità continue devono avere valori compresi nell'intervallo [0,1] e, analogamente a quanto è necessario per le funzioni discrete, è necessario che l'integrale su tutta la retta reale valga 1:

Funzione di ripartizione[modifica]

Funzione di densità normale f (x): l'area sottesa alla curva fino al valore x rappresenta la funzione di ripartizione F (x), in quanto è proprio l'integrale della funzione da infinito negativo a x
Curva della funzione di ripartizione F (x) della funzione di densità normale. Si notino i valori 0 a infinito negativo e 1 a infinito positivo

La funzione di ripartizione (o funzione di distribuzione cumulativa), è una funzione di variabile reale che racchiude le informazioni su un fenomeno riguardanti la sua presenza o la sua distribuzione prima o dopo un certo punto.

Una funzione F è una valida funzione di ripartizione se:

  • è non decrescente (ovvero monotona crescente o costante)
  • è continua a destra:
  • ha valori sempre compresi tra zero e uno, inclusi:
  • vale zero per x che tende ad infinito negativo e uno per x che tende ad infinito positivo:

Una funzione di ripartizione individua univocamente una intera distribuzione di probabilità ben definita.

Altri progetti[modifica]