Il valore P, o probabilità calcolata, è la probabilità di trovare i risultati osservati, o più estremi, quando l’ipotesi nulla (H0) di una domanda di studio è vera – la definizione di “estremo” dipende da come viene testata l’ipotesi. P è anche descritto in termini di rifiuto di H0 quando è effettivamente vero, tuttavia, non è una probabilità diretta di questo stato.
L’ipotesi nulla è di solito un’ipotesi di “nessuna differenza”, ad esempio nessuna differenza tra la pressione sanguigna nel gruppo A e nel gruppo B., Definisci chiaramente un’ipotesi nulla per ogni domanda di studio prima dell’inizio dello studio.
L’unica situazione in cui dovresti usare un valore P unilaterale è quando un grande cambiamento in una direzione inaspettata non avrebbe assolutamente alcuna rilevanza per il tuo studio. Questa situazione è insolita; se hai qualche dubbio, usa un valore P a due lati.
Il termine livello di significatività (alfa) viene utilizzato per riferirsi a una probabilità pre-scelta e il termine “valore P” viene utilizzato per indicare una probabilità che si calcola dopo un determinato studio.,
L’ipotesi alternativa (H1) è l’opposto dell’ipotesi nulla; in termini di linguaggio semplice questa è di solito l’ipotesi che si prefigge di indagare. Ad esempio, la domanda è ” c’è una differenza significativa (non dovuta al caso) nella pressione sanguigna tra i gruppi A e B se diamo al gruppo A il farmaco di prova e al gruppo B una pillola di zucchero?”e l’ipotesi alternativa è” c’è una differenza nella pressione sanguigna tra i gruppi A e B se diamo al gruppo A il farmaco di prova e al gruppo B una pillola di zucchero”.,
Se il valore P è inferiore al livello di significatività scelto, si rifiuta l’ipotesi nulla, ovvero si accetta che il campione fornisca prove ragionevoli per supportare l’ipotesi alternativa. NON implica una differenza” significativa “o” importante”; è per te decidere quando considerare la rilevanza del mondo reale del tuo risultato.
La scelta del livello di significatività al quale si rifiuta H0 è arbitraria. Convenzionalmente sono stati utilizzati i livelli del 5% (meno di 1 su 20 possibilità di errore), dell ‘ 1% e dello 0,1% (P < 0,05, 0,01 e 0,001)., Questi numeri possono dare un falso senso di sicurezza.
Nel mondo ideale, saremmo in grado di definire un campione “perfettamente” casuale, il test più appropriato e una conclusione definitiva. Semplicemente non possiamo. Quello che possiamo fare è cercare di ottimizzare tutte le fasi della nostra ricerca per ridurre al minimo le fonti di incertezza. Quando si presentano i valori P alcuni gruppi trovano utile utilizzare il sistema di classificazione asterisco e citare il valore P:
P < 0.05 *
P < 0.01 **
P < 0.,001
La maggior parte degli autori si riferisce a statisticamente significativo come P< 0.05 e statisticamente altamente significativo come P< 0.001 (meno di una possibilità su mille di sbagliare).
Il sistema asterisco evita il termine lanoso “significativo”. Si noti, tuttavia, che a molti statistici non piace il sistema di classificazione asterisk quando viene utilizzato senza mostrare i valori P. Come regola generale, se puoi citare un valore P esatto, fallo., Potresti anche voler fare riferimento a un valore P esatto citato come asterisco nella narrativa del testo o nelle tabelle di contrasti altrove in un report.
A questo punto, una parola sull’errore. L’errore di tipo I è il falso rifiuto dell’ipotesi nulla e l’errore di tipo II è la falsa accettazione dell’ipotesi nulla. Come un aiuto memoir: pensare che la nostra società cinica rifiuta prima di accettare.
Il livello di significatività (alfa) è la probabilità di errore di tipo I. La potenza di un test è uno meno la probabilità di errore di tipo II (beta). La potenza dovrebbe essere massimizzata quando si selezionano metodi statistici., Se si desidera stimare le dimensioni del campione, è necessario comprendere tutti i termini menzionati qui.,
If you are interested in further details of probability and sampling theory at this point then please refer to one of the general texts listed in the reference section.,
È necessario comprendere gli intervalli di confidenza se si intende citare i valori P nei report e nei documenti. Gli arbitri statistici delle riviste scientifiche si aspettano che gli autori citino intervalli di confidenza con maggiore risalto rispetto ai valori P.
Note sull’errore di tipo I:
- è il rifiuto errato dell’ipotesi nulla
- la probabilità massima è impostata in anticipo poiché alpha
- non è influenzata dalla dimensione del campione in quanto è impostata in anticipo
- aumenta con il numero di test o punti finali (cioè fare 20 rifiuti di H0 e 1 è probabile che sia erroneamente significativo per alpha = 0.,05)