Test statistici di significatività in archeologia, inferenza statistica e archeologia, chi quadrato

Un importante contributo alla ricerca archeologica quantitativa è offerto dall'inferenza statistica, un procedimento attraverso il quale è possibile ricavare informazioni e caratteristiche di una popolazione attraverso l'osservazione di una parte di essa (il campione).

Nell'inferenza statistica c'è in un certo senso un rovesciamento del punto di vista rispetto al calcolo delle probabilità; in esso infatti, noto il processo di generazione dei dati sperimentali si è in grado di valutare la probabilità dei diversi possibili risultati di un esperimento. Nel campo dell'inferenza statistica, invece, il processo di generazione dei dati sperimentali non è conosciuto in modo completo e le tecniche di indagine mirano ad individuare le caratteristiche di tale processo sulla base dell'osservazione dei dati sperimentali da esso generati (1).

Ciò avviene tramite i "test di significatività" che consentono di stabilire la probabilità (definita anche livello di significatività) che il campione noto provenga da una popolazione con determinate caratteristiche oppure che due o più campioni provengano dalla stessa popolazione, permettendo inoltre di stabilire l'esistenza o meno di una connessione fra due variabili.

I test statistici di significatività assumono inizialmente la cosiddetta ipotesi zero (o ipotesi nulla, H₀). Quando si effettua il confronto fra due o più gruppi di dati, l'ipotesi zero prevede sempre che non esista alcuna differenza tra i gruppi riguardo al parametro considerato. In altre parole, secondo l'ipotesi zero i gruppi sono fra loro uguali e le eventuali differenze osservate vanno attribuite al caso. Ovviamente, l'ipotesi zero può essere accettata o respinta applicando il test di significatività, il cui risultato, in genere, va confrontato con un valore critico tabulato in apposite tabelle. Se il risultato del test di significatività supera un valore critico, allora la differenza fra i gruppi viene dichiarata statisticamente significativa e, quindi, l'ipotesi zero viene respinta. In caso contrario l'ipotesi zero viene accettata.

Formulazione dell'ipotesi H₀

Gli eventi osservati sono dovuti al caso. Non esiste alcuna correlazione tra loro

Verifica dell'ipotesi H₀

Si applica un test di significatività

Risultato positivo: si accetta l'ipotesi H₀

Tra gli eventi osservati non esiste una correlazione

Risultato negativo: si rifiuta l'ipotesi H₀

Tra gli eventi osservati esiste una correlazione

Come sempre avviene, i risultati di un test statistico non hanno un valore di assoluta e matematica certezza, ma soltanto di probabilità. Pertanto, la decisione di respingere l'ipotesi zero (presa sulla base del test statistico) è probabilmente giusta, ma potrebbe essere errata. La misura di questo rischio di cadere in errore si chiama "livello di significatività" del test.

Il livello di significatività di una prova può essere scelto a piacere dallo sperimentatore. Tuttavia si sceglie di solito un livello di probabilità di 0,05 (5%) o di 0,01 (1%). Questa probabilità (il "valore P") rappresenta una stima quantitativa della probabilità che le differenze osservate siano dovute al caso. Dal momento che il valore P è una probabilità esso può assumere solo valori compresi fra 0 e 1. Un valore P che si avvicina a 0 testimonia una bassa probabilità che la differenza osservata sia dovuta al caso.

Processo logico di inferenza statistica

Dopo aver effettuato un esperimento su un campione di tombe si avanza l'ipotesi che:

le fibule "tipo 1" e "tipo 2" sono rispettivamente predominanti nel "tipo A" e "tipo B" di tombe della "necropoli X"

Si avanzano tre possibili ipotesi per giustificare la diversità osservata

ipotesi 1: il confronto è viziato da un errore dello sperimentatore

ipotesi 2: il confronto è viziato dal fattore caso

ipotesi 3: l'affermazione è corretta

L'ipotesi 1, se verificata, è frutto di un errore dello sperimentatore che ha selezionato un campione non rappresentativo della popolazione oggetto dello studio (un campione non rappresentativo si dice distorto o affetto da "bias").

L'ipotesi 2 può essere esclusa con l'applicazione di un test di significatività

Solo dopo aver escluso le ipotesi 1 e 2 si può ritenere probabilmente giusto che:

le fibule "tipo 1" e "tipo 2" sono rispettivamente predominanti nel "tipo A" e "tipo B" di tombe della "necropoli X"

Il livello di significatività del 5% viene adottato molto frequentemente in quanto si ritiene che il rapporto 1/20 (cioè 0,05) sia sufficientemente piccolo da poter concludere che sia piuttosto improbabile che la differenza osservata sia dovuta al semplice caso. In effetti, la differenza potrebbe essere dovuta al caso, e lo sarà 1 volta su 20. Tuttavia, questo evento è improbabile. Ovviamente se si vuole escludere con maggiore probabilità l'effetto del caso si adotterà un livello di significatività inferiore, ad esempio dell'1% (2).

Per calcolare il valore P esistono diversi test di significatività (3); il più noto è il test del chi quadrato (χ²), un test non parametrico che può essere applicato a variabili di tipo nominale. Con questo test è possibile misurare le divergenze riscontrate fra le frequenze osservate (cioè il numero delle attestazioni rilevate nel caso delle due variabili analizzate) e quelle attese (cioè, la distribuzione aspettata nel caso in cui esista una indipendenza statistica tra i due medesimi attributi).

χ² =	(numero osservato – numero atteso)² ^{___________________________________________} numero atteso

Quindi, i valori osservati nella realtà vengono confrontati con quelli che ci si potrebbe attendere se la loro distribuzione fosse del tutto casuale. Prima di rilevare il valore di χ²è importante fissare due criteri: il numero di "gradi di libertà (che variano a seconda del numero di righe e di colonne che costituiscono la tabella di contingenza, cioè a seconda del numero di modalità che caratterizza ciascuna delle due variabili prese in esame) (4), e il valore massimo per il quale, in corrispondenza di una certa probabilità e dei gradi di libertà del sistema in studio, si accetta l'ipotesi H₀. Se questo valore è superato, allora si rifiuta H₀.

Questi test «forniscono informazioni sulla casualità del fenomeno analizzato, ma non possono misurare la forza dell'anomalia rilevata. A questo scopo vengono impiegate misure derivate dal χ² e da altri valori, fra cui il φ², il V²di Cramer e il Q² di Yule. Queste in genere variano fra 1 (che indica un'associazione positiva perfetta) e -1 (associazione negativa perfetta) passando per 0 (nessuna associazione). In questo modo è possibile stabilire l'esistenza di una covarianza positiva o negativa fra la variabile indipendente e quella dipendente» (5).

(1) Esempio: «Data un'urna con composizione nota: 6 palline bianche, 4 palline rosse; utilizzando le regole del calcolo delle probabilità possiamo dedurre che se estraiamo una pallina a caso dall'urna, la probabilità che essa sia rossa è 0,4. Si ha invece un problema di inferenza statistica se abbiamo un urna di cui non conosciamo la composizione, estraiamo n palline e ne osserviamo il colore e, a partire da questo, vogliamo dedurre la composizione dell'urna», voce "Inferenza statistica", Wikipedia

(2) Quindi, se l'ipotesi zero viene respinta al livello di significatività 5%, allora abbiamo il 5% di probabilità di respingere un'ipotesi zero che, in effetti, era vera. Se l'ipotesi zero viene respinta al livello di significatività 1%, allora abbiamo l'1% di probabilità di respingere un'ipotesi zero che, in effetti, era vera. Più in generale, se l'ipotesi zero viene respinta al livello di significatività n%, allora abbiamo n% di probabilità di respingere un'ipotesi zero che, in effetti, era vera.

E' inoltre opportuno sottolineare un concetto molto importante, "statisticamente significativo" non vuol dire importante, o di grande interesse, o rilevante. "Statisticamente significativo" significa semplicemente che ciò che è stato osservato è difficilmente dovuto al caso.

(3) Fra essi si ricordano «quello di Kolmogorov-Smirnov che si basa sulla differenza massima rilevata in due distribuzioni cumulative e quello di Spearman, basato sulla correlazione fra i ranghi ottenuti ordinando gli stessi individui secondo due variabili diverse», N. Terrenato, Quantitativa, archeologia, in R. Francovich - D. Manacorda (a cura di), Dizionario di archeologia, Laterza, Bari 2000, p. 238

(4) In una tabella formata da r righe e c colonne è dato da: (r-1) x (c-1). Un esempio di applicazione del metodo del chi-quadrato è stato ricordato in un articolo precedente

(5) N. Terrenato, Quantitativa, archeologia, in R. Francovich - D. Manacorda (a cura di), Dizionario di archeologia, Laterza, Bari 2000, p. 239

(6) Risorsa WEB di riferimento: E. Bottarelli, Prove di significatività

per approfondire...

· Aldenderfer M.S. (a cura di), Quantitative Research in Archaeology, Newbury Park 1991

· Shennan S., Quantifying Archaeology, Edinburgh 1988

risorse web:

Campionamento

· R. Ricci, Appunti di Probabilità e Statistica, pp. 57-63

Test di ipotesi - Test di χ² - Coefficienti di associazione

· R. Ricci, Appunti di Probabilità e Statistica, pp. 65-72

· L. Soliani, Manuale di statistica per la ricerca e la professione

· C. Monti, Chi-quadrato e altri indici di dipendenza

· Dipartimento di Statistica "G. Parenti", Laboratorio virtuale di probabilità e statistica


Sommario	Analisi spaziale