Un
importante contributo alla ricerca archeologica quantitativa è
offerto dall'inferenza statistica, un procedimento attraverso il
quale è possibile ricavare informazioni e caratteristiche di una
popolazione attraverso l'osservazione di una parte di essa (il
campione).
Nell'inferenza
statistica c'è in un certo senso un rovesciamento del punto di
vista rispetto al calcolo delle probabilità; in esso infatti,
noto il processo di generazione dei dati sperimentali si è in
grado di valutare la probabilità dei diversi possibili risultati
di un esperimento. Nel campo dell'inferenza statistica, invece, il
processo di generazione dei dati sperimentali non è conosciuto in
modo completo e le tecniche di indagine mirano ad individuare le
caratteristiche di tale processo sulla base dell'osservazione dei
dati sperimentali da esso generati (1).
Ciò
avviene tramite i "test di significatività" che
consentono di stabilire la probabilità (definita anche livello di
significatività) che il campione noto provenga da una popolazione
con determinate caratteristiche oppure che due o più campioni
provengano dalla stessa popolazione, permettendo inoltre di
stabilire l'esistenza o meno di una connessione fra due variabili.
I test statistici di significatività assumono inizialmente la cosiddetta ipotesi zero (o ipotesi nulla,
H0). Quando si effettua il confronto fra due o più gruppi di dati, l'ipotesi zero prevede sempre che non esista alcuna differenza tra i gruppi riguardo al parametro considerato. In altre parole, secondo l'ipotesi zero i gruppi sono fra loro uguali e le eventuali differenze osservate vanno attribuite al caso. Ovviamente, l'ipotesi zero può essere accettata o respinta applicando
il test di significatività, il cui risultato, in genere, va confrontato con un valore critico tabulato in apposite tabelle. Se il risultato del test di significatività supera
un valore critico, allora la differenza fra i gruppi viene dichiarata statisticamente significativa e, quindi, l'ipotesi zero viene respinta. In caso contrario l'ipotesi zero viene accettata.
Formulazione
dell'ipotesi H0
Gli eventi
osservati sono dovuti al caso. Non esiste alcuna
correlazione tra loro |
Verifica
dell'ipotesi H0
Si applica
un test di significatività |
Risultato
positivo: si accetta l'ipotesi H0
Tra gli eventi
osservati non esiste una correlazione |
|
Risultato
negativo: si rifiuta l'ipotesi H0
Tra gli eventi
osservati esiste una correlazione |
|
Come sempre avviene, i risultati di un test statistico non hanno un valore di assoluta e matematica certezza, ma soltanto di probabilità. Pertanto,
la decisione di respingere l'ipotesi zero (presa sulla base del test statistico) è
probabilmente giusta, ma potrebbe essere errata. La misura di questo rischio di cadere in errore si chiama
"livello di significatività" del test.
Il livello di significatività di una prova può essere scelto a piacere dallo sperimentatore.
Tuttavia si sceglie di solito un livello di probabilità di 0,05 (5%) o di
0,01 (1%). Questa probabilità
(il "valore P") rappresenta una stima quantitativa della probabilità che le differenze osservate siano dovute al caso.
Dal momento che il valore P è una probabilità esso può assumere solo valori compresi fra 0 e 1. Un valore
P che si avvicina a 0 testimonia una bassa probabilità che la differenza osservata
sia dovuta al caso.
Processo
logico di inferenza statistica
Dopo
aver effettuato un esperimento su un campione di tombe si
avanza l'ipotesi che:
le
fibule "tipo 1" e "tipo 2" sono
rispettivamente predominanti nel "tipo A" e
"tipo B" di tombe della "necropoli X" |
Si
avanzano tre possibili ipotesi per giustificare la
diversità osservata
ipotesi
1: il confronto è viziato da un errore dello
sperimentatore
ipotesi
2: il confronto è viziato dal fattore caso
ipotesi
3: l'affermazione è corretta
|
L'ipotesi
1,
se verificata, è frutto di un errore dello sperimentatore
che ha selezionato un campione non rappresentativo
della popolazione oggetto dello studio (un campione non
rappresentativo si dice distorto o affetto da "bias").
L'ipotesi
2 può essere esclusa con l'applicazione di un test di
significatività |
Solo
dopo aver escluso le ipotesi 1 e 2 si può ritenere probabilmente
giusto che:
le
fibule "tipo 1" e "tipo 2" sono
rispettivamente predominanti nel "tipo A" e
"tipo B" di tombe della "necropoli X" |
Il
livello di significatività del 5% viene adottato molto frequentemente
in quanto si ritiene che il rapporto 1/20 (cioè 0,05) sia sufficientemente
piccolo da poter concludere che sia piuttosto
improbabile che la differenza osservata sia dovuta al semplice caso.
In effetti, la differenza potrebbe essere dovuta al caso, e lo
sarà 1 volta su 20. Tuttavia, questo evento è improbabile.
Ovviamente se si vuole escludere con maggiore probabilità l'effetto del
caso si adotterà un livello di significatività inferiore, ad esempio
dell'1% (2).
Per
calcolare il valore P esistono diversi test di significatività
(3); il più noto è il test del chi quadrato (χ2),
un test non parametrico che può essere applicato a variabili di tipo
nominale. Con questo test è possibile misurare le divergenze
riscontrate fra le frequenze osservate (cioè il numero delle
attestazioni rilevate nel caso delle due variabili analizzate) e quelle
attese (cioè, la distribuzione aspettata nel caso in cui esista una
indipendenza statistica tra i due medesimi attributi).
χ2 = |
(numero osservato – numero atteso)2
___________________________________________
numero atteso |
Quindi,
i valori osservati nella
realtà vengono confrontati con quelli che ci si potrebbe attendere se la loro distribuzione fosse del tutto casuale.
Prima di rilevare il valore di χ2 è
importante fissare due criteri: il numero di "gradi di libertà
(che variano a seconda del numero di righe e di colonne che
costituiscono la tabella di contingenza, cioè a seconda del numero di
modalità che caratterizza ciascuna delle due variabili prese in esame)
(4), e il valore massimo per il quale, in corrispondenza di una certa probabilità
e dei gradi di libertà del sistema in studio, si accetta l'ipotesi
H0.
Se questo valore è superato, allora si rifiuta
H0.
Questi
test «forniscono informazioni sulla casualità del fenomeno analizzato, ma
non possono misurare la forza dell'anomalia rilevata. A questo scopo vengono impiegate
misure derivate dal χ2
e da altri valori, fra cui il φ2, il V2 di Cramer e il Q2 di Yule. Queste in
genere variano fra 1 (che indica un'associazione positiva perfetta) e -1 (associazione
negativa perfetta) passando per 0 (nessuna associazione). In questo modo è possibile stabilire
l'esistenza di una covarianza positiva o negativa fra la variabile indipendente e quella
dipendente» (5).
(1)
Esempio: «Data
un'urna con composizione nota: 6 palline bianche, 4 palline rosse;
utilizzando le regole del calcolo delle probabilità possiamo dedurre
che se estraiamo una pallina a caso dall'urna, la probabilità che essa
sia rossa è 0,4. Si ha invece un problema di inferenza statistica se
abbiamo un urna di cui non conosciamo la composizione, estraiamo n
palline e ne osserviamo il colore e, a partire da questo, vogliamo
dedurre la composizione dell'urna», voce "Inferenza
statistica", Wikipedia
(2)
Quindi,
se
l'ipotesi zero viene respinta al livello di significatività 5%, allora
abbiamo il 5% di probabilità di respingere un'ipotesi zero che, in
effetti, era vera. Se
l'ipotesi zero viene respinta al livello di significatività 1%, allora
abbiamo l'1% di probabilità di respingere un'ipotesi zero che, in
effetti, era vera. Più in
generale,
se
l'ipotesi zero viene respinta al livello di significatività n%,
allora abbiamo n% di probabilità di respingere un'ipotesi zero
che, in effetti, era vera.
E'
inoltre opportuno sottolineare un concetto molto importante, "statisticamente
significativo" non vuol dire importante, o di grande interesse, o
rilevante. "Statisticamente significativo" significa
semplicemente che ciò che è stato osservato è difficilmente dovuto al
caso.
(3)
Fra essi si ricordano «quello di Kolmogorov-Smirnov che si basa sulla differenza massima rilevata in due distribuzioni
cumulative e quello di
Spearman, basato sulla correlazione fra i ranghi ottenuti ordinando gli stessi individui
secondo due variabili diverse»,
N. Terrenato, Quantitativa,
archeologia, in R.
Francovich - D. Manacorda (a cura di), Dizionario di archeologia,
Laterza, Bari 2000, p. 238
(4)
In una tabella formata da r righe e c colonne è dato da:
(r-1) x (c-1). Un esempio di applicazione del metodo del
chi-quadrato è stato ricordato in un articolo
precedente
(5)
N. Terrenato, Quantitativa,
archeologia, in R.
Francovich - D. Manacorda (a cura di), Dizionario di archeologia,
Laterza, Bari 2000, p. 239
(6)
Risorsa
WEB di riferimento: E.
Bottarelli, Prove
di significatività
per
approfondire...
·
Aldenderfer
M.S. (a cura di), Quantitative Research in Archaeology, Newbury Park
1991
·
Shennan
S., Quantifying Archaeology, Edinburgh 1988
risorse
web:
Campionamento
·
R.
Ricci, Appunti
di Probabilità e Statistica, pp. 57-63
Test di ipotesi - Test di χ2 - Coefficienti
di associazione
·
R.
Ricci, Appunti
di Probabilità e Statistica, pp. 65-72
·
L.
Soliani, Manuale
di statistica per la ricerca e la professione
·
C.
Monti, Chi-quadrato
e altri indici di dipendenza
·
Dipartimento di
Statistica "G. Parenti", Laboratorio
virtuale di probabilità e statistica
|
|

|

|
Sommario
|
Analisi
spaziale |
|