L'utilizzo dei metodi matematico-statistici presuppone un processo di "quantizzazione" dei dati a disposizione; ciò permette sia di presentare le informazioni in forma chiara e in uno spazio di dimensioni ridotte, sia di intervenire su di esse mediante procedimenti di tipo matematico e statistico. E' quindi molto importante, già in fase iniziale, definire sia gli scopi della ricerca che si vuole intraprendere e sia le tecniche da impiegare per la sua realizzazione (1). 

Per effettuare la quantizzazione, i dati a disposizione vengono solitamente inseriti all'interno di una matrice, in cui le righe rappresentano le unità di rilevazione, mentre le colonne gli attributi. 

Le unità di rilevazione sono i singoli "casi", o "individui", presi a oggetto dell'analisi e che debbono essere omogenei per uno o più aspetti. Nel loro complesso essi costituiscono il "collettivo statistico" (2). 

Gli "attributi", che indicano i singoli aspetti delle unità statistiche prese in considerazione, possono essere di due tipi: attributi metrici (misurabili quantitativamente; come ad esempio la lunghezza, l'altezza, il peso, il volume) e attributi nominali (caratteri qualitativi non misurabili; come ad esempio il tipo di decorazione presente su un oggetto o lo stato di conservazione). 

Gli attributi nominali, non potendo essere misurati, devono essere codificati per mezzo di un processo che trasformi il carattere qualitativo in una variabile; di solito, il tipo di codifica è basato sulla presenza o assenza del carattere stesso (ad esempio, la variabile decorazione può assumere il valore di 0 o 1, indicanti rispettivamente l'assenza o la presenza del motivo decorativo). Le variabili possono essere classificate in: variabili nominali (i cui valori non hanno nessun tipo di ordine e relazione), variabili ordinali, (i cui valori formano una sequenza ma non hanno una distanza tra essi misurabile), variabili di intervalli (i cui valori formano una sequenza con una distanza fissa misurabile), variabili di rapporto (i cui valori presentano una distanza fissa da un punto assegnato).

Il primo livello di analisi statistiche dei dati consiste nell'utilizzo degli attributi metrici e nominali come base per la determinazione di uno o più tipi (3) all'interno di un collettivo statistico.

Attraverso le analisi delle frequenze si evidenzia quante volte un determinato fenomeno, o un suo aspetto, si manifesta nel collettivo statistico rilevato. «La "frequenza assoluta" indica il numero complessivo dei casi in cui una determinata variabile o una sua modalità si presentano nella totalità delle unità di rilevazione; la "frequenza relativa", espressa in percentuali, è data dal rapporto tra la frequenza assoluta e il numero complessivo dei casi presi in esame» (4).

Per analizzare la distribuzione delle frequenze si utilizzano differenti metodi grafici, i quali permettono quindi di rappresentare graficamente le informazioni quantizzate relative ad un carattere.

I "diagrammi a blocchi" vengono spesso utilizzati in ambito pre-protostorico al fine di ottenere una mappa di distribuzione in cui sia riportata la percentuale relativa a diversi tipi di manufatti. Nei "poligoni di frequenza" al posto dei blocchi viene riportata solo la linea che unisce i punti medi di ogni parte superiore di un rettangolo mentre i "diagrammi cumulativi" sono costruiti aggiungendo alla percentuale di ogni tipo quella del tipo successivo, in modo tale che l'ultimo termine della colonna dei valori accumulati sia necessariamente uguale al totale generale (5). Questi due ultimi tipi di grafici sono utili quando si vuole confrontare, all'interno di un singolo diagramma, situazioni riscontrate in contesti diversi.

 

diagramma a blocchi - poligoni di frequenza - diagramma cumulativo

 

«Qualora l'analisi sia tesa verso l'esame di una variabile "continua", cioè di un carattere quantitativo che può assumere come modalità tutti i valori dell'intervallo dei numeri reali positivi (ad esempio la lunghezza o la larghezza di un oggetto), la sua distribuzione delle frequenze all'interno di una serie di materiali presi in esame può essere rappresentata graficamente per mezzo di un istogramma. Si tratta di un diagramma cartesiano su cui sono tracciati più rettangoli adiacenti, la cui area indica la frequenza con cui le osservazioni rilevate rientrano all'interno di un prestabilito intervallo. A differenza, quindi, di quanto notato per i diagrammi a blocchi, in cui solo l'altezza dei blocchi è proporzionale alle frequenze relative alle unità prese in esame, negli istogrammi tutta la superficie rettangolare è proporzionale alla quantità di osservazioni rilevate. Fino ad oggi la maggior parte delle esperienze di utilizzazione degli istogrammi in ambito archeologico si è indirizzata soprattutto verso lo studio di strumenti paleolitici, al fine di verificare, sulla base della distribuzione dei valori relativi alle variabili continue prese in esame, l'esistenza o meno di intenzionalità da parte dell'artefice nel conferire determinate dimensioni agli oggetti stessi. Si sono così potute effettuare, ad esempio, attraverso l'utilizzazione degli istogrammi e delle connesse statistiche elementari in una variabile, interessanti considerazioni sulla produzione di strumenti litici laminari di alcuni tagli del giacimento Epigravettiano di Taurisano (Lecce), relativi quindi ad un periodo del Paleolitico Superiore recente, che risale a circa 15.500 anni fa (6). 

Al fine, infatti, di analizzare la distribuzione delle frequenze relative alla larghezza delle lame prese in esame, sono stati ricavati due istogrammi, il primo con un "passo", cioè un intervallo, di 1 mm e il secondo con un passo di 2 mm. L'analisi di tali grafici, e in particolare del primo (vedi a lato), che mostra una distribuzione "unimodale", cioè con un unico "picco" di frequenza massima che oscilla intorno ai 7 mm, ha permesso di concludere che nei tagli presi in esame si verifica l'esistenza esclusiva di lamelle, cioè di strumenti laminari di piccole dimensioni. Se si fosse verificata, infatti, la produzione intenzionale anche di lame, l'istogramma avrebbe dovuto mostrare due picchi ben separati fra loro, l'uno intorno ai valori suddetti e l'altro, invece, in corrispondenza di un valore maggiore, ad esempio intorno ai 2,5 cm di larghezza» (7).

 

 

Per evidenziare le caratteristiche della distribuzione di una variabile si possono individuare dei valori di indice che ne sintetizzino l'andamento, tali valori sono definiti medie. La scelta di un tipo di media rispetto ad un altro dipende sia dalla proprietà che la caratterizza e sia dalla natura della variabile stessa. Se essa è di tipo quantitativo si utilizzano medie analitiche, mentre se è di tipo qualitativo si utilizzano le medie di posizione. 

La media più frequentemente utilizzata nel caso di una variabile quantitativa è quella "aritmetica" che è uguale alla somma dei valori diviso per il loro numero. La "mediana", cioè il valore centrale di un insieme di valori ordinati, può essere calcolata anche su variabili qualitative. La "moda", che indica la modalità più frequente nel collettivo osservato, può essere calcolata per qualsiasi tipo di variabile.

Lo "scatter diagram" o nuvola di punti permette di verificare l'esistenza o meno di una correlazione statisticamente significativa tra due attributi metrici, quali ad esempio la lunghezza e la larghezza. Anche questo diagramma si avvale del sistema cartesiano; ma a differenza degli istogrammi, nello scatter diagram sia sull'asse delle ascisse sia su quello delle ordinate sono rispettivamente rappresentati i valori relativi ad una variabile continua. «Le osservazioni fatte su una serie di oggetti producono sul piano cartesiano un insieme di punti, ognuno dei quali corrisponde ad una unità di rilevazione. L'interpretazione di queste nuvole di punti può tendere verso due diversi tipi di informazioni: in primo luogo la distribuzione dei punti sul diagramma evidenzia le relazioni esistenti tra le diverse unità di osservazione (A). In secondo luogo, l'intero campione di punti permette di stabilire le relazioni esistenti tra i due attributi (B, C).   

 

A - Presenza di due gruppi distinti di unità di rilevazione

B - Presenza di un solo gruppo e stretta correlazione fra le due variabili

C - Presenza di un solo gruppo e assenza di correlazione fra le due variabili

 

Un chiaro e utile esempio di questo tipo di procedimento, anch'esso generalmente applicato a problematiche connesse con l'archeologia preistorica, è offerto dallo studio effettuato da F. Bordes (8) su un complesso di materiali litici, provenienti dal giacimento di Corbiac in Dordogna e relativi al Paleolitico Superiore. Tramite l'esame dello scatter diagram si è potuta evidenziare una netta differenziazione tra i due diversi tipi confluiti in questa classe di materiali: le gravettes (punti) e le microgravettes (triangoli). 

 

 

La distribuzione generale delle unità di rilevazione, inoltre, mostra che esse risultano nel complesso allineate lungo una retta, la quale prende inizio presso l'origine dei due assi cartesiani e si dirige verso l'angolo superiore destro del grafico. Sotto il profilo matematico, tale retta può essere calcolata mediante il metodo dei minimi quadrati e prende il nome di "retta di regressione". La distribuzione così evidenziata indica con chiarezza che i due attributi presi in esame sono tra loro correlati; è possibile, quindi, concludere che laddove aumenta la larghezza di uno degli strumenti litici analizzati, ne aumenta in proporzione anche la lunghezza» (9).

 

Tabelle di contingenza

In campo archeologico un certo fenomeno viene descritto non solo attraverso informazioni di tipo quantitativo ma anche, e spesso, tramite attributi nominali (ad esempio, il tipo di decorazione presente su un oggetto) (10). Per evidenziare l'esistenza di una correlazione tra due variabili nominali, codificate precedentemente in base alla loro presenza o assenza (rispettivamente 1 e 0), viene solitamente utilizzato il metodo delle tabelle di contingenza, o crosstabulations (11). 

La forma delle tabelle, all'interno delle quali viene indicata la distribuzione delle frequenze relative ai dati da analizzare, varia in rapporto al numero di modalità assunte da ciascuno dei due caratteri presi in esame. Per verificare l'esistenza di una sistematica associazione fra due variabili vengono poi utilizzati i test di significatività statistica, come ad esempio il metodo del "chi quadrato" (χ2).

Per meglio chiarire il metodo si può prendere in considerazione un esempio tratto da una ricerca effettuata sugli specchi etruschi da P. Moscati (12). «Tra gli scopi della ricerca vi era anche quello di verificare se tra i diversi attributi qualitativi, scelti al fine di descrivere questa classe di materiali, esistesse o meno un'associazione statistica, tale da dimostrare l'intenzionalità e non la casualità di determinate scelte da parte dell'artefice. L'esame, ad esempio, delle relazioni esistenti tra i diversi personaggi raffigurati sul rovescio del disco di ciascun specchio, ha offerto alcuni dati interessanti; si può citare a tale proposito la tabella di contingenza in cui sono incrociati i valori relativi alle 2 variabili indicanti rispettivamente la dea Turan [Aphrodite, Venere = TPERS16) e Elina (Elena = TPERS25), codificate in base alla loro presenza (codice 1) o assenza (codice 0).

 

La tabella ottenuta tramite il calcolatore è del tipo 2x2, con 1 grado di libertà ( = numero delle righe -1 x numero delle colonne -1). La distribuzione delle frequenze relative all'attestazione delle due figure mostra che Elina, la quale compare complessivamente su 50 specchi, è attestata in 22 casi (44%) insieme alla dea Turan. Tali valori risultano notevolmente maggiori rispetto a quelli attesi sotto l'ipotesi nulla, e ciò permette di evidenziare, tramite l'esame dei valori relativi al χ2, la significativa associazione tra le due figure» (13).

 


(1) P. Moscati, Archeologia e Calcolatori, Giunti Barbera, Firenze 1987, p. 55

(2) Un esempio di collettivo statistico può essere considerato un insieme di materiali provenienti da un singolo scavo

(3) Secondo la definizione di Clarke si intende per "tipo" una popolazione omogenea di manufatti che condividono una gamma consistentemente ricorrente di stati di attributo in un insieme politetico dato, D. L. Clarke, Archeologia analitica, Electa, Milano 1998, p. 162 (e segg.)

(4) P. Moscati, Archeologia e Calcolatori, cit., p. 61

(5) P. Moscati, Archeologia e Calcolatori, cit., p. 64

(6) A. Bietti, Le gisement paléolithique supérieur de Taurisano (Lecce, Italia) et sa position chronologique et culturelle dans l'Epigravettien Italien, in Actes du Colloque International "La fin des Temps Glaciaires en Europe" - Bordeaux 1977, 1979, pp. 333-344

(7) P. Moscati, Archeologia e Calcolatori, cit., pp. 65-66

(8) F. Bordes, Considérations sur la typologie et les techniques dans le Paléolithique, in "Quartär", 18, 1967, pp. 25-55

(9) P. Moscati, Archeologia e Calcolatori, cit., pp. 68-69

(10) «Per gli attributi nominali si usa in genere il termine "interdipendenza" che indica la relazione simmetrica esistente tra due variabili», P. Moscati, Archeologia e Calcolatori, cit., p. 72

(11) R. Barry Lewis, The Analysis of Contingency Tables in Archaeology, in M. B. Schiffer (a cura di), Advances in Archaeological Method and Theory, 1-9, New York 1978-1986, pp. 277-310

(12) P. Moscati, Ricerche matematico-statistiche sugli specchi etruschi (Contributi del Centro Linceo Interdisciplinare di Scienze Matematiche e loro Applicazioni, n. 66), Roma 1984; P. Moscati, Ricerche matematico-statistiche sugli specchi etruschi, in L. Corti (a cura di), Second International Conference on Automatic Processing of Art History Data and Documents, Pisa 1984, Papers, vol. I-II, Firenze 1984, pp. 209-224 

(13) P. Moscati, Archeologia e Calcolatori, cit., p. 73

 

 

per approfondire...

· Moscati P., Archeologia e Calcolatori, Giunti Barbera, Firenze 1987, pp. 60-75

· Orton C., Mathematics in Archaeology, Londra 1980

· Di Ciaccio A.- Borra S., Introduzione alla Statistica Descrittiva, McGraw-Hill, Milano 1996


risorse web:

· Soliani L., Elementi di statistica descrittiva

 

 


Sommario Statistiche multivariate