INFORMAZIONI SU

Statistica c.p.

Programma dell'insegnamento di Statistica c.p. - Corso di laurea magistrale in Economics - Scienze economiche (2013/14)

Docente

prof. Laura Pagani laura.pagani@uniud.it

Crediti

6 CFU

Afferenza

Dipartimento di Scienze Economiche e Statistiche

Obiettivo del corso

Introdurre gli studenti alle tecniche di analisi multivariata. Nell’analisi multivariata si considerano più caratteri osservati congiuntamente su un insieme di unità statistiche, studiando le relazioni che intercorrono tra le variabili osservate oppure la somiglianza/dissomiglianza tra unità statistiche. Uno degli scopi più importanti di questo tipo di analisi è quello di rappresentare le unità statistiche e/o le variabili in uno spazio di dimensioni ridotte rispetto a quello originale. Alle lezioni teoriche saranno affiancate delle esercitazioni che prevedono l’analisi di casi reali e l’elaborazione dei dati mediante il pacchetto per le analisi statistiche Stata oppure con il software opensource R.

Programma

Introduzione all’analisi multivariata.
La matrice dei dati unità per variabili. Rappresentazioni grafiche, analisi descrittive univariate e multivariate.
Alcuni richiami di algebra lineare.
Vettori. Combinazione lineare, vettori linearmente indipendenti e dipendenti, basi. Matrici. Definizione, Matrice diagonale, scalare, simmetrica e uguale, operazioni sulle matrici, rango, determinante, matrice non singolare e matrice inversa Equazione caratteristica, autovalori ed autovettori. Ulteriori approfondimenti di Algebra delle Matrici. Equazione caratteristica, Forme quadratiche, regole di derivazione in forma matriciale.
Analisi delle componenti principali.
Introduzione ed esempi applicativi. Individuazione delle CP. Individuazione della prima CP, Individuazione delle seconda CP, Punteggio o score. Varianza della j-esima CP, i loading. CP per variabili standardizzate. Proprietà delle CP per variabili standardizzate. Esempi applicativi ed aspetti tecnici ed interpretativi. Lo scree plot, il grafico dei loading, il grafico degli score.
Distanze e indici di similarità.
Introduzione, Concetto di distanza, alcuni tipi di distanza: euclidea, della città a blocchi, di Minkowski e ultrametrica Impiego ed interpretazione delle distanze in statistica, la distanza di Mahalanobis, gli indici di similarità Espressioni generali degli indici di similarità, il trattamento dei caratteri qualitativi e quantitativi, l'indice di Gower per caratteri qualitativi e quantitativi.
La Cluster Analysis.
Introduzione. La classificazione delle unità statistiche, le scelte nell'analisi dei gruppi, caratteristiche dei metodi gerarchici. Impiego della cluster analysis gerarchica per la segmentazione del mercato. Un esempio applicativo. Metodi non gerarchici di classificazione: il metodo delle k-medie, la scelta della partizione iniziale. impiego dei metodi non gerarchici per la segmentazione dei consumatori. Un esempio applicativo
L'analisi delle corrispondenze.
Introduzione e principi fondamentali. Definizione di profilo di riga, colonna, di massa. Scomposizione dell'inerzia e valori singolari. Giudizio sulla bontà dell'analisi e punteggi. Contributi dei profili riga e colonna Alcune applicazioni illustrative. Cenni all'analisi delle corrispondenze multiple e confronto fra analisi delle componenti principali e analisi delle corrispondenze
Introduzione a Stata.

Libro di testo

S. Zani e A.Cerioli , Analisi dei dati e data mining per le decisioni aziendali. Milano: Giuffrè, 2007
R. Johnson and D. Wichern, Applied Multivariate Statistical Analysis, International Edition, 6th Edition, Pearson Education, 2007.