Quale variabile, quale analisi!

In un post di qualche tempo fa vi annunciavo questo articolo: un sintesi, un tentativo di offrire qualche linea guida su quale analisi statistica utilizzare una volta compreso il tipo di variabile con cui abbiamo a che fare. Vale la pena di ricordare, infatti, che ad ogni livello di misurazione (cioè con quale scala numerica abbiamo effettuato le nostre misurazioni) è associabile una sorta di forza numerica (non me ne vogliano gli esperti per questo tentativo di ridurre la complessità dell’operazione) e quindi delle operazioni numeriche più o meno complesse, approfondite, capaci di darci dei risultati consistenti.

scale di misurazione

Ora, posto che:

  • dovete aver compreso il tipo di variabile in modo corretto (nominale, ordinale, scala ad intervalli o scala a rapporti),
  • io sono una psicologa e non una statistica e quindi sono loro ad avere una visione più ampia e completa,

spero comunque che queste brevi indicazioni possano essere utili. Per rendere il tutto più fruibile individuerò 3 macroobiettivi.

  1. Analisi preliminare e Descrizione dei dati.
  2. Esplorare la relazione tra le variabili.
  3. Testare le differenze significative.

Analisi preliminare

Il primo passaggio è quello di osservare e descrivere i dati e lo facciamo attraverso la statistica descrittiva:

  • indicatori di tendenza centrale: moda (s. nominale), decili, quartili e percentili e mediana (s. ordinale) e media (S.intervalli e  rapporti).
  • indicatori di variabilità: campo di variazione e differenza interquartilica (s. ordinale), varianza e deviazione standard (S.intervalli e  rapporti).

Relazioni tra variabili

Quando abbiamo a che fare solo con delle frequenze (ad esempio per scale nominali) possiamo chiederci se tale distribuzione di frequenze è dovuta al caso (indipendenza stocastica) o se ci stiamo discostando da tale indipendenza. Per fare ciò si usa il test Chi Quadro, che però non ci dà informazione sulla forza del legame.

Per verificare una relazione causa- effetto tra una variabile nominale e una a scala più alta si può usare la Regressione logistica.

Se il nostro obiettivo è verificare una correlazione tra una variabile ordinale e una “a rapporti” o “a intervalli”  o tra variabili ordinali è possibile usare Il coefficiente per ranghi di Spearman.

Nel caso di variabili misurate con le scale più “raffinate”:

  • R di Pearson per la correlazione
  • Regressione lineare per verificare la relazione di causa-effetto
  • Analisi fattoriali per condensare una grossa mole di dati in fattori riassuntivi.

Differenze tra le medie delle popolazioni

Nel fortunato caso in cui siate coinvolti in qualche piccolo o grande esperimento che comporti il confronto tra due o più popolazioni usiamo la statistica inferenziale e dei test per verificare la significatività della differenza tra le medie delle popolazioni.

Confronto tra due gruppi

  • Se i due gruppi sono indipendenti (cioè non c’è un legame tra i membri dei due gruppi) allora si possono usare: il test di Mann Withney (gruppi inferiori a 30 e variabili ordinali) T-test per variabili misurate su scala a rapporti e intervalli.
  • Se i dati sono appaiati (ad esempio due misurazioni effettuate sulle stesse persone) allora ci sono: il test di wilcoxon (ordinali) e t-test per dati appaiati (scala a rapporti e intervalli).

Confronto tra più gruppi

Nel caso di più di due gruppi abbiamo a disposizione un test più potente, l’Anova che comunque può essere usato anche se abbiamo solo due gruppi:

  • l’Anova a una via (con una variabile indipendente) e quella fattoriale (per più variabili indipendenti) si usano in caso di gruppi indipendenti.
  • L’anova a misure ripetute invece si usa quando gli stessi soggetti vengono sottoposti a più misurazioni.

L’anova si usa solo per scale a intervalli equivalenti e a rapporti equivalenti.

 

Spero che questo schema (non esaustivo) via sia d’aiuto!!

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *