Quale variabile, quale analisi!

In un post di qualche tempo fa vi annunciavo questo articolo: un sintesi, un tentativo di offrire qualche linea guida su quale analisi statistica utilizzare una volta compreso il tipo di variabile con cui abbiamo a che fare. Vale la pena di ricordare, infatti, che ad ogni livello di misurazione (cioè con quale scala numerica abbiamo effettuato le nostre misurazioni) è associabile una sorta di forza numerica (non me ne vogliano gli esperti per questo tentativo di ridurre la complessità dell’operazione) e quindi delle operazioni numeriche più o meno complesse, approfondite, capaci di darci dei risultati consistenti.

scale di misurazione

Ora, posto che:

  • dovete aver compreso il tipo di variabile in modo corretto (nominale, ordinale, scala ad intervalli o scala a rapporti),
  • io sono una psicologa e non una statistica e quindi sono loro ad avere una visione più ampia e completa,

spero comunque che queste brevi indicazioni possano essere utili. Per rendere il tutto più fruibile individuerò 3 macroobiettivi.

  1. Analisi preliminare e Descrizione dei dati.
  2. Esplorare la relazione tra le variabili.
  3. Testare le differenze significative.

Analisi preliminare

Il primo passaggio è quello di osservare e descrivere i dati e lo facciamo attraverso la statistica descrittiva:

  • indicatori di tendenza centrale: moda (s. nominale), decili, quartili e percentili e mediana (s. ordinale) e media (S.intervalli e  rapporti).
  • indicatori di variabilità: campo di variazione e differenza interquartilica (s. ordinale), varianza e deviazione standard (S.intervalli e  rapporti).

Relazioni tra variabili

Quando abbiamo a che fare solo con delle frequenze (ad esempio per scale nominali) possiamo chiederci se tale distribuzione di frequenze è dovuta al caso (indipendenza stocastica) o se ci stiamo discostando da tale indipendenza. Per fare ciò si usa il test Chi Quadro, che però non ci dà informazione sulla forza del legame.

Per verificare una relazione causa- effetto tra una variabile nominale e una a scala più alta si può usare la Regressione logistica.

Se il nostro obiettivo è verificare una correlazione tra una variabile ordinale e una “a rapporti” o “a intervalli”  o tra variabili ordinali è possibile usare Il coefficiente per ranghi di Spearman.

Nel caso di variabili misurate con le scale più “raffinate”:

  • R di Pearson per la correlazione
  • Regressione lineare per verificare la relazione di causa-effetto
  • Analisi fattoriali per condensare una grossa mole di dati in fattori riassuntivi.

Differenze tra le medie delle popolazioni

Nel fortunato caso in cui siate coinvolti in qualche piccolo o grande esperimento che comporti il confronto tra due o più popolazioni usiamo la statistica inferenziale e dei test per verificare la significatività della differenza tra le medie delle popolazioni.

Confronto tra due gruppi

  • Se i due gruppi sono indipendenti (cioè non c’è un legame tra i membri dei due gruppi) allora si possono usare: il test di Mann Withney (gruppi inferiori a 30 e variabili ordinali) T-test per variabili misurate su scala a rapporti e intervalli.
  • Se i dati sono appaiati (ad esempio due misurazioni effettuate sulle stesse persone) allora ci sono: il test di wilcoxon (ordinali) e t-test per dati appaiati (scala a rapporti e intervalli).

Confronto tra più gruppi

Nel caso di più di due gruppi abbiamo a disposizione un test più potente, l’Anova che comunque può essere usato anche se abbiamo solo due gruppi:

  • l’Anova a una via (con una variabile indipendente) e quella fattoriale (per più variabili indipendenti) si usano in caso di gruppi indipendenti.
  • L’anova a misure ripetute invece si usa quando gli stessi soggetti vengono sottoposti a più misurazioni.

L’anova si usa solo per scale a intervalli equivalenti e a rapporti equivalenti.

 

Spero che questo schema (non esaustivo) via sia d’aiuto!!

L’importanza del controllo nel metodo scientifico

Uno degli aspetti centrali del metodo scientifico, .almeno per me forse perchè rappresenta una sfida dato il mio carattere, risiede nel controllo.

Per uno psicologo la parola “controllo” fa scattare molti significati, alcuni alla base di difficoltà importanti, ma in questo caso rappresenta una vera ancora di salvezza per più di un motivo.

controllo

Il controllo scientifico, i metodi e le tecniche attraverso cui controlliamo i dati, le procedure, i risultati e la comunicazioni degli stessi ci permette:

  • di restare umili, cioè di pensare sempre che l’errore è dietro l’angolo e che il ricercatore per primo deve mettere in discussione i propri passaggi e controllarli senza darli per scontati.
  • ci permette di dare il nostro contributo alla ricerca anche da lettori. Il controllo da parte della comunità scientifica non è un attacco alla persona (come molti presunti scienziati autori di dubbie ricerche comunicano risentiti dalle critiche dei colleghi), bensì è il modo attraverso cui si progredisce. Uno scienziato predilige un aspetto, uno ne predilige un altro e dalla parzialità delle loro osservazioni si arriva per gradi ad uno sguardo più completo. La correzione di un errore diventa spunto per un altro che lo potrà correggere. Certo, a nessuno piace essere corretto, ma bisogna accettarlo quando la critica è corretta; se non lo accetta l’individuo, grazie ad una corretta comunicazione scientifica, potrà accettarlo la comunità scientifica portando avanti la conoscenza.
  • il controllo è anche il modo per risolvere da soli il proprio errore più velocemente. Grazie ad una procedura che individua puntualmente passaggi e procedure, sarà più semplice ripercorrere i propri passi e correggersi.
  • Il controllo sperimentale, seppure noioso, da secchioni e lento e puntuale (o forse proprio grazie a questo) è proprio ciò che in questo momento della storia, caratterizzato da velocità e superficialità, ci permette di distinguere l’informazione consistente da quella inconsistente.

Personalmente tutto ciò che, in termini di conoscenza, si basa su parole pompose dietro cui non c’è una procedura, non c’è una serie di passaggi di controllo sperimentale costituiscono una comunicazione scadente. Non necessariamente si tratta di falsità, ma di materiale di cui non si può discutere, non si può verificare e quindi non può essere sottoposta a un controllo. Questo genere di informazioni, per me, rientrano nel campo della fede, non della scienza.

Ci devo credere o lo posso capire? questa è la domanda dietro le noiose procedure sperimentali e di controllo? Chi scrive vuole che io creda o comprenda?  Non è questione di cattiveria, ma solo di consistenza!!

Per Farmi capire meglio, vi racconto un episodio che mi riportò mia figlia quando aveva 4 anni ed era la secondo anno della scuola dell’infanzia. Un giorno venne a casa dicendo che una delle sue compagne era un genio della matematica! Incuriosita chiesi in che modo fosse giunta a questa conclusione e mi disse: Mamma, a turno le abbiamo dato dei numeri a caso e le chiedevamo quanto fa 5+9 o 12456+873, e lei riusciva sempre a dare una risposta”. Quel giorno cercai di dare a mia figlia la prima lezione sul controllo pur dovendo spegnere quel lampo di eccitazione dai suoi splendidi occhi. Le chiesi se c’era la maestra ad ascoltarli e risposte di no. A quel punto la incalzai: “ma se nessuna di voi sa contare, come potete essere sicure che i suoi calcoli fossero esatti. Ti poteva dire qualunque cosa e per il semplice fatto che lei rispondeva sicura tu le avresti creduto”.

Lo sbaglio di mia figlia mi ha rivelato un’ingenuità che abbiamo anche da adulti, sostituire un processo difficile e lungo come il controllo con la fiducia in qualcuno, perchè è più semplice credere:

  • credere che la sua sicurezza sia esperienza (mentre uno scienziato è sempre cauto e controllato)
  • credere che quelle parole si reggano da sole (mentre uno scienziato perde un sacco di tempo a restringere il senso delle sue parole)
  • credere che in pochi secondi io possa fare a meno di anni di studio e capire che quel risultato è esatto pur non sapendo contare!

Le critiche alla scienza

Spesso gli pseudoscienziati si ergono a vittime incomprese a causa delle critiche che ricevono i loro studi. La critica non è un attacco personale,bensì una parte essenziale del processo di ricerca attraverso cui:

-la comunità scientifica controlla la veridicità de risultati e dei metodi

-la comunità scientifica controlla a replicabilità dei risultati

-gli scienziati apportano un contributo a idee lontane estendendo il significato di un esperimento o di una teoria.

Quanto è frequente ricevere delle critiche? In sede di pubblicazione di un articolo sono all’ordine del giorno, non credo che nessuno abbia pubblicato al primo compiacenza revisioni, ma anche dopo la pubblicazione i commenti piovono. Per avere un’idea dei numeri vi lascio un link di un articolo de LeScienze che riporta i risultati di una ricerca http://www.lescienze.it/news/2015/10/28/news/analisi_citazioni_negative_articoli_scientifici-2820589/

Un articolo su tre viene criticato e il numero diminuisce con il tempo, quindi studi giovani sono sotto il mirino dei controllori della scienza. Il tutto viene fatto senza cattiveria,non per denigrare, ma spiegando dove un collega potrebbe essere incappato in un errore. Pur restando male un vero ricercatore, si aspetta, accetta e soprattutto risponde ai contenuti del critiche mosse senza sentirsi perseguitati, ma cogliendo l’opportunità di un miglioramento.

Test psicologico in italiano: traduzione o validazione?

Se avete mai usato (o vi è stato somministrato) un test psicologico vi sarete accorti che gran parte di questi strumenti ha dei nomi strani, spesso acronimi di un insieme di parole (spesso in lingua inglese) che spiegano cosa si andrà a misurare. Ma cosa succede quando un test creato in un altro paese o in un’altra lingua viene tradotto in italiano?

tradurre-test-psicologia

Ecco, già pensare che si tratti di una mera traduzione è un pò superficiale. se siete tentti di prendere una serie di domande e tradurle con Google Translator, siete completamente fuori strada. Così come i test psicologici non sono quelle 4 domande che trovate nelle riviste, così il processo che porta uno strumento ad essere utilizzabile (in forma efficace ed efficiente) in un altro contesto culturale è lungo e complesso: una nuova validazione!

Le problematiche che sorgono in questo processo sono diverse, proviamo a seguire alcune indicazioni di Carlo Chiorri (Teoria e tecnica psicometrica. Costruire un test psicologico) per fare chiarezza. Le difficoltà sono di ordine: Psicologico, linguistico e statistico, vediamole brevemente

  1. a livello psicologico occorre comprendere se la stessa variabile che va ad essere misurata esista anche nella società in cui si va ad introdurre il test, insomma il costrutto regge? Il bias culturale ci porta a pensare che dappertutto esista l’empatia e che sia un comportamento apprezzabile e apprezzato. Non è detto! L’intelligenza nella nostra società fa riferimento alla capacità di utilizzare il ragionamento logico, mentre in Kenya i bambini intelligenti sono quelli che conoscono il loro ruolo all’interno della famiglia e sono in grado di rispettarlo. Quindi che risultati darebbe un loro test dell’intelligenza in Italia?
  2. Un altro bias è quello legato alla lingua, cioè alla possibilità di tradurre effettivamente un termine utilizzato. Ciò ha portato a delle distorsioni non solo nella formulazione delle domande, ma anche per quanto riguarda le istruzioni. In lingua inglese è normale, educato e ovviamente necessario inserire il Please nella formula con cui si richiede di compilare il test, ma che in italiano (soprattutto se ripetuto) non sempre “suona” bene.
  3. a livello statistico la questione non è meno complicata. La solidità di un test si basa sulla sua capacità di misurazione, ma anche nei range di variazione del punteggio associato alla popolazione, cioè quello che ci fa dire: il punteggio è sopra o sotto la media, di quanto e soprattutto quanto è la media. Ma è sbagliato presupporre che nei diversi stati la variabilità si esprima allo stesso modo, quindi dopo aver constatato che lo strumento misura lo stesso costrutto e che la formulazione delle domande rispecchia tale necessità occorre campionare la nuova popolazione e ricalcolare gli indici statistici che confermino da una parte la solidità dello strumento ( coerenza interna, stesse scale, ecc.) e dall’altra ci riportino gli indicatori validi e validati nella nuova popolazione!

Validate gente, Validate!

 

 

La varianza spiegata: quando la significatività statistica non basta!

Uno degli obiettivi della nostra ricerca è quello di trovare una certa significatività statistica: i nostri dati confermano la nostra ipotesi?! A volte però questa felice notizia non basta e dobbiamo appellarci ad altro: la varianza spiegata!

Facciamo un esempio. Abbiamo avuto un’idea geniale e formuliamo un modello che possa spiegare il fenomeno che stiamo studiando: 4 variabili che spiegano il bullismo! Raccogliamo i dati, li elaboriamo, facciamo “girare” una regressione e otteniamo una significatività statistica, cioè il modello funziona e spiega il fenomeno del bullismo.

E allora cosa ci serve di più? Non è sufficiente sapere che quelle variabili incidono sul bullismo, ma dobbiamo accertarci quanto effettivamente spiegano del fenomeno. Questa è la varianza spiegata, un indicatore che in forma di proporzione, indica quanta variabilità dei nostri dati è spiegata dal modello in questione. Un modello che spiega lo 0.98 così come un modello che spiega il 0.5 ha la stessa significatività, ma differente “portata”.

Questa precisazione è tutt’altro che banale. Pensiamo alla pubblicità, prodotti venduti al supermercato che promettono risultati e miglioramenti degni di una medicina e che risultano efficaci dai test. In genere c’è scritto a righe piccolissime che questo risultati si ottengono associando particolari stili di vita, ma allora perchè permettono di dire che ha degli effetti concreti. Perchè magari la sostanza ha un apporto al benessere generale all’interno di questo pacchetto, ma di quanto è? Questo potrebbe essere un momento in cui ti rendi conto che la significatività statistica non basta!

Diventa accorto, non ti accontentare di un modello che funziona, ma scegli il modello migliore, quello che spiega di più la variabilità dei tuoi dati!