Autore |
Discussione |
|
pallolicus
Nuovo Arrivato
Prov.: Benevento
Città: airola
67 Messaggi |
Inserito il - 06 settembre 2006 : 23:20:18
|
Sondaggio:
Ho trovato tra i miei vecchi appunti di bioinformatica il test t student...dovrebbe essere un'analisi statistica...un tempo sapevo cos'era ma ora nn ricordo...poichè devo rifare l'esame qualcuno gentilmente può rinfrescarmi la memoria?Magari riportando qualche esempio. Grazie 1000
|
|
|
|
chick80
Moderatore
Città: Edinburgh
11491 Messaggi |
Inserito il - 07 settembre 2006 : 09:00:41
|
Il t di student è un test statistico che serve per confrontare due gruppi di dati replicati. In sostanza confronta la differenza tra la media dei due gruppi, considerando la dispersione dei dati (espressa come deviazione standard). Nota che se hai più di due gruppi non è corretto usare il t test, devi usare l'analisi della varianza (ANOVA). Non è necessariamente usato per problemi di genetica, lo puoi usare per qualsiasi problema di statistica.
Ti faccio un esempio per chiarire come funziona:
Consideriamo un esperimento in cui trattiamo delle cellule con una sostanza X che aumenta la quantità della proteina P.
Abbiamo 5 piastre di cellule che vengono trattate con X e 5 piastra di controllo che vengono trattate solo con il veicolo. Andiamo poi a misurare la quantità di P con un certo metodo e otteniamo questi valori (sono numeri assolutamente casuali):
Piastre controllo: 1.4 1.6 1.2 1.9 1.1
Piastre trattate: 2.1 2.6 1.8 2.3 2.4
Calcoli la media dei due gruppi e la deviazione std:
controlli - media: 1.44 dev. std.: 0.32 trattate - media: 2.24 dev. std.: 0.30
A questo punto calcoli la varianza come somma delle due deviazioni standard al quadrato diviso il numero di campioni.
Quindi:
varianza = 0.32*0.32/5 + 0.30*0.30/5 = 0.04
Ora calcoli il valore di t come valore assoluto della differenza delle medie diviso radice quadrata della varianza.
|1.44-2.24|/0.2 = 4
Ora prendi una tablella dei valori del t test (es. questa) e cerchi il valore nella casella con n1+n2-2 gradi di libertà (quindi 5+5-2=8) e corrispondente alla probabilità che vuoi controllare (es. 0.01).
Per 8 gradi di libertà con p=0.01 il valore di t è 2.896
Poichè il nostro valore (4) è maggiore di questo, vuol dire che c'è meno di 1/100 di probabilità che i due gruppi siano diversi solo per caso (e non a causa del trattamento). Quindi possiamo con una buona confidenza dire che il trattamento ha un effetto. Poichè il valore è minore di 4.499, non possiamo dire che la probabilità è minore di 1/1000.
|
Sei un nuovo arrivato? Leggi il regolamento del forum e presentati qui
My photo portfolio (now on G+!) |
|
|
pallolicus
Nuovo Arrivato
Prov.: Benevento
Città: airola
67 Messaggi |
Inserito il - 07 settembre 2006 : 12:59:45
|
ok grazie 1000...anche se ho trovato qualche difficoltà a seguirti,visto che non sono molto ferrato nei calcoli,penso che + chiaro di cosi' si muore... grazie |
|
|
bluevil
Nuovo Arrivato
17 Messaggi |
Inserito il - 08 settembre 2006 : 21:27:58
|
ciao chick80,
davvero un'ottima spiegazione! Potresti spiegarci perchè si usa l'ANOVA nel caso di più di due gruppi e come utilizzarla? grazie! |
|
|
fpotpot
Utente
Città: middleofnowhere
1056 Messaggi |
Inserito il - 08 settembre 2006 : 23:31:04
|
oh questo argomento si fa interessante....chick pendiamo dalle tue...dita... |
|
|
chick80
Moderatore
Città: Edinburgh
11491 Messaggi |
Inserito il - 09 settembre 2006 : 12:49:43
|
Potremmo dire che l'ANOVA è una versione "estesa" del t-test.
Riprendendo l'esempio di sopra, supponiamo di avere:
5 controlli (solo veicolo) 5 trattati con X alla concentrazione C1 5 trattati con X alla concentrazione C2 5 trattati con X alla concentrazione C3
Uno potrebbe pensare di fare 3 t-test tra i controlli e ciascun singolo gruppo. Questo non è statisticamente corretto, in quanto così facendo non consideriamo il totale dell'esperimento, ma solo parte dei risultati. Sarebbe come dire che invece di fare l'esperimento sopra riportato, avessimo fatto 3 esperimenti con i controlli e le 3 dosi una alla volta. L'ANOVA permette di calcolare la differenza tra le medie di più gruppi tenendo conto delle differenza tra questi gruppi. Il t-test è valido solo se confrontiamo 2 situazioni che differiscano solo ed esclusivamente per un carattere, mentre nell'ANOVA possiamo avere molti fattori che interagiscono tra di loro (anche se raramente si guardano più di 3 fattori insieme).
In particolare, per l'esempio di sopra serve un'ANOVA a una via, in quanto abbiamo solo 1 fattore da prendere in considerazione (cioè la concentrazione di X). Se il nostro esperimento, oltre alle 3 concentrazioni di X comprendesse 3 concentrazioni di Y, allora dovremmo usare un'ANOVA a due o vie, perchè in questo caso abbiamo 2 fattori da considerare (concentrazione e tipo di trattamento). Se oltre alle concentrazioni considerassimo anche diversi tempi di esposizione avremmo 3 fattori e dovremmo fare un'ANOVA a tre vie etc.
Generalmente il test ANOVA non viene fatto a mano, ma usando software che fanno direttamente tutti i vari calcoli necessari. Tuttavia, visto che stasera piove e non ho voglia di uscire, vi spiego come fare un'ANOVA con carta e penna! Che fortuna eh?
Per semplicità considererò solo l'ANOVA a 1 via e prenderò l'esempio di sopra:
Abbiamo * 5 controlli * 5 piastre trattate con X a concentrazione C1 * 5 piastre trattate con X a concentrazione C2 * 5 piastre trattate con X a concentrazione C3
Per ciascun gruppo calcoliamo: - i valori dei 5 replicati (es. quantità di proteine o quello che vogliamo misurare) - la media in ciascun gruppo, che chiamiamo m
Possiamo inoltre trovare la media di TUTTI i campioni che chiamiamo M.
Ogni singolo valore V di un campione sarà uguale a:
V = M + T + E
dove M è la media totale, T è un certo fattore derivante dal trattamento e E è un errore, che deriva da altri fattori diversi dal trattamento (errore sperimentale).
Ora, dobbiamo calcolare alcuni parametri dei nostri dati:
1) la devianza fra i trattamenti (Dtr): è la somma degli scarti di ogni media m dalla media globale, elevati al quadrato. Quindi per ogni gruppo calcoliamo m-M, lo eleviamo al quadrato e sommiamo tutti i valori. 2) la devianza entro i trattamenti (Din): è la somma degli scarti di ogni valore dalla media m del suo gruppo, elevati al quadrato. Per ogni valore calcoliamo V-m, lo eleviamo al quadrato e sommiamo tutti i valori.
Fatto questo possiamo trovare le corrispondenti varianze che si ottengono dividendo le devianze per il numero di gradi di libertà (gdl) di quella devianza. I gdl per la varianza fra i trattamenti (Str) sono uguali al numero di gruppi-1. Nel nostro es. 4-1=3. I gdl per la varianza entro i trattamenti (Sin) sono uguali al (numero di gruppi-1)-(numero di trattamenti-1), quindi = numero di gruppi-numero di trattamenti. Nel nostro es. 20-4=16.
Str ci dà un'idea delle differenze fra i vari gruppi. Sin ci dà un'idea delle differenze fra i valori all'interno di un singolo gruppo.
Possiamo, a questo punto eseguire il test di Fisher, per cui serve calcolare il valore F che è:
F = Str/Sin
Se il trattamento non ha effetto F sarà uguale a 1, in quanto le due varianze saranno identiche, altrimenti F sarà > 1.
Ancora una volta ci servono delle tabelle con i valori di F, ad es. queste. Prendiamo quella con la probabilità che ci interessa, es. 0.01 e troviamo il valore di F all'intersezione dei gdl delle nostre 2 varianze (sulle colonne i gdl di Str, sulle righe quelli di Sin).
Quindi, nella riga 16, colonna 3, tabella per p=0.01 troviamo 4.0768
Se il nostro F è maggiore di questo numero, allora vuol dire che le differenze tra i gruppi non sono casuali (o meglio, che c'è meno di 0.01, cioè 1% di probabilità che le differenze siano casuali).
Ora, se F è minore del valore che ci interessa ci possiamo fermare qui. Se invece F è maggiore, cioè i gruppi sono statisticamente diversi, la domanda che ci poniamo è: quali tra i gruppi sono diversi? Ad es. è possibile che i controlli siano diversi dal gruppo trattato con la concentrazione C2, ma non da quello trattato con C1. E C2 è diverso da C3? Per rispondere a queste domande (e mettere quei simpatici asterischi sui grafici dei vostri risultati...) bisogna fare un test post hoc.
In pratica l'idea è di confrontare tutte le coppie di medie/varianze possibili fra tutti i gruppi e vedere quali hanno contribuito al fatto che i gruppi siano diversi. Non sto a scrivere qui le formule per questi test, sarebbe troppo lungo, anche perchè ce ne sono molti (es. Bonferroni, Tuckey, Student-Newman-Keuls etc etc.) L'idea è sempre che facendo calcoli vari sulle varianze o sulle medie per ogni coppia (nel nostro es. controlli-C1, controlli-C2, controlli-C3, C1-C2, C1-C3, C2-C3) si ottiene un valore che si andrà a confrontare con quello in una tabella e ci permetterà di dire quanto è significativa la differenza fra quei due specifici gruppi. Torno a ripetere che ad ogni modo, anche se andiamo a confrontare solo 2 gruppi, usiamo valori che tengono conto anche degli altri dati.
Ha senso tutto il poema che ho scritto? Fatemi sapere! |
Sei un nuovo arrivato? Leggi il regolamento del forum e presentati qui
My photo portfolio (now on G+!) |
|
|
Cangrande
Utente Junior
Prov.: Verona
280 Messaggi |
Inserito il - 12 settembre 2006 : 15:01:19
|
certo che ha senso! grazie a te e alla pioggia |
Magnifico atque victoriosissimo Domino, Domino Kani Grandi de la Scala. |
|
|
bluevil
Nuovo Arrivato
17 Messaggi |
Inserito il - 17 settembre 2006 : 17:20:55
|
Citazione: Messaggio inserito da chick80
Potremmo dire che l'ANOVA è una versione "estesa" del t-test.
--CUT--
davvero eccellente...
hai pvt saluti |
|
|
ginevra
Nuovo Arrivato
3 Messaggi |
Inserito il - 05 novembre 2007 : 11:01:49
|
Salve, son un nuovo utente , trovo molto interessante questo forum e mi rivolgo a tutti coloro in grado di aiutarmi a risolvere un esercizio al quale credo vada applicato il test t. In allegato trasmetto l'esercizio:
Allegato: es1.doc 33,23 KB |
|
|
Eleonora85
Nuovo Arrivato
8 Messaggi |
Inserito il - 03 dicembre 2010 : 10:21:49
|
Ciao a tutti, sono nuova e ho 1 grande problema. Mi è stato richiesto di fare 1 analisi del t di student per 1 ricerca (molto modesta e svolta da me sotto la supervisione di una mia professoressa di psicologia) su alcuni dati riguardanti prestazioni aritmetiche di bambini di quarta e quinta elementare. Io tuttavia non sono capace di svolgere questa analisi, e anche se in exel è presente la formula, non conoscendola non so come usarla. Se vi allego il file con i dati potete aiutarmi? Grazie a tutti! |
|
|
TMax
Utente Junior
Prov.: BG
Città: Capriate
270 Messaggi |
Inserito il - 03 dicembre 2010 : 12:32:04
|
allega.. |
|
|
Eleonora85
Nuovo Arrivato
8 Messaggi |
Inserito il - 03 dicembre 2010 : 17:53:51
|
ok questi sono i dati |
|
|
Eleonora85
Nuovo Arrivato
8 Messaggi |
Inserito il - 03 dicembre 2010 : 18:21:20
|
mi sn accorta di non sapere come allegare il file!come si fa??!io ho word 2007 in quale formato devo salvare il file?!
|
|
|
chick80
Moderatore
Città: Edinburgh
11491 Messaggi |
Inserito il - 03 dicembre 2010 : 19:02:56
|
Se riesci a mettere i dati in Excel e salvarlo come xls penso che più o meno riusciremo a farci qualcosa ;)
Per allegare i file rispondi usando il link Rispondi e avrai un'opzione per allegare files :) |
Sei un nuovo arrivato? Leggi il regolamento del forum e presentati qui
My photo portfolio (now on G+!) |
|
|
Eleonora85
Nuovo Arrivato
8 Messaggi |
Inserito il - 03 dicembre 2010 : 19:31:20
|
...help!io ho word 2007. quando clicco per salvare mi si apre 1 finestra che mostra i vari formati tra cui: cartella di lavoro exel , cartella di lavoro binaria , cartella con attivazione macro, e versione compatibile con word 97- 2003. qual'è quella XLS?!scusate la mia totale ignoranza in maeteria..sto copiando e incollando questo file da circa mezza giornata per inviarlo ma non ci riesco.. |
|
|
chick80
Moderatore
Città: Edinburgh
11491 Messaggi |
|
Eleonora85
Nuovo Arrivato
8 Messaggi |
Inserito il - 03 dicembre 2010 : 21:13:07
|
si una tabella exel. Però mi hai dato 1 idea..provo a mandarla con word...
Allegato: SOG.doc 200,42 KB |
|
|
chick80
Moderatore
Città: Edinburgh
11491 Messaggi |
Inserito il - 03 dicembre 2010 : 21:47:19
|
OK, perfetto... ora abbiamo i dati, però ci devi aiutare un po' a capire cosa significano.
Prima di fare qualsiasi analisi statistica ci devi dare delle informazioni molto importanti.
1) cosa sono le varie colonne nella tabella? SOG è il soggetto, e fino a qui ci siamo. PROB1, 2, 3 ... 6 sono dei problemi da risolvere immagino. E MC ed ML??? 2) Questa è la cosa più importante: che ipotesi vuoi analizzare? Personalmente dubito che, qualsiasi cosa tu voglia analizzare un t-test sia la cosa da fare, in quanto hai un problema a variabili multiple e discrete (non continue).
|
Sei un nuovo arrivato? Leggi il regolamento del forum e presentati qui
My photo portfolio (now on G+!) |
|
|
Eleonora85
Nuovo Arrivato
8 Messaggi |
Inserito il - 03 dicembre 2010 : 21:53:53
|
dunque, hai presupposto in maniera corretta. nei problemi (per l'appunto 6) ci sono varie domande MC ed ML sono le sigle di queste domande alle quali va attribuito 1 punteggio. Sinceramnete non so, credo tu abbia ragione ma purtoppo mi è stata chiesta dalla professoressa..!ma secondo te cosa si dovrebbe fare? |
|
|
chick80
Moderatore
Città: Edinburgh
11491 Messaggi |
Inserito il - 03 dicembre 2010 : 22:13:29
|
Beh... questo me lo devi dire tu (o chiederlo alla tua prof!)
Qual'è la vostra domanda? Volete sapere se ci sono differenze fra maschi e femmine? Se ci sono differenze fra allievi di diverse classi? Se ci sono differenze nelle risposte ai vari problemi?
Inoltre, ti faccio un altro paio di domande sui dati: 1) vedo che i risultati sono 0,1,2,3. Ho quindi ragione ad assumere che sono valori discreti? Ossia, non puoi avere un valore di, chessò, 2.3? E cosa significano esattamente questi risultati? 0 è il minimo e 3 è il massimo del punteggio? 2) le varie domande sono collegate? Cioè, per rispondere a ML3 si deve rispondere a ML2?
Ad ogni modo, qualunque sia la risposta, questa a me sembra un'analisi statistica mediamente complessa (se la si vuole fare correttamente). |
Sei un nuovo arrivato? Leggi il regolamento del forum e presentati qui
My photo portfolio (now on G+!) |
|
|
Eleonora85
Nuovo Arrivato
8 Messaggi |
Inserito il - 03 dicembre 2010 : 22:36:05
|
dunque le domande sono esattamente quelle che hai presupposto. differenza di genere e differenza di prestazione dovuta a età/classe frequentata. le domande sono in sequenza ma 1 non esclude l'altra (si può ottenere 1 punteggio ad es di 0 a ml1 e di 2 a ml2 senza problemi) si hai ragione a presupporre si possono ottenere solo punteggi naturali (per la precisione 0 1 2 e 3). Il prob è ke la prof in questione non è poi così normale. il lavoro da me svolto era concluso (avevo fatto 1 semplice analisi paragonando le medie) e lo avevo consegnato, ma lei ha chiesto questa cosa, che detto tra noi è effettivamente complessa e non ha senso!il che vuol dire in poche parole che a meno di cause di forza maggiore vorrei provare ad accaontentarla..!cmq davvero grazie mille per la cordialità e la collaborazione!impagabile!!! |
|
|
chick80
Moderatore
Città: Edinburgh
11491 Messaggi |
Inserito il - 03 dicembre 2010 : 23:03:40
|
Il fatto è che non è corretto analizzare questo tipo di dati con un t-test. Credo che la cosa più corretta sarebbe usare un modello log-lineare. (puoi leggere una spiegazione qui: http://en.wikipedia.org/wiki/Poisson_regression anche se senza conoscenze statistiche ti risulterà abbastanza incomprensibile).
Tu cosa ne pensi TMax?
Se ho tempo questo weekend provo a vedere di tirarne fuori qualcosa, ma non ti posso garantire nulla.
Ad ogni modo, un consiglio spassionato è quello di studiare un manuale/seguire un corso di statistica.
|
Sei un nuovo arrivato? Leggi il regolamento del forum e presentati qui
My photo portfolio (now on G+!) |
|
|
Eleonora85
Nuovo Arrivato
8 Messaggi |
Inserito il - 03 dicembre 2010 : 23:10:05
|
grazie mille!ironia della sorte il corso di psicometria (statistica applicata alla psicologia) è effettivamente in programma ma comincerà solo a marzo...cmq grazie davvero!cmq non ti preoccupare, male che va dico alla prof che non sono riuscita a fare questo tipo di analisi... grazie davvero! |
|
|
Daria85
Utente
678 Messaggi |
Inserito il - 04 dicembre 2010 : 10:58:40
|
ciao a tutti!!! qualcuna è così magnanimo de condividere appunti di statistica?cioè con esempi e spiegazioni dei vari test da usare ecc... io vorrei cominciare a ristudiarmeli x bene, ma purtroppo gli appunti di biometria del primo anno della triennale sono una marasma,visto ke il mio prof non era il top... se qualcuno li avesse,magari li alleghi qui!
grazie a tutti!!!
ciao |
|
|
chick80
Moderatore
Città: Edinburgh
11491 Messaggi |
|
TMax
Utente Junior
Prov.: BG
Città: Capriate
270 Messaggi |
Inserito il - 06 dicembre 2010 : 11:03:45
|
Circa i punteggi potrebbero essere trattati come variabili continue se derivano da una rating scale validata ( come spesso accade in psciometria) altrimenti vanno analizzati con strumenti diversi come diceva chick80 La questione per me prioritaria è che i dati non vanno organizzati in quel modo potrà sembrare banale ma una corretta organizzazione dei dati aiuta moltissimo a capire quale strategie adottare in fase descrittiva e analitica perchè aiuta a comprendere bene quali sono le unità di osservazione/sperimentale, i fattori sperimentali, le variabili da controllare, la presenza o meno di una struttura gerarchica dei dati ecc, ecc,....
|
|
|
Discussione |
|