Forum

Nome Utente:
Password:
Riconoscimi automaticamente
 Tutti i Forum
 MolecularLab
 Bioinformatica
 Correlare serie di dati in zoologia
 Nuova Discussione  Nuovo Sondaggio Nuovo Sondaggio
 Rispondi Aggiungi ai Preferiti Aggiungi ai Preferiti
Cerca nelle discussioni
I seguenti utenti stanno leggendo questo Forum Qui c'è:

Aggiungi Tag Aggiungi i tag

Quanto è utile/interessante questa discussione:

Autore Discussione  

Guy Fawkes
Nuovo Arrivato



5 Messaggi

Inserito il - 11 novembre 2009 : 15:40:06  Mostra Profilo  Visita l'Homepage di Guy Fawkes Invia a Guy Fawkes un Messaggio Privato  Rispondi Quotando
Buon pomeriggio al forum.

Come ho spiegato nel messaggio di presentazione, per motivi che non sto a spiegarvi ho un problema con una serie di dati che ho ottenuto con un esperimento di zoologia. La biostatistica non è il mio campo: quindi, se per esperienza già sapete che un neofita non può fare molta strada in questo campo da autodidatta, ditemelo subito senza farvi scrupoli , così non vi faccio nemmeno perdere tempo.

Dunque, descrivo lo studio.

Voglio verificare gli eventuali effetti che si verificano sulla entomofauna irrigando una piccola area con dell'acqua inquinata. Quindi predispongo tre lotti di terreno (in inglese plot) che chiamerò A, B e C:

A mi servirà come controllo "asciutto";
B come controllo irrigato con acqua normale;
C viene trattato con l'acqua inquinata;

Dopo un tot di ore effettuo un campionamento per plot e procedo alla conta degli insetti rinvenuti, suddividendoli per ordine di appartenenza.
Dopo 15 gg ripeto la sequenza: irrigazione --> campionamento --> conta, così per ogni stagione dell'anno.

Alla fine mi ritrovo con una discreta quantità di dati da correlare, e qui sorgono i problemi. Cosa mi consigliate? Immagino che la soluzione migliore sia utilizzare l'ANOVA, ma onestamente non so come fare. In dipartimento posso usare l'ultima versione di Minitab, quindi almeno dal lato software non c'è problema.

Grazie a tutti!

chick80
Moderatore

DNA

Città: Edinburgh


11491 Messaggi

Inserito il - 11 novembre 2009 : 16:39:33  Mostra Profilo  Visita l'Homepage di chick80 Invia a chick80 un Messaggio Privato  Rispondi Quotando
Citazione:
La biostatistica non è il mio campo: quindi, se per esperienza già sapete che un neofita non può fare molta strada in questo campo da autodidatta, ditemelo subito senza farvi scrupoli , così non vi faccio nemmeno perdere tempo.


E perchè? Tutto si può imparare! Per iniziare puoi dare un occhio a queste dispense, fatte molto bene secondo me:
http://www.molecularlab.it/forum/topic.asp?TOPIC_ID=1286

Citazione:
In dipartimento posso usare l'ultima versione di Minitab, quindi almeno dal lato software non c'è problema.

Non conosco minitab, ma se vuoi un'altra alternativa (free e molto molto potente) ti consiglio di usare R.

http://www.r-project.org/

Sullo stesso sito trovi un sacco di manuali (vai nella sezione manuals per quelli di base e poi clicca sul link contributed, ne trovi anche molti in italiano)

E per quanto riguarda i tuoi dati, direi che probabilmente un ANOVA con più fattori sarebbe un buon punto di partenza.


Alla fine avrai qualcosa tipo:



Plot |  Stagione | Insetti tipo 1 | Insetti tipo 2 | Insetti tipo 3 | ...
-----+-----------+----------------+----------------+----------------+-----
 1     Primavera        150             200               180
 2     Primavera        300             250               190
 3     Primavera        120             100                50

 1     Estate            ...            ...                ...
 2     Estate            ...            ...                ...
 
...
...


Potresti iniziare semplicemente facendo un ANOVA a 2 vie usando il numero di insetti totale e stagione e plot come fattori

Poi potresti calcolare la % di insetti di ciascun gruppo nelle diverse situazioni e lì fare probabilmente un test di Fisher (ma non sono sicurissimo) per vedere se sono statisticamente diverse nelle varie situazioni

Sei un nuovo arrivato?
Leggi il regolamento del forum e presentati qui

My photo portfolio (now on G+!)
Torna all'inizio della Pagina

Guy Fawkes
Nuovo Arrivato



5 Messaggi

Inserito il - 12 novembre 2009 : 10:39:18  Mostra Profilo  Visita l'Homepage di Guy Fawkes Invia a Guy Fawkes un Messaggio Privato  Rispondi Quotando
Ciao chick80. Link salvati e programma scaricato. Quando torno a casa comincio a studiare un po' il tutto e poi vediamo che ne esce, quindi penso che a breve chiederò ancora aiuto...

Davvero grazie mille per i consigli e la disponibilità!

Torna all'inizio della Pagina

MB
Nuovo Arrivato



58 Messaggi

Inserito il - 12 novembre 2009 : 12:20:07  Mostra Profilo  Visita l'Homepage di MB Invia a MB un Messaggio Privato  Rispondi Quotando
Citazione:
Messaggio inserito da chick80

[quote]
Poi potresti calcolare la % di insetti di ciascun gruppo nelle diverse situazioni e lì fare probabilmente un test di Fisher (ma non sono sicurissimo) per vedere se sono statisticamente diverse nelle varie situazioni



Occhio che il Test di Fisher è applicabile solo a tabelle di contingenza 2x2 dove in ogni cella si hanno frequenze piccole (al massimo 10). Altrimenti è più appriopiato il chi-square.
Ciao!
Torna all'inizio della Pagina

TMax
Utente Junior

TMax

Prov.: BG
Città: Capriate


270 Messaggi

Inserito il - 12 novembre 2009 : 12:42:05  Mostra Profilo  Visita l'Homepage di TMax Invia a TMax un Messaggio Privato  Rispondi Quotando
Ciao
è più complesso di quanto può sembrare!

il Plot in termine tecnico fa riferimento ad una variabile non sperimentale e viene utilizzata nei disegni a blocchi randomizzati e rappresenta il cosidetto fattore di blocco
nel tuo caso il plot oltre ad essere fisicamente la parte di terreno che sottoponi a diverso tipo di irrigazione coincide con il tuo fattore sperimentale d'interesse..
questo è una complicazione perchè il tuo fattore plot è sia un fattore ad effetti casuali ( nel senso che tu hai preso quei tre pezzi di terra ma potevi prendere altri 3 ovunque..quindi si assume che quei 3 pezzi siano rappresentativi dell'ì'universo 'pezzi di terreno') sia come fattore ad effetti fissi nel senso che tu sei interessato alle differenze dovute ai 3 particolari sistemi di irrigazione...
in più qui sullo stesso plot ripeti le misure di conteggio più volte nella stessa stagione e per le diverse stagioni
quindi non te la cavi facilemente con una semplice anova
ma sarà necessario fare un modello ad effetti misti!

Altra complicazione è che i tuoi dati sono conteggi quindi dovrenno essere trattati molto probabilmente con un modello di poisson perchè è probabile che siano sovradispersi
ma questo si può sempre vedere dopo

il vero problema è che in questo modo se trovate le differenze non potete affermare che sono dovute all'irrigazione o piuttosto al differente pezzo di terreno usato perchè le due variabili si assorbono una nell'altro
avreste dovuto adottare un disegno detto split-plot con misure ripetute
ovvero dividere più plot in tre porzioni e in ognuna di queste effettuare l'esperimento come hai descritto!

cosi sarà un casino e potrebbe essere attaccabile da referee competenti!




TMax
Torna all'inizio della Pagina

chick80
Moderatore

DNA

Città: Edinburgh


11491 Messaggi

Inserito il - 12 novembre 2009 : 13:22:46  Mostra Profilo  Visita l'Homepage di chick80 Invia a chick80 un Messaggio Privato  Rispondi Quotando
Citazione:
in più qui sullo stesso plot ripeti le misure di conteggio più volte nella stessa stagione e per le diverse stagioni

Ah, questo non l'avevo capito. Ma non si può usare un repeated-measures ANOVA in quel caso?

Citazione:
avreste dovuto adottare un disegno detto split-plot con misure ripetute
ovvero dividere più plot in tre porzioni e in ognuna di queste effettuare l'esperimento come hai descritto!

E ma scusa, non ricadi nello stesso esatto problema anche così?
Cioè il risultato dipenderà da come dividi il plot...

Citazione:
Occhio che il Test di Fisher è applicabile solo a tabelle di contingenza 2x2 dove in ogni cella si hanno frequenze piccole (al massimo 10). Altrimenti è più appriopiato il chi-square.

Beh, no. Semmai è il contrario.
Il test di Fisher è un test esatto, il fatto che in passato si utilizzasse solo per numero ristretto di campioni e tabelle 2x2 era solo dovuto al fatto che è computazionalmente pesante.
Ad ogni modo si può applicare anche a tabelle nxm (cfr Mehta et al, 1986, Clarkson et al, 1993)

Sei un nuovo arrivato?
Leggi il regolamento del forum e presentati qui

My photo portfolio (now on G+!)
Torna all'inizio della Pagina

MB
Nuovo Arrivato



58 Messaggi

Inserito il - 12 novembre 2009 : 14:25:26  Mostra Profilo  Visita l'Homepage di MB Invia a MB un Messaggio Privato  Rispondi Quotando
Citazione:
Messaggio inserito da chick80


Beh, no. Semmai è il contrario.
Il test di Fisher è un test esatto, il fatto che in passato si utilizzasse solo per numero ristretto di campioni e tabelle 2x2 era solo dovuto al fatto che è computazionalmente pesante.
Ad ogni modo si può applicare anche a tabelle nxm (cfr Mehta et al, 1986, Clarkson et al, 1993)



Si beh quella rimane la regola generale.. non so se tu lo sai già ma sarebbe interessante vedere oggi fin dove è ragionevole usare Fisher o da dove l'approssimazione del chi-square diventa tale da essere sovrapponibile. Computazionalmente parlando..scusate l'OT.

ps. non ho trovato le referenze..mi puoi dare l'ID pubmed o ISBN che si fa prima, grazie.
Torna all'inizio della Pagina

chick80
Moderatore

DNA

Città: Edinburgh


11491 Messaggi

Inserito il - 12 novembre 2009 : 14:54:39  Mostra Profilo  Visita l'Homepage di chick80 Invia a chick80 un Messaggio Privato  Rispondi Quotando
Citazione:
Si beh quella rimane la regola generale.. non so se tu lo sai già ma sarebbe interessante vedere oggi fin dove è ragionevole usare Fisher o da dove l'approssimazione del chi-square diventa tale da essere sovrapponibile

Di questo non ho idea sinceramente. Comunque diciamo che siccome oramai i calcoli non li fai più a mano poco importa...

I due papers sono sull'algoritmo FEXACT usato per calcolare Fisher su tabelle m x n

Li trovi qui:
Mehta 1986
Clarkson 1993 (a questo non riesco ad accedere però)

Sei un nuovo arrivato?
Leggi il regolamento del forum e presentati qui

My photo portfolio (now on G+!)
Torna all'inizio della Pagina

TMax
Utente Junior

TMax

Prov.: BG
Città: Capriate


270 Messaggi

Inserito il - 12 novembre 2009 : 15:44:01  Mostra Profilo  Visita l'Homepage di TMax Invia a TMax un Messaggio Privato  Rispondi Quotando
Citazione:
Messaggio inserito da chick80

[quote]in più qui sullo stesso plot ripeti le misure di conteggio più volte nella stessa stagione e per le diverse stagioni

Ah, questo non l'avevo capito. Ma non si può usare un repeated-measures ANOVA in quel caso?

beh si ..l'Anova non è altro che un modello lineare..
solo che devi conoscere bene il disegno perchè devi dirgli il denominatore corretto della varianza residua per calcolare la F e può essere un casino per disegni complessi.... io preferisco sempre fare direttamente il modello lineare.. e non sbaglio mai oltre ad essere molto più flessibile.. in questo caso ad esempio hai il problema della natura della vairiabile che molto probabilmente non ti permette di rispettare gli assunti di normalità degli errori ... con un modello lineare puoi indicargli il tipo di errore ( in questo caso molto probabilmente poisson) con la anova no!




E ma scusa, non ricadi nello stesso esatto problema anche così?
Cioè il risultato dipenderà da come dividi il plot...

no... il plot diventa una variabile ad effetti casuali quindi il modello ne tiene conto come fonte di disturbo...
il disegno split plot isola il 'rumore' dovuto al plot lo controlla e ti dice l'effetto del trattamento depurato dell'errore dovuto alla variabile plot



max
Torna all'inizio della Pagina

TMax
Utente Junior

TMax

Prov.: BG
Città: Capriate


270 Messaggi

Inserito il - 12 novembre 2009 : 15:46:25  Mostra Profilo  Visita l'Homepage di TMax Invia a TMax un Messaggio Privato  Rispondi Quotando
circa il test di fisher...
non è la frequenza per celle che se è piccola rende poco attendibile il chiquadro
ma le frequenze attese!

una sottile differenza!


max
Torna all'inizio della Pagina

chick80
Moderatore

DNA

Città: Edinburgh


11491 Messaggi

Inserito il - 12 novembre 2009 : 15:52:25  Mostra Profilo  Visita l'Homepage di chick80 Invia a chick80 un Messaggio Privato  Rispondi Quotando
Citazione:
no... il plot diventa una variabile ad effetti casuali quindi il modello ne tiene conto come fonte di disturbo...
il disegno split plot isola il 'rumore' dovuto al plot lo controlla e ti dice l'effetto del trattamento depurato dell'errore dovuto alla variabile plot


Capisco. Ma una domanda stupida: fisicamente, quanto sono grandi questi plot?

Sei un nuovo arrivato?
Leggi il regolamento del forum e presentati qui

My photo portfolio (now on G+!)
Torna all'inizio della Pagina

TMax
Utente Junior

TMax

Prov.: BG
Città: Capriate


270 Messaggi

Inserito il - 12 novembre 2009 : 16:51:29  Mostra Profilo  Visita l'Homepage di TMax Invia a TMax un Messaggio Privato  Rispondi Quotando
ah io non lo so...
bisogna chiederlo a chi ha fatto l'esperimento

Max
Torna all'inizio della Pagina

chick80
Moderatore

DNA

Città: Edinburgh


11491 Messaggi

Inserito il - 12 novembre 2009 : 17:49:59  Mostra Profilo  Visita l'Homepage di chick80 Invia a chick80 un Messaggio Privato  Rispondi Quotando
Ad ogni modo nel capitolo XIV delle dispense che ho linkato (dove in effetti si parla di nested- e di random-effect ANOVA) nel primo messaggio c'è proprio un esempio molto simile al tuo esperimento.

Sei un nuovo arrivato?
Leggi il regolamento del forum e presentati qui

My photo portfolio (now on G+!)
Torna all'inizio della Pagina

Guy Fawkes
Nuovo Arrivato



5 Messaggi

Inserito il - 13 novembre 2009 : 15:47:30  Mostra Profilo  Visita l'Homepage di Guy Fawkes Invia a Guy Fawkes un Messaggio Privato  Rispondi Quotando
Eccomi. Scusate per il ritardo nelle risposte, ma nel frattempo sto facendo mille altre cose.
Innanzitutto, grazie per l'interessamento e gli interventi.

Provo a chiarire meglio l'esperimento.

@TMax

Sì, l'area di studio e i tre plot sono stati scelti in modo da ridurre quanto più possibile ogni fonte di "disturbo". Quindi si è scelto un bosco sufficientemente maturo e al suo interno è stata individuata una piccola area omogenea per una serie di caratteristiche che possono influire sulla distribuzione della entomofauna.

@chick80

Il plot è l'unità di base in pedologia e non è altro che un quadrato di un metro per lato. Può sembrare piuttosto piccola come area, ma tenete presente che gli insetti che vivono nel suolo arrivano a misurare, quando sono dei giganti, 2 mm, quindi in una carota di terreno se ne trovano in abbondanza.

Quindi, ricapitolando:

ogni plot viene "trattato" --> dopo 72h si effettua il primo campionamento e la conta degli insetti --> dopo 15 gg si ripete il trattamento --> dopo 72h si effettua un secondo campionamento e un'ulteriore conta di insetti.

Così per ogni stagione.
Se serve qualche altro dato o chiarimento, chiedete pure.

Ora do un'occhiata al cap. 14 e vediamo che si dice.

Grazie ancora!
Torna all'inizio della Pagina

michelear
Nuovo Arrivato



1 Messaggi

Inserito il - 15 gennaio 2010 : 21:21:20  Mostra Profilo  Visita l'Homepage di michelear Invia a michelear un Messaggio Privato  Rispondi Quotando
ciao, sto cercando un forum di discussione su minitab...voi ne masticate?
Torna all'inizio della Pagina
  Discussione  

Quanto è utile/interessante questa discussione:

 Nuova Discussione  Nuovo Sondaggio Nuovo Sondaggio
 Rispondi Aggiungi ai Preferiti Aggiungi ai Preferiti
Cerca nelle discussioni
Vai a:
MolecularLab.it © 2003-18 MolecularLab.it Torna all'inizio della Pagina