Forum

Nome Utente:
Password:
Riconoscimi automaticamente
 Tutti i Forum
 MolecularLab
 Bioinformatica
 Aiuto biostatistico cercasi!
 Nuova Discussione  Nuovo Sondaggio Nuovo Sondaggio
 Rispondi Aggiungi ai Preferiti Aggiungi ai Preferiti
Cerca nelle discussioni
I seguenti utenti stanno leggendo questo Forum Qui c'è:

Tag   biostatistica  Aggiungi Tag

Quanto è utile/interessante questa discussione:

Autore Discussione  

Giupeppe87
Nuovo Arrivato



3 Messaggi

Inserito il - 11 aprile 2013 : 17:28:48  Mostra Profilo  Visita l'Homepage di Giupeppe87 Invia a Giupeppe87 un Messaggio Privato  Rispondi Quotando
Ciao a tutti!

Sono um medico e sto cercando di analizzare i risultati raccolti per uno studio clinico. Essendo le mie conoscenze biostatistiche molto poco approfondite, invoco il vostro gentile aiuto!

Ecco il caso in questione:
Ho due batterie di dati numerici continui riguardanti due valori di laboratorio: X ed Y.
Da un grafico a dispersione risulta chiaro che i due valori sono correlati e che all'aumentare dell'uno aumenta anche l'altro e/o viceversa.

Come trovo la significatività statistica (p value) dell'associazione in questo caso?

Premetto che, data la mole dei dati, ho il valore sia di X che Y per la maggior parte dei pazi, ma non per tutti.

Amore cosmico e riconoscenza a chi mi vorrà aiutare!


Grazie mille!
Affetto cosmico a chi mi risponderà!

Caffey
Utente Attivo

ZEBOV

Città: Perugia


1496 Messaggi

Inserito il - 11 aprile 2013 : 17:59:53  Mostra Profilo  Visita l'Homepage di Caffey Invia a Caffey un Messaggio Privato  Rispondi Quotando
Ciao!
Premetto che anche io di statistica non so molto, ma provo a darti qualche piccola informazione.
Diciamo che detto così non è molto facile poterti rispondere... Ad ogni modo a occhio direi che il modo migliore che conosco per affrontare questa analisi è un modello di regressione lineare semplice (se la distribuzione dei parametri è lineare, si intende, altrimenti è meglio uno modello non lineare ma in questo campo lascerei proprio il tutto nelle mani di uno statistico perché le cose si fanno complesse).

Per quanto riguarda il p-value so che deriva da un t-test fatto sul coefficiente di regressione ma non mi ricordo minimamente come si fa...

Nell'attesa che qualcuno con più competenza di risponda, spero di averti dato un po' di materiale su cui approfondire un po'!
Ciao!

[...] Hunc igitur terrorem animi tenebrasque necessest
non radii solis neque lucida tela diei
discutiant, sed naturae species ratioque. [...]

Titus Lucretius Carus
Torna all'inizio della Pagina

kORdA
Utente Attivo

newkORdA

Prov.: Milano
Città: Monza


1303 Messaggi

Inserito il - 11 aprile 2013 : 18:41:38  Mostra Profilo  Visita l'Homepage di kORdA  Clicca per vedere l'indirizzo MSN di kORdA Invia a kORdA un Messaggio Privato  Rispondi Quotando
Prima di buttarti a pesce, calcola banalmente un Pearson tanto per cominciare. Tutti i fogli di calcolo hanno una funzione del genere...

Sul web inoltre puoi trovare molti tool online che ti calcolano il p-value a una o due code una volta stabiliti R^2 e numerosità campionaria.

Ovvio che poi il lavoro è solo all'inizio visto che l'esistenza di correlazione non ci dice nulla sull'esistenza di una causalità (a meno che non pubblichi il tuo lavoro su Repubblica, allora lì si vale l'ecceziona alla regola).

http://www.linkedin.com/in/dariocorrada
Torna all'inizio della Pagina

Glubus
Utente Junior

pinolo



156 Messaggi

Inserito il - 12 aprile 2013 : 08:39:58  Mostra Profilo  Visita l'Homepage di Glubus Invia a Glubus un Messaggio Privato  Rispondi Quotando
Per il confronto fra due metodiche di laboratorio c'è qualcosa di meglio del coefficiente di correlazione, che quasi sempre verrà "significativo", ma il cui significato pratico è legato alla assunzione di linearità ( e se la relazione non è lineare, se oltre a crescere assieme le due variabili mostrano aumento della variabilità all'aumentare del livello, ..., ?)
Io comincerei con una esplorazione grafica tipo il grafico di Tukey "mean to level" (conosciuto anche come grafico di Bland-Altman).
Google for Bland & Altman per farti una idea.
Certo che molto dipende da quale è esattamente l'argomento di cui stiamo parlando, se ce lo buoi specificare meglio.

Glubus

Citazione:
Messaggio inserito da Giupeppe87

Ciao a tutti!

Sono um medico e sto cercando di analizzare i risultati raccolti per uno studio clinico. Essendo le mie conoscenze biostatistiche molto poco approfondite, invoco il vostro gentile aiuto!

Ecco il caso in questione:
Ho due batterie di dati numerici continui riguardanti due valori di laboratorio: X ed Y.
Da un grafico a dispersione risulta chiaro che i due valori sono correlati e che all'aumentare dell'uno aumenta anche l'altro e/o viceversa.

Come trovo la significatività statistica (p value) dell'associazione in questo caso?

Premetto che, data la mole dei dati, ho il valore sia di X che Y per la maggior parte dei pazi, ma non per tutti.

Amore cosmico e riconoscenza a chi mi vorrà aiutare!


Grazie mille!
Affetto cosmico a chi mi risponderà!

Torna all'inizio della Pagina

Giupeppe87
Nuovo Arrivato



3 Messaggi

Inserito il - 12 aprile 2013 : 22:07:16  Mostra Profilo  Visita l'Homepage di Giupeppe87 Invia a Giupeppe87 un Messaggio Privato  Rispondi Quotando
Per cominciare grazie a tutti per il prezioso aiuto!

Questo è quanto ho fatto sotto vostro consiglio:

dopo aver eliminato tutti i pazienti dei quali conoscevo solo una delle due variabili di cui mi interessa indagare la presenza di una correlazione, la mia numerosità campionaria si è ridotta a 187 pazienti, per ciascuno dei quali ho un valore di X ed uno di Y.
Ho calcolato il Pearson, ottenendo un valore di 0,270144524.
Ho poi costruito uno Scatter graph e la Trendline ha equazione y = 0,0821x + 2,8165.
R² = 0,073.

Bene! adesso da dove ricavo un valore di significatività? Calcolo il p-value a partire da R² e gradi di libertà? Me ne vergogno, ma ve lo chiedo... i gradi di libertà coinciderebbero con la mia numerosità campionaria?

Per approfondire l'argomento, come chiestomi:
Sto studiando la correlazione tra la funzione endoteliale (misurata ecograficamente come la capacità dell'arteria brachiale a costringersi a seguito della somministrazione di uno stimolo) e la concentrazione nel sangue di un ormone. Entrambi hanno una distribuzione Gaussiana.
Torna all'inizio della Pagina

Glubus
Utente Junior

pinolo



156 Messaggi

Inserito il - 13 aprile 2013 : 10:30:25  Mostra Profilo  Visita l'Homepage di Glubus Invia a Glubus un Messaggio Privato  Rispondi Quotando
Sembra che la relazione LINEARE fra le due variabili sia molto debole.
Considera che la varizione di y è "spiegata" dalla variazione di x per il 7% circa secondo il tuo modello.
Considera però che il tuo modello potrebbe non essere il grado di sopredere una relazione non-lineare (ammesso che siano rispettati gli assunti della regressione lineare: indipendenza delle osservazioni, omoschedasticità e normalità approssimata dei residui).
Facci vedere il grafico che ci facciamo una idea, ...

Stefano

Citazione:
Messaggio inserito da Giupeppe87

Per cominciare grazie a tutti per il prezioso aiuto!

Questo è quanto ho fatto sotto vostro consiglio:

dopo aver eliminato tutti i pazienti dei quali conoscevo solo una delle due variabili di cui mi interessa indagare la presenza di una correlazione, la mia numerosità campionaria si è ridotta a 187 pazienti, per ciascuno dei quali ho un valore di X ed uno di Y.
Ho calcolato il Pearson, ottenendo un valore di 0,270144524.
Ho poi costruito uno Scatter graph e la Trendline ha equazione y = 0,0821x + 2,8165.
R² = 0,073.

Bene! adesso da dove ricavo un valore di significatività? Calcolo il p-value a partire da R² e gradi di libertà? Me ne vergogno, ma ve lo chiedo... i gradi di libertà coinciderebbero con la mia numerosità campionaria?

Per approfondire l'argomento, come chiestomi:
Sto studiando la correlazione tra la funzione endoteliale (misurata ecograficamente come la capacità dell'arteria brachiale a costringersi a seguito della somministrazione di uno stimolo) e la concentrazione nel sangue di un ormone. Entrambi hanno una distribuzione Gaussiana.

Torna all'inizio della Pagina

Giupeppe87
Nuovo Arrivato



3 Messaggi

Inserito il - 13 aprile 2013 : 15:36:48  Mostra Profilo  Visita l'Homepage di Giupeppe87 Invia a Giupeppe87 un Messaggio Privato  Rispondi Quotando
L'ipotesi di una correlazione non lineare in questo caso mi sembra molto poco plausibile...
Questo è il mio Scatter graph... un po' bruttino...

Immagine:

36,07 KB
Torna all'inizio della Pagina

chick80
Moderatore

DNA

Città: Edinburgh


11491 Messaggi

Inserito il - 13 aprile 2013 : 18:53:57  Mostra Profilo  Visita l'Homepage di chick80 Invia a chick80 un Messaggio Privato  Rispondi Quotando
Beh, così a occhio i dati non sembrano correlati linearmente (volendo puoi estrarre un p-value utilizzando un qualsiasi software di statistica, non so se Excel lo faccia, se inserisci un file con i valori possiamo provare a fare un'analisi).

Quindi l'idea è che, chiamando i tuoi valori X e Y, il modello:

Y = a * X + b

non rappresenta bene i tuoi dati

Dovresti allora considerare l'ipotesi che X e Y siano correlati non linearmente o che ci sia uno (o più) altri componenti da considerare

Es:

Y = a * X + b * Z + c * W^2

Se non hai altri valori presi dagli stessi pazienti rimane solo da dire che X e Y non sono linearmente correlati (ma ciò non implica che Y non dipenda in qualche modo da X).

Sei un nuovo arrivato?
Leggi il regolamento del forum e presentati qui

My photo portfolio (now on G+!)
Torna all'inizio della Pagina

kORdA
Utente Attivo

newkORdA

Prov.: Milano
Città: Monza


1303 Messaggi

Inserito il - 13 aprile 2013 : 19:37:11  Mostra Profilo  Visita l'Homepage di kORdA  Clicca per vedere l'indirizzo MSN di kORdA Invia a kORdA un Messaggio Privato  Rispondi Quotando
qui un calcolatore online per il p-value:

http://www.danielsoper.com/statcalc3/calc.aspx?id=44

http://www.linkedin.com/in/dariocorrada
Torna all'inizio della Pagina

TMax
Utente Junior

TMax

Prov.: BG
Città: Capriate


270 Messaggi

Inserito il - 15 aprile 2013 : 08:16:32  Mostra Profilo  Visita l'Homepage di TMax Invia a TMax un Messaggio Privato  Rispondi Quotando
non è chiaro perchè, ci sia tutta questa necessità di calcolare il p value'

mah?

Torna all'inizio della Pagina

kORdA
Utente Attivo

newkORdA

Prov.: Milano
Città: Monza


1303 Messaggi

Inserito il - 15 aprile 2013 : 10:52:30  Mostra Profilo  Visita l'Homepage di kORdA  Clicca per vedere l'indirizzo MSN di kORdA Invia a kORdA un Messaggio Privato  Rispondi Quotando
Citazione:
Messaggio inserito da TMax

non è chiaro perchè, ci sia tutta questa necessità di calcolare il p value'



perchè fa figo

Ad ogni modo un Pearson di 0.27 non mi sembra per nulla una correlazione lineare. Ma qui mi sbaglio...

Spesso su riviste che trattano articoli di clinica leggo un r di 0.3-0.4 sono associabili ad una buona correlazione, mentre sui paper di chimica computazionale un 0.6 è debole e non viene per nulla considerato a meno di suffragarci un'ipotesi mooolto solida.

Che l'interpretazione di r dipenda dalla disciplina scientifica in cui viene applicata?

http://www.linkedin.com/in/dariocorrada
Torna all'inizio della Pagina

TMax
Utente Junior

TMax

Prov.: BG
Città: Capriate


270 Messaggi

Inserito il - 15 aprile 2013 : 11:19:50  Mostra Profilo  Visita l'Homepage di TMax Invia a TMax un Messaggio Privato  Rispondi Quotando
Citazione:
Messaggio inserito da kORdA
perchè fa figo






la cosa preoccupante è che con tutte quelle osservazioni può anche essere che il p risulti 'significativo' ....quindi anche con forti evidenze di assenza di associazione si dirà che l'associazione tra le due variabili è significativa...
Secondo me non dipende dalle discipline ma dal fatto che danno maggior peso al p e non alla misura reale di associazione...
in questo caso lo studio dovrebbe finire subito con un R^2 di quel valore non si va da nessuna parte.
Torna all'inizio della Pagina

kORdA
Utente Attivo

newkORdA

Prov.: Milano
Città: Monza


1303 Messaggi

Inserito il - 15 aprile 2013 : 13:08:27  Mostra Profilo  Visita l'Homepage di kORdA  Clicca per vedere l'indirizzo MSN di kORdA Invia a kORdA un Messaggio Privato  Rispondi Quotando
il succo del discorso è che con un r di 0.2 se hai un p significativo vuol dire che il tuo r è significativamente pessimo per una correlazione lineare semplice :-D. Ho capito male, forse?

http://www.linkedin.com/in/dariocorrada
Torna all'inizio della Pagina

TMax
Utente Junior

TMax

Prov.: BG
Città: Capriate


270 Messaggi

Inserito il - 16 aprile 2013 : 10:32:10  Mostra Profilo  Visita l'Homepage di TMax Invia a TMax un Messaggio Privato  Rispondi Quotando
eh... non lo sapremo mai..
probabilmente il p è venuto <0.05....
il sacro graal è stato trovato e la pubblicazione è un sogno che sta per diventare realtà!!!

Torna all'inizio della Pagina

norty89
Nuovo Arrivato

TAQ

Prov.: Reggio Calabria
Città: Reggio Calabria


25 Messaggi

Inserito il - 18 aprile 2013 : 20:43:22  Mostra Profilo  Visita l'Homepage di norty89  Clicca per vedere l'indirizzo MSN di norty89 Invia a norty89 un Messaggio Privato  Rispondi Quotando
Potresti provare a testare l'esistenza di outliers che potrebbe influire sui risultati della tua correlazione. Senza impelagarti in software complessi e procedure macchinose puoi utilizzare questo servizio online http://www.graphpad.com/quickcalcs/Grubbs1.cfm . Inoltre vorrei chiederti: i dati hanno una distribuzione normale? C'è relazione di dipendenza tra le due variabili, cioè un cambiamento in x porterà direttamente a un cambiamento in y (es. dose-risposta)?

... e, mentre questo pianeta ha continuato a roteare seguendo le immutabili leggi di gravità, da un inizio così semplice infinite forme, sempre più belle e meravigliose, si sono evolute e tuttora si evolvono.
Charles Darwin
Torna all'inizio della Pagina

chick80
Moderatore

DNA

Città: Edinburgh


11491 Messaggi

Inserito il - 18 aprile 2013 : 23:19:27  Mostra Profilo  Visita l'Homepage di chick80 Invia a chick80 un Messaggio Privato  Rispondi Quotando
@norty89: bisogna fare estremamente attenzione a eliminare degli outliers, non è decisamente una procedura che utilizzerei in questo caso (soprattutto visto il grafico dei dati).
Esistono altre procedure più robuste per la validazione di un modello lineare ma sinceramente ribadisco, in questo specifico caso credo che semplicemente non ci sia correlazione.

Sei un nuovo arrivato?
Leggi il regolamento del forum e presentati qui

My photo portfolio (now on G+!)
Torna all'inizio della Pagina

TMax
Utente Junior

TMax

Prov.: BG
Città: Capriate


270 Messaggi

Inserito il - 19 aprile 2013 : 08:45:58  Mostra Profilo  Visita l'Homepage di TMax Invia a TMax un Messaggio Privato  Rispondi Quotando
saggio Chick80,
ma soprattutto quello che non si deve fare è piegare i dati ai propri desideri....

Max
Torna all'inizio della Pagina
  Discussione  

Quanto è utile/interessante questa discussione:

 Nuova Discussione  Nuovo Sondaggio Nuovo Sondaggio
 Rispondi Aggiungi ai Preferiti Aggiungi ai Preferiti
Cerca nelle discussioni
Vai a:
MolecularLab.it © 2003-18 MolecularLab.it Torna all'inizio della Pagina