Autore |
Discussione |
|
Stefy84
Nuovo Arrivato
64 Messaggi |
Inserito il - 30 marzo 2009 : 18:22:48
|
Vorrei sapere cosa sono i valori di supporto bootstrap nell'analisi filogenetica. Io ho capito che sono valori che si usano per determinare la correttezza di un albero filogenetico. E' giusto? inoltre vorrei sapere quale valore devono assumere perchè si possa considerare esatto un albero. grazie.. Stefania
|
|
|
dallolio_gm
Moderatore
Prov.: Bo!
Città: Barcelona/Bologna
2445 Messaggi |
Inserito il - 31 marzo 2009 : 10:52:17
|
Sí, serve per calcolare la correttezza di un albero filogenetico, e per la precisione della correttezza di una particolare ramificazione tra due taxa (o rami di un albero filogenetico).
L'idea di base é di simulare l'effetto che possono avere dei piccoli errori nei dati di input. Per esempio, per vedere se l'albero filogenetico creato sarebbe lo stesso nel caso che ci fosse un errore di sequenziamento nel 5% delle basi delle sequenze analizzate.
La procedura di base é di 'ricampionare' i dati di input, mischiando l'ordine di alcune colonne e introducendo duplicazioni/delezioni. E' spiegato bene nei disegni che trovi qui: - http://akira.ruc.dk/~olesk/Sekvens/bootstr.htm
Alla fine della procedura di bootstrapping otterrai dei valori relativi ad ogni ramo che ti indicano quanto quella determinata ramificazione é probabile.
Non ti so dire quali siano i valori di riferimento, ma credo che si possa prendere il 95%, a seconda dei dati a tua disposizione e da quello che vuoi dimostrare.
Esistono altre procedure per calcolare alberi filogenetici, come i metodi bayesiani, che non necessitano di bootstrapping. |
Il mio blog di bioinformatics (inglese): BioinfoBlog Sono un po' lento a rispondere, posso tardare anche qualche giorno... ma abbiate fede! :-) |
|
|
Stefy84
Nuovo Arrivato
64 Messaggi |
Inserito il - 31 marzo 2009 : 11:19:13
|
Grazie.. utilissimo.. avrei anche un'altra domanda.. in un articolo che sto leggendo in una didascalia di una figura parla di valori K riferiti alle popolazioni nell'analisi baeysiana. Riporto la didascalia così si capisce meglio.. "Title: Bayesian population structure analysis Description: Bayesian assignment of the 48 field-collected individuals to populations assuming a population number of K=2 to K=6. Individuals are arrayed along the xaxis. The y-axis denotes the cumulative posterior probability of an individual’s placement in particular population(s). Numbers in parentheses for each K indicate the number of identical solutions at a 95% threshold. Individuals are divided into populations by thin black lines. Populations are labeled at the bottom with numbers in parentheses corresponding to the sampling locality as marked in Fig. 1. (A) Results based on nuclear loci. (B) Results based on all loci. The solutions for each K, from K=2 to K=6, are consistent in that at each K + 1 the assignment of individuals to the clusters remains stable with just one cluster being split into two. There is only one exception to this pattern. The individual from Bekaraoka switches clusters from K=2 to K=3." Non riesco a capire cosa siano questi valori K. Grazie |
|
|
dallolio_gm
Moderatore
Prov.: Bo!
Città: Barcelona/Bologna
2445 Messaggi |
Inserito il - 31 marzo 2009 : 14:41:43
|
Probabilmente si riferisce al software Structure o ad uno simile.
Tu hai un insieme di individui, e vuoi sapere se é plausibile dividerli in un certo numero di popolazioni, secondo caratteristiche particolari.
Per esempio, é stato dimostrato che se due popolazioni di una stessa specie vengono separate da barriere fisiche, a lungo andare la frequenza degli heterozigoti nelle due linee tende a diminuire, e la maggior parte degli individui diviene omozigote (effetto Wahlund).
Programmi come Structure utilizzano questa osservazione se un insieme di individui puo' essere suddiviso in un certo numero di popolazioni. Mettiamo che tu abbia un set di 10 individui, e che tu voglia sapere se si possono distinguere in 2 popolazioni: il programma calcola tutte le possibili combinazioni di due gruppi (5 e 5 alla volta, ma anche 4 e 6, 3 e 7, etc) e per ogni combinazione esegue delle statistiche che indicano la probabilitá di trovarsi di fronte a due popolazioni separate.
Nell'esperimento che hai postato, gli autori hanno provato a far girare il programma per vedere se i 48 individui potevano essere raggruppati come 2 popolazioni, o 3-4-5-6. In genere questa é la maniera standard di utilizzare "Structure", se provi a utilizzare il programma vedrai che é praticamente l'unico parametro che richiede. |
Il mio blog di bioinformatics (inglese): BioinfoBlog Sono un po' lento a rispondere, posso tardare anche qualche giorno... ma abbiate fede! :-) |
|
|
Stefy84
Nuovo Arrivato
64 Messaggi |
Inserito il - 31 marzo 2009 : 17:32:40
|
ok.. grazie.. questo adesso l'ho capito.. l'articolo in effetti si riferiva a Structure.. non ho capito una cosa però.. cosa intende quando parla di "number of identical solutions at a 95% threshold". Anche più avanti nell'articoo mi parla di "identical solutions" ma non riesco a capire cosa siano..
|
|
|
TMax
Utente Junior
Prov.: BG
Città: Capriate
270 Messaggi |
Inserito il - 01 aprile 2009 : 12:13:00
|
per generalizzare il discorso le tecniche di bootstrap sono tecniche di ricampionamento che hanno l'obiettivo di stimare gli errori standard di qualsiasi stima statistica (medie, dev.stand. coefficienti di regress) quando non è disponibile una soluzione analitica. Hanno preso un certo 'piede' in inferenza statistica con l'avvento di processori più potenti perchè si tratta di procedure che richiedono un uso intenso del pc!
Ciao ciao TMax |
|
|
Bio-du
Nuovo Arrivato
11 Messaggi |
Inserito il - 07 settembre 2012 : 14:01:19
|
Vorrei una delucidazione riguardo questa discussione. In pratica il valore di bootstrap indica la percentuale di probabilità di trovare le stesse due sequenze che formano il nodo dell’albero? grazie mille :) |
|
|
|
Discussione |
|