Quanto č utile/interessante questa discussione:
Autore |
Discussione |
|
kORdA
Utente Attivo
Prov.: Milano
Cittā: Monza
1303 Messaggi |
Inserito il - 09 dicembre 2008 : 09:45:56
|
Per il mio progetto dovrei screenare tutte le 3'-UTR genomiche umane per fare predizione di target di miRNA. A parte il problema della ridondanza dei trascritti (per cui mi sto gia' attrezzando), vorrei sapere cosa inserire nel mio dataset...
mi spiego...
Al momento mi sono scaricato un multifasta pantagruelico contenente tutte le UTR. Mi domando se c'e' da fidarsi a prendere in considerazione pure i geni mappati sui cromosomi random (http://genome.ucsc.edu/FAQ/FAQdownloads#download10) o attenersi solo ai geni mappati sui cromosomi "normali" (che a quanto capito dovrebbero rappresentare gli aplotipi piu' comuni)
|
http://www.linkedin.com/in/dariocorrada |
|
|
dallolio_gm
Moderatore
Prov.: Bo!
Cittā: Barcelona/Bologna
2445 Messaggi |
Inserito il - 09 dicembre 2008 : 16:29:22
|
Creati un dataset di test, del quale tu abbia gia' qualche informazione su target di miRNA. Lavora con quello e con uno di controllo, delle stesse dimensioni. Quando il tuo metodo da' risultati soddisfacenti, provalo sui due set (con e senza sequenze draft), e vedi quale ti convince di piu'.
Citazione: Mi domando se c'e' da fidarsi a prendere in considerazione pure i geni mappati sui cromosomi random (http://genome.ucsc.edu/FAQ/FAQdownloads#download10)
Penso di no. Perche' UCSC? Hai annotato la versione dei dataset? (scusa, e' una domanda di rito)
Citazione: o attenersi solo ai geni mappati sui cromosomi "normali" (che a quanto capito dovrebbero rappresentare gli aplotipi piu' comuni)
Non penso che i cromosomi normali corrispondano agli aplotipi piu' comuni. Credo che siano quelli mappati nelle sequenze di Craig Venter e di Watson, e del genoma sequenziato nel 2001. |
Il mio blog di bioinformatics (inglese): BioinfoBlog Sono un po' lento a rispondere, posso tardare anche qualche giorno... ma abbiate fede! :-) |
|
|
kORdA
Utente Attivo
Prov.: Milano
Cittā: Monza
1303 Messaggi |
Inserito il - 10 dicembre 2008 : 10:40:33
|
Citazione: Perche' UCSC?
Perche' su EnsEMBL mancano parecchi trascritti sulla release 50 (anche se adesso mi sembra sia uscita la 51 e dovrei controllare) ed e' piu' di un mese che l'helpdesk ha taggato la mia segnalazione e non mi ha risposto... Ho smesso di seguire i ragionamenti contorti delle PerlAPI, comunque su UCSC ci sono tabelle di crosslink in grado di restituirti gli ID di EnsEMBL e di RefSeq per ogni USCSKnownGene (se ce ne sono ovviamente), e qui dovrebbe entrare in gioco un primo filtro di ridondanza credo
Citazione: Hai annotato la versione dei dataset?
In che senso? Ho scaricato i miei FASTA (e una decina di tabelle di annotazioni di mio interesse) riferiti all'assembly hg18 (NCBI Build 36.1)
Citazione: Non penso che i cromosomi normali corrispondano agli aplotipi piu' comuni. Credo che siano quelli mappati nelle sequenze di Craig Venter e di Watson, e del genoma sequenziato nel 2001.
Hai ragione, era una mia supposizione, ma l'assembly risale a Marzo 2006, spero abbiano fatto degli aggiornamenti dal 2001 |
http://www.linkedin.com/in/dariocorrada |
|
|
|
Discussione |
|
|
|
Quanto č utile/interessante questa discussione:
MolecularLab.it |
© 2003-18 MolecularLab.it |
|
|
|