dallolio_gm
Moderatore
  

Prov.: Bo!
Città: Barcelona/Bologna
2445 Messaggi |
Inserito il - 16 settembre 2007 : 13:03:01
|
Citazione: Messaggio inserito da pluto GenBank contiene coppie di basi (60 miliardi circa) e sequenze nucleotidiche (60 milioni circa). Quindi è sbagliato dire che le sequenze proteiche conosciute sono 60 milioni?
Sì, è sbagliato. Genbank contiene tutti i tipi di sequenze nucleotidiche conosciute: quindi anche ESTs, trascritti, primers, sequenze non codificanti, contig di genomi, microRNA, etc.. Molte di queste sequenze non corrispondono a proteine.
Citazione: Da Swiss-Prot leggo che contiene 4 milioni di sequenze annotate non ridondanti. Cosa si intende per non ridondanti?
Per esempio, una proteina può essere sequenziata e pubblicata indipendentemente da più di un gruppo di ricercatori. Oppure quando si sequenzia un genoma, si producono un sacco di sequenze provvisorie prime di arrivare alla sequenza completa, come per esempio i vari contig.
|
Il mio blog di bioinformatics (inglese): BioinfoBlog Sono un po' lento a rispondere, posso tardare anche qualche giorno... ma abbiate fede! :-) |
 |
|