dallolio_gm
Moderatore
Prov.: Bo!
Città: Barcelona/Bologna
2445 Messaggi |
Inserito il - 11 novembre 2006 : 13:37:36
|
Ciao, sono due cose un po' diverse: - pfam è un database di domini proteici rappresentati tramite hmm (un modello statistico che permette di rappresentare con buona precisione delezioni e inserzioni). Questi motivi sono già annotati: tu ne scegli uno e vedi se la tua sequenza lo contiene. - Meme invece è un tool per determinare possibili motivi a partire da un allineamento multiplo di sequenze. Tu hai tante sequenze, e vuoi sapere se tra di queste vi sono dei motivi che si ripetono: allora puoi usare Meme, che ti ritorna una rappresentazione a matrici di posizione (PSSM) dei possibili motivi individuati; poi puoi usare il tool Mast che trovi sullo stesso sito (http://meme.sdsc.edu/meme), per cercare questi stessi motivi in un database. Considera però che si tratta di un tool un po' vecchiotto (circa 10 anni), e questo si fa sentire: per esempio, le rappresentazioni a PSSM hanno lo svantaggio di non poter rappresentare le delezioni/inserzioni, e l'algoritmo di clusterizzazione non supervisionata utilizzato richiede di conoscere a priori il numero di motivi contenuti nell'allineamento (anche se questo non è necessariamente un difetto). |
Il mio blog di bioinformatics (inglese): BioinfoBlog Sono un po' lento a rispondere, posso tardare anche qualche giorno... ma abbiate fede! :-) |
|
|