Ciao a tutti! vi scrivo per sottoporvi un problema con la speranza che possiate essermi di aiuto.. Vi spiego di cosa si tratta. Devo implementare un sistema che dato un file in formato fasta contenente sequenze di DNA, lo controlla e verifica se ci sono sequenze MOLTO simili fra loro. Se si, ne considera buona solo una e le altre le scarta e come risultato finale mi restituisce un file con le sequenze buone. non so se sono stata chiara.... ho implementato un sistema che fa il match di tutte le sequenze contro tutte, il problema è che il match è esatto, nel senso che controlla che tutte le basi siano identiche mentre a me serve un pò di tolleranza... ciò che dovrei ottenere è una sequenza consensus ( correggetemi se sbaglio ) rispetto a quelle simili... Ho provato ad usare clustalw ma senza successo anche perchè richiede che le sequenze siano tutte della stessa lunghezza e invece nel mio caso ovviamente sono di lunghezza diversa... A qualcuno è successo di imbattersi in un problema simile? Spero di averlo spiegato il meglio possibile! Grazie a tutti!!
Ciao domi84! Mi scuso per il ritardo con il quale rispondo :) Allora il programma si lo devo scrivere io, ho controllato i link che mi hai mandato ma purtroppo non sono quello che serve a me :( Credo che il termine esatto sia sequenza consensus non logos. In pratica dato un insieme di sequenze dovrei verificare se ce ne sono di uguali ( o mooolto simili ) e unirle in un'unica sequenza che dovrebbe essere il risultato dei vari match...non so se mi sono spiegata...spero di si...
Ciao a tutti, condivido la soluzione che ho trovato al mio problema Ho trovato un tool di blast che si chiama blastclust che fa esattamente quello che volevo, ossia dato un file in input con una serie di sequenze fasta, restituisce un file con gli id delle sequenze simili raggruppati. A questo punto posso richiamare questa routine e fare un semplice parse del file di out e ottengo il mio risultato spero che possa tornare utile a qualcuno! Ciao a tutti e grazie per il supporto!