Autore |
Discussione |
|
valia
Moderatore
Prov.: UK
1001 Messaggi |
Inserito il - 20 aprile 2006 : 17:06:02
|
Questo e' un frammento di un risultato di blast.. In prima riga la query, in seconda i residui conservati, e in terza la sequenza trovata dal programma!
Le domande sono: cosa vogliono dire gli asterischi? Perche' c'e' un pezzeto di sequenza scritta in grigetto e in minuscolo?
FDRTGSLRSSAMTNTLTSCWSLSMVL*wssaawapssTPRKVLPPSWAICRKICAT*PFM 183 ++RTGSLRSSAMTNTLTSCWSLSMVL*WSSAAWAPS TPRKVLPPSWAICRKIC T*PFM YNRTGSLRSSAMTNTLTSCWSLSMVL*WSSAAWAPSFTPRKVLPPSWAICRKICTT*PFM 659
Grazie infinite!
|
|
|
dallolio_gm
Moderatore
Prov.: Bo!
Città: Barcelona/Bologna
2445 Messaggi |
Inserito il - 20 aprile 2006 : 18:41:18
|
Ciao, Le regioni in minuscolo rappresentano sottosequenze a bassa complessità (molte ripetizioni) che possono dare problemi agli algoritmi di allineamento; per questo, in genere vengono segnalate in maniera diversa (masking) in modo che sia possibile scegliere se ignorarle o meno nel calcolo del punteggio. -> http://www.ncbi.nlm.nih.gov/blast/blast_FAQs.shtml#LCR
Gli * invece rappresentano segnali di arresto della trascrizione; vedi la tabella in: http://www.ncbi.nlm.nih.gov/blast/blastcgihelp.shtml#mask_characater |
Il mio blog di bioinformatics (inglese): BioinfoBlog Sono un po' lento a rispondere, posso tardare anche qualche giorno... ma abbiate fede! :-) |
|
|
valia
Moderatore
Prov.: UK
1001 Messaggi |
Inserito il - 20 aprile 2006 : 18:53:09
|
Grazie mille !!!
Ciao ciao
|
|
|
dallolio_gm
Moderatore
Prov.: Bo!
Città: Barcelona/Bologna
2445 Messaggi |
Inserito il - 20 aprile 2006 : 19:04:21
|
Di niente! Guarda c'è un errore di grammatica nell'interfaccia a blast di ncbi: c'è scritto characater invece che character quando clicchi su 'Mask' da qui: http://www.ncbi.nlm.nih.gov/blast/Blast.cgi
(urgh devo trovare qualche altra cosa da distrarmi!! ) |
Il mio blog di bioinformatics (inglese): BioinfoBlog Sono un po' lento a rispondere, posso tardare anche qualche giorno... ma abbiate fede! :-) |
|
|
Fil23
Utente Junior
Prov.: estero
Città: London
238 Messaggi |
Inserito il - 21 aprile 2006 : 11:14:19
|
Scusate ma c'è qualcosa che nn mi torna: come fanno ad esserci sottosequenze a bassa complessità e segnali di arresto della trascrizione in mezzo a una sequenza proteica??? Non è che hai usato il blast sbagliato? Se usi come query una proteina devi usare BLASTp...no? |
|
|
valia
Moderatore
Prov.: UK
1001 Messaggi |
Inserito il - 22 aprile 2006 : 14:20:05
|
Io ho usato translated query contro translated database (tblastx). Quindi la mia sequenza e' nucleotidica.. ma il programma mi rimanda una sequenza proteica!!! |
|
|
dallolio_gm
Moderatore
Prov.: Bo!
Città: Barcelona/Bologna
2445 Messaggi |
Inserito il - 23 aprile 2006 : 15:22:26
|
Beh dipende tutto da quello che devi trovare! Il prog. ti ritorna una query proteica perchè tu glielo hai chiesto (Translated Query). Cosa devi cercare esattamente? |
Il mio blog di bioinformatics (inglese): BioinfoBlog Sono un po' lento a rispondere, posso tardare anche qualche giorno... ma abbiate fede! :-) |
|
|
valia
Moderatore
Prov.: UK
1001 Messaggi |
Inserito il - 23 aprile 2006 : 16:23:10
|
E' esattamente quello che voglio! Sto cercando di clonare un gene in organismi nei quali non e' ancora stato identificato! Cosi' clono e faccio un tblastx delle sequenze! E' molto piu' facile trovare similarita' a livello proteico che nucleotidico!!!
Ciao ciao |
|
|
dallolio_gm
Moderatore
Prov.: Bo!
Città: Barcelona/Bologna
2445 Messaggi |
Inserito il - 23 aprile 2006 : 23:43:50
|
Citazione: E' molto piu' facile trovare similarita' a livello proteico che nucleotidico!!!
Questo può essere vero ma così triplichi anche l'errore nel tuo allineamento, ossia se c'è una imprecisione su una base della tua sequenza questo si ripercuote sui tre aa dei tre schemi di lettura possibili. Inoltre Blast è un programma di allineamento euristico, e non ha una buona sensibilità: c'è sempre una imprecisione nelle sottosequenze più corte di 7 aa, e il fatto che la tua seq. abbia delle regioni poco complesse non aiuta. Poi, non ho capito, con quale database lo stai lanciando? Se conosci già la seq. di questo gene che vuoi clonare, la cosa corretta da fare sarebbe quello di creare un profilo (una PSSM) tramite PSI-BLAST, e poi usare la matrice che ti viene fuori per confrontarlo con le seq. che trovi. |
Il mio blog di bioinformatics (inglese): BioinfoBlog Sono un po' lento a rispondere, posso tardare anche qualche giorno... ma abbiate fede! :-) |
|
|
valia
Moderatore
Prov.: UK
1001 Messaggi |
Inserito il - 24 aprile 2006 : 16:46:31
|
No, io voglio identificare geni noti in drosophila, in organismi diversi! Quindi clono il gene che IN TEORIA e' quello che mi interessa (in realta' il 90% delle volte non e'..), faccio sequenziare e per vedere che cosa ho clonato, faccio un tblastx! Se il gene e' quello giusto il programma dovrebbe restituirmi lo stesso gene in altri organismi! La sequenza che voglio trovare ovviamente non c'e' ancora nei database!
|
|
|
dallolio_gm
Moderatore
Prov.: Bo!
Città: Barcelona/Bologna
2445 Messaggi |
Inserito il - 24 aprile 2006 : 18:51:04
|
uhm, lo puoi fare così però vedi è un po' dispendioso! Per vedere se quello che hai clonato è corretto lo confronti con milioni di sequenze che non hanno alcuna probabilità di avere a che fare con il tuo gene, e sul sito dell'NCBI ti chiedono di non usare tblastx contro genomi interi! http://www.ncbi.nlm.nih.gov/blast/producttable.shtml#tblastx Se puoi cerca di sistemarti una copia di blast da far girare in locale, oppure, dovresti ricavarti una PSSM o un pattern degli omologhi del tuo gene nelle altre specie tramite un programma di allineamento multiplo (puoi usare proprio PSI-Blast o PHI-Blast per un pattern) e poi confrontare le tue seq. con quello. Ottieni anche risultati migliori perchè così sai anche quanto la tua query è sbagliata e se il problema riguarda regioni poco complesse.
Citazione: La sequenza che voglio trovare ovviamente non c'e' ancora nei database!
Però Drosophila è stata sequenziata e fra un po' andrà anche su VEGA, il sist. di annotazione più accurato: http://www.ensembl.org/Drosophila_melanogaster/index.html
p.s. prova anche BLAT che per certe cose è un po' meglio: http://genome.ucsc.edu/cgi-bin/hgBlat?command=start |
Il mio blog di bioinformatics (inglese): BioinfoBlog Sono un po' lento a rispondere, posso tardare anche qualche giorno... ma abbiate fede! :-) |
|
|
|
Discussione |
|