Ho provato ad utilizzare il PRIMARY_IDENTIFIER del campo DR (Database cross-Reference) relativo a proteine del DB SwissProt per cercare le corrispettive sequenze nucleotidiche sul database EMBL nel file rel_ann_env_01_r94.dat.gz senza successo. Ho preso l'identificativo sbagliato o ho il Database sbagliato?
Ho scaricato il database EMBL qua: ftp://ftp.ebi.ac.uk/pub/databases/embl/release/ Sto cercando in particolare proteine mitocondriali. Ad esempi (ID e GN di swiss prot): 3BHS1_HUMAN Name=HSD3B1 3BHS2_HUMAN Name=HSD3B2 3HIDH_HUMAN Name=HIBADH