qualcuno saprebbe spiegarmi dettagliatamente il procedimento di clustering?
in particolare per quanto riguarda il clone-based edges: due 5'-EST e 3'EST non overlappanti vengono sempre incluse in uno stesso cluster se derivano da uno stesso clone di cDNA o vengono controllate a minore stringenza?
perché se si pensa che i geni umani siano meno di 25000 vi sono ben 120000 clusters UNIGENE? anche eliminando i cluster singletons vi sono cmq ca. 80000 clusters...questo è dovuto al problema legato allo splicing alternativo dei geni? o ci sono anche altre ragioni?