Abstrakt: | V bunkách živých organizmov sa nachádza DNA, ktorá je nosicom genetickej informácie. Ak máme DNA sekvencie súcasných druhov, zaujímavou úlohou je predikcia ancestrálnej DNA sekvencie. Za predpokladu, že v rámci evolúcie uvažujeme iba proces jednoduchých mutácií, t.j. substitúcií jedného znaku za iný, je rekonštrukcia ancestrálnych sekvencií pomerne jednoduchá. Situácia sa komplikuje, ak zacneme uvažovat zložitejšie operácie väcšieho rozsahu, duplikácie. V tejto práci zavedieme pravdepodobnostný model evolúcie duplikovaných úsekov DNA (génových zhlukov) a inferenciu vzorkovaním za pomoci MCMC algoritmu. Ukážeme algoritmus na výpocet vierohodnosti histórií, ale najmä predstavíme nový algoritmus pre navrhovanie jednotlivých duplikácií pomocou dynamického programovania a stochastického spätného prechodu. Predbežné výsledky ukazujú, že implementácia tohoto algoritmu umožnuje rýchle MCMC vzorkovanie a získanie kvalitných výsledkov pri aplikácii tejto metódy na reálne dáta.
|
---|