Abstrakt: | V genómoch sa pomerne často vyskytujú varianty toho istého génu,
ktoré je v rámci dlhej sekvencie DNA ťažké identifikovať. V práci
sa snažíme identifikovať varianty génov z dát sekvenovania novej
generácie. Problém najprv formalizujeme ako biologický problém, ktorý
následne pretransformujeme na informatický problém. Informatický problém
charakterizujeme pomocou teórie grafov. Zo spárovaných segmentov a
referenčnej sekvencie génu konštruujeme graf variantov. Tento graf redukujeme
pomocou kubického algoritmu na redukovaný graf variantov. Na týchto dvoch
grafoch riešime problém hľadania najmenšieho poctu ciest, ktoré popisujú
každú hranu. Na to používame celočíselný lineárny program. V závere práce
prezentujeme dosiahnuté výsledky na experimentálnych dátach pochádzajúcich
z kvasinky Magnusiomyces magnusi.
|
---|