Ta ksi¿¿ka przedstawia metod¿ obliczeniow¿ s¿u¿¿c¿ do wykrywania i eliminowania zb¿dnych konturów NGS generowanych ponownie przez asemblerów. Podej¿cie to wykorzystuje dwie techniki oparte na Hashingu, filtr Bloom Filter do eliminowania zduplikowanych kontinuum oraz haszysz lokalizacyjny (LSH) do usuwania podobnych kontinuum. Poniewä du¿a liczba contigs jest generowana przez ró¿ne firmy zajmuj¿ce si¿ montäem, podej¿cia te wymagaj¿ znacznych zasobów obliczeniowych i ludzkich. Redukcja redundancji u¿atwia dalsz¿ analiz¿ danych i skraca czas potrzebny do sfinalizowania i wyleczenia zespo¿ów genomowych. Hybrydowy montä zestawu danych GAGE-B (8 bakterii podzielonych na 12 sekwencyjnych zespo¿ów w Illumina HiSeq i MiSeq) zostä wykonany przy u¿yciu assemblera SPAdes (De Bruijn Graph) i assemblera Fermi (OLC). Ruroci¿g zostä zastosowany do powstäych konturów i wydajno¿ci w porównaniu z innymi podobnymi narz¿dziami, takimi jak HS-BLASTN, Simplifier i CD-HIT. Proponowana aplikacja mo¿e generowä uzupe¿niaj¿ce si¿ wyniki i pomaga po¿¿czy¿ te wyniki, czyni¿c zespó¿ bardziej precyzyjnym.