Dane z sekwencjonowania są przekazywane w formacie zarchiwizowanych plików FASTQ w formacie .gz . Jest to standardowy format plików powszechnie używany w bioinformatyce.
Taka forma umożliwia łatwiejsze pobieranie danych, zmniejsza ich rozmiar oraz ułatwia bezpieczne i efektywne przechowywanie. Po pobraniu pliki te można zdekompresować przy użyciu standardowych narzędzi dostępnych w systemach operacyjnych Linux, macOS oraz Windows.
Pliki wynikowe mogą obejmować m.in. surowe dane w formacie FASTQ, złożone wyniki analiz bioinformatycznych (np. pliki VCF, BAM) oraz raporty QC.
Standardowo dane przekazywane są w postaci odczytów surowych tzw. raw reads, ale na prośbę klienta możemy dostarczyć dane w postaci odczytów oczyszczonych tzw. clean reads.
Celem uzyskania clean reads, surowe odczyty poddawane są obróbce mającej na celu usunięcie odczytów o niskiej jakości oraz trymowaniu tzn. odcięciu z odczytów sekwencji adapterów wykorzystywanych do sekwencjonowania.
Informacje o sekwencjach adaptorów zastosowanych w projekcie znajdują się w Raportach udostępnionych wraz z wynikami.
