
Apariția rapidă și răspândirea globală a unui nou virus al sindromului respirator acut sever (SARS) în 2019 a împins laboratoarele de sănătate publică să dezvolte noi metode pentru eforturile de monitorizare genomică la o scară nemaivăzută până acum. Adăugând la această provocare, abordările utilizate în mod obișnuit în analiza datelor genomice se bazează adesea pe software și biblioteci open source de ultimă oră și adesea de nișă, care cresc complexitatea instalării conductelor sau fluxurilor de lucru analitice. Acest lucru, împreună cu un peisaj variat de medii de calcul, de la stații de lucru on-prem la Cloud public, au creat o barieră semnificativă pentru multe laboratoare care încearcă să efectueze monitorizarea genomică virală.
Dezvoltarea unei biblioteci de instrumente dockerizate
Laboratoarele de sănătate publică trebuie în mod inerent să îndeplinească standarde riguroase de control al calității și de asigurare a calității. Testele efectuate în laboratoarele de sănătate publică sunt fie raportate clinicilor pentru a fi utilizate pentru îngrijirea pacienților, fie utilizate în ansamblu pentru a informa intervențiile de sănătate publică sau investigațiile focarelor. Fluxurile de lucru analitice sunt menținute la aceleași standarde ca și alte teste dezvoltate de laborator și pentru a sprijini acest efort, consorțiul de bioinformatică de sănătate publică de stat (StaPH-B) a început să dezvolte un depozit de software dockerizat care a fost utilizat în mod obișnuit în analizele de date genomice de sănătate publică, StaPH- B/docker-builds. Acest depozit a fost conceput pentru a răspunde nevoii de software accesibil, care este atât de mare încredere. Combinat cu un ghid de utilizare, acest depozit a oferit o locație centralizată a instrumentelor open source întreținute și testate pentru a sprijini laboratoarele care dezvoltă fluxuri de lucru de analiză.
De la dezvoltarea sa inițială în 2018, depozitul StaPH-B/docker-builds a crescut pentru a conține versiuni multiple a peste 90 de instrumente analitice diferite de la 19 colaboratori diferiți, cu mai multe imagini specifice COVID-19 atingând peste 1 milion de extrageri. Între martie 2021 și ianuarie 2022, pe măsură ce mai multe laboratoare au început monitorizarea genomică, am observat o creștere logaritmică a numărului de extrageri de imagini Docker pe software-ul de analiză genomică de bază COVID-19.
Sprijinirea analizei genomice COVID-19
Conductele sau fluxurile de lucru bioinformatice constau dintr-o varietate de instrumente și adesea pornesc de la o formă de date brute sau primare de secvențiere ADN. Aceste instrumente efectuează o varietate de sarcini transformative sau rezumative și variază atât în ceea ce privește cerințele lor de calcul, cât și dependențele. Procesul de secvențiere a genomului viral SARS-CoV-2 implică secvențierea genomului viral și secvențierea porțiunilor mici de ADN în paralel. Rezultatul este un set de date care conține sute de mii până la milioane de șiruri scurte care conțin A, T, C și G într-o varietate de combinații de secvențe. Fluxurile de lucru COVID-19 preiau apoi aceste seturi de date, reconstruiesc genomul și folosesc o varietate de tehnici pentru a caracteriza apoi virusul.
Multe laboratoare de pe tot globul au trecut la utilizarea unui limbaj dedicat fluxului de lucru, cum ar fi WDL sau Nextflow, pentru fluxurile lor de lucru analitice. Combinarea unui limbaj de flux de lucru cu software dockerizat permite crearea și utilizarea de rutină a fluxurilor de lucru care sunt extrem de portabile și ușor de adaptat la o varietate de medii de calcul. Acest lucru oferă laboratoarelor capacitatea de a rula seturi de date mici pe un laptop sau de a scala la un cluster de calcul de înaltă performanță sau un mediu cloud pentru seturi de date mari. În plus, aceste abordări ale fluxului de lucru permit dezvoltarea unui cadru de analiză modular care permite schimbarea software-ului pe măsură ce sunt lansate noi versiuni sau sunt identificate probleme. Odată cu evoluția rapidă și constantă a virusului care provoacă COVID-19, actualizările software-ului de clasificare sunt, de asemenea, actualizate frecvent pentru a menține capacitatea de a identifica cu precizie variantele.
Fiți la curent cu evoluția virală
Virusul COVID-19 evoluează puțin mai lent decât gripa acumulând în medie două mutații pe lună și diferite variante (Alpha, Delta, Omicron etc.) sunt diferențiate prin diferite combinații de mutații. Clasificarea unui virus necesită construirea unui arbore filogenetic care modelează relația noului virus cu alți viruși. Cu toate acestea, construirea unui arbore pentru a compara fiecare virus nou cu fiecare virus anterior este atât costisitoare din punct de vedere computațional, cât și nepractic. Pentru a rezolva acest lucru, au apărut două metode frecvent utilizate, inclusiv utilizarea unui set de viruși de referință selectați pentru a construi un arbore (Nextclade) sau învățarea automată pentru a clasifica modelele mutaționale (Pangolin). Ambele abordări necesită actualizări regulate pentru a se asigura că clasificarea are loc cu acuratețe cu cele mai recente informații. Folosind containerizarea, StaPH-B a reușit să mențină imaginile cu cele mai recente modele, permițând utilizatorilor să ruleze fluxuri de lucru știind că folosesc cele mai actualizate, robuste și testate instrumente de clasificare.
Natura extrem de portabilă, scalabilă și eficientă a containerizării a transformat modul în care este efectuată monitorizarea bolilor de sănătate publică. Implementarea fluxurilor de lucru containerizate a permis laboratoarelor să adopte rapid fluxuri de lucru analitice complexe, ceea ce, la rândul său, a crescut amploarea efortului de monitorizare virală. Depozitul open source menținut de StaPH-B nu ar fi posibil fără comunitatea de bioinformaticieni care conduce inovația. Odată cu mai multe laboratoare care se îndreaptă către secvențiere și analiză complexă, există o cerere din ce în ce mai mare de oameni pentru a reduce decalajul dintre biologie și informatică.
![]()
Etiam magna arcu, ullamcorper ut pulvinar et, ornare sit amet ligula. Aliquam vitae bibendum lorem. Cras id dui lectus. Pellentesque nec felis tristique urna lacinia sollicitudin ac ac ex. Maecenas mattis faucibus condimentum. Curabitur imperdiet felis at est posuere bibendum. Sed quis nulla tellus.
63739 street lorem ipsum City, Country
+12 (0) 345 678 9
info@company.com
