Siirry sisältöön

Northeasternin tutkijat mallintavat zikaviruksen leviämistä Google Cloud avulla

Northeasternin yliopiston biologisten ja sosioteknisten järjestelmien mallinnuslaboratorio (MoBS) tarvitsi nopean keinon zikaviruksen mallintamiseen. GCE:n ja alisteisten virtuaalikoneiden ansiosta MoBS on suorittanut yli 10 miljoonaa simulaatiota ja lyhentänyt tietojen analysointiin vaadittavaa aikaa merkittävästi.

Hyttysten levittämän zikaviruksen nopea leviäminen Amerikoissa vuonna 2015 johti matkustuskieltoihin, karanteeneihin ja vetoomuksiin peruuttaa Brasiliassa vuonna 2016 pidettävät olympialaiset. Maailman terveysjärjestö WHO julisti kansainvälisen kansanterveydellisen hätätilan, ja ongelmasta kärsivien valtioiden hallitukset alkoivat etsiä keinoa ennustaa uusien tartuntojen leviämisnopeus ja sijainti. Zikaviruksen leviämisen ennustaminen on erityisen haastavaa, koska vain 20 prosenttia tartunnan saaneista saa oireita.

Tammikuussa 2016 Northeastern Universityn biologisten ja sosioteknisten järjestelmien mallinnuslaboratoriossa (MoBS) aloitettiin Center for Inference and Dynamics of Infectious Diseases ‑keskuksen tuella zikan mallinnusprojekti, joka auttaa viranomaisia ja tutkijoita ymmärtämään, miten virus kehittyy ja leviää.

"Pyrimme auttamaan tutkijoita ja terveysviranomaisia big datan ja suuren laskentatehon avulla."

Matteo Chinazzi, Apulaistutkija, Northeasternin yliopisto

Google Cloud: oleelliset ennakointi- ja analysointityökalut

Tiimi käytti Google Cloudia hyödyntävää matemaattista ja laskennallista menetelmää tutkiessaan zikaviruksen erilaisia leviämismalleja, joilla ennakoitiin viruksen vaikutusta sille altistuvaan väestöön. Malli perustuu zikaviruksen leviämiseen Brasiliassa, missä epidemia alkoi vuonna 2015. Tutkijat pystyvät nyt ennustamaan uusien epidemioiden vaikutuksia muualla lisäämällä malliin uusia tietokerroksia, kuten lämpötilan, hyttysten määrän, väestön koon ja ihmisten matkustustottumukset.

Google Cloud:n avulla tiimi voi suorittaa useita simulaatioita samanaikaisesti ja analysoida mallinnuksista saatuja tietoja, joita voi olla monta teratavua. "Käytämme useita Google Cloud-tuotteita", sanoo Matteo Chinazzi, Northeastern Universityn avustava tutkija. "Google Cloud Storagea käytetään mallinnusten tietojen tallentamiseen ja verkkosivun isännöintiin. Sairauden leviämisen simulaatio suoritetaan Google Compute Enginellä (GCE) ja alisteisilla virtuaalikoneilla. Google BigQuerylla voidaan tutkia simuloituja tilanteita, joihin sisältyy päivämäärien ja tartuntamäärien tapaisia muuttujia. Tähän mennessä käsiteltyjen tietojen määrä on yhteensä useita satoja teratavuja, ja ne on kaikki tallennettu Google Cloud Storageen."

Nopea reagointikyky suuren mittakaavan tuloksilla

MoBS:ssä on suoritettu yli 10 miljoonaa simulaatiota GCE:n ja alisteisten virtuaalikoneiden avulla. GCE ja BigQuery ovat lyhentäneet merkittävästi simulaatioiden suorittamisen ja tietojen analysoinnin vaatimaa aikaa – ne vievät nyt joitain tunteja viikkojen sijasta. "Joustava järjestelmä voidaan skaalata tarvittaessa useaan tuhanteen rinnakkaiseen instanssiin", hän sanoo, "joten voimme analysoida yhdessä päivässä kokonaisen epidemiamallin, joka voi koostua jopa 250 000 itsenäisestä simulaatiosta."

Sen lisäksi, että malli antaa tutkijoille tietoa zikaviruksen leviämisestä, sitä saatetaan myöhemmin käyttää esimerkiksi denguekuumeen tai muiden epidemioiden analysointiin. Maailman terveysjärjestön julistama kansainvälinen hätätila on sittemmin peruttu zikan osalta, mutta hyttysten levittämien sairauksien ehkäiseminen vaatii edelleen työtä. MoBS-yksikön tiimi pyrkii auttamaan tutkijoita ja terveysviranomaisia kyseisellä alalla big datan ja rajoittamattoman laskentatehon avulla.

"Nopeus on kaikki kaikessa epidemiatapauksissa", Chinazzi sanoo, "ja Google Cloud mahdollistaa nopean reagointikyvyn suuren mittakaavan tuloksilla."

Saat lisätietoja MoBS-laboratorion zika-tutkimuksesta ja ‑analyysistä tutustumalla Spread of Zika virus in the Americas ‑artikkeliin Proceedings of the National Academy of Sciences of the United States of America ‑julkaisussa.

"Joustava järjestelmä voidaan skaalata tarvittaessa useaan tuhanteen rinnakkaiseen instanssiin, joten voimme analysoida yhdessä päivässä kokonaisen epidemiamallin, joka voi koostua jopa 250 000 itsenäisestä simulaatiosta."

Matteo Chinazzi, Apulaistutkija, Northeasternin yliopisto

Tilaa uutisia, vinkkejä ja materiaaleja suoraan sähköpostiisi.