Przejdź do treści

Fiński instytut badawczy przechodzi na Google Cloud, aby doprowadzić do przełomu w medycynie spersonalizowanej

Fiński Instytut Medycyny Molekularnej (FIMM) tworzy bezpieczną platformę, która pozwoli na szeroką współpracę przy integrowaniu danych genomicznych z klinicznymi rejestrami medycznymi.

Fiński Instytut Medycyny Molekularnej (FIMM) na Uniwersytecie w Helsinkach powstał z myślą o ambitnej misji – zrozumieniu przyczyn występowania chorób, poprawie diagnostyki i opracowaniu nowych terapii związanych z istniejącymi problemami zdrowotnymi. W 2017 r. Instytut rozpoczął nowy program o nazwie FinnGen, który rozwija cele medycyny spersonalizowanej. W jego ramach badacze łączą dane genomiczne i medyczne 500 tysięcy obywateli Finlandii, czyli jednej dziesiątej populacji kraju. Medycyna spersonalizowana wykorzystuje duże ilości populacyjnych danych biomedycznych, aby umożliwić odpowiednio dobrane diagnostykę i leczenie konkretnych pacjentów. W FinnGen współpracuje ze sobą 9 międzynarodowych firm farmaceutycznych i instytucji publicznych. Jest to największy w historii biomedyczny projekt badawczy.

W projekcie badany jest unikalny fiński profil genetyczny. „W Finlandii mamy ograniczoną liczbę wariacji genetycznych. Mamy też bardzo dobre referencyjne bazy danych genomicznych. Łącząc informacje na temat genotypów i dane zdrowotne, możemy lepiej zrozumieć mechanizmy powstawania chorób i w efekcie doprowadzić do przełomów w medycynie” – wyjaśnia Mari Kaunisto, dyrektorka ds. komunikacji i genetyczka w FinnGen. Badacze analizują deidentyfikowane próbki z całego kraju zebrane przez biobanki biorące udział w projekcie, a genotypy są tworzone przy użyciu mikromacierzy. Dane te są następnie porównywane z kompleksowymi cyfrowymi danymi medycznymi pochodzącymi z wielu rejestrów zdrowotnych, które zawierają informacje zbierane przez całe życie każdej osoby. Gromadzenie i łączenie danych biologicznych i klinicznych zostało zaprojektowane tak, aby chronić prywatność uczestników. Każda osoba musi najpierw wyrazić zgodę na użycie swoich danych. Wykorzystuje się do tego zakodowane rejestry oraz szczegółowe mechanizmy kontroli dostępu i uprawnień.

„Łącząc kompleksowe dane o genomie fińskiej populacji założycielskiej z danymi pochodzącymi z krajowego rejestru zdrowia, możemy doprowadzić do wielu odkryć genetycznych. Dzięki nim lepiej zrozumiemy mechanizmy powstawania chorób i na długo przysłużymy się systemom opieki zdrowotnej na całym świecie”.

Mari Kaunisto, Dyrektorka ds. komunikacji i starsza badaczka, FinnGen

Wyzwania dotyczące skalowania i ochrony danych genomicznych

W projekcie przetworzono już 100 tys. indywidualnych rejestrów, co przekłada się na 3 TB nieprzetworzonych danych. Co 6 miesięcy dodawane są dane kolejnych 50 tys. uczestników. Do zrealizowania projektu FinnGen potrzebna była infrastruktura technologiczna, którą można skalować do poziomu mniej więcej 1,5 PB danych genomicznych w okresie następnych 3 lat. Ze względu na wymagania dawców, instytucji i Unii Europejskiej nieodzowne były też silne mechanizmy ochrony bezpieczeństwa i prywatności. Dlatego też Jarmo Harju, kierownik ds. IT i zarządzania danymi, wybrał wraz ze swoim zespołem Google Cloud . Opierając się na usługach Google Compute Engine i Cloud Storage oraz integrując je z innymi narzędziami Google – takimi jak DataProc, AppEngine, zarządzanie tożsamościami i dostępem, BigQuery i CloudSQL – zespół zaprojektował jednolitą infrastrukturę do skalowania danych, nie zapominając przy tym o bezpieczeństwie i prywatności.

W projekcie FinnGen wykorzystywane są dwie oddzielne struktury – fabryka danych (Data Factory), która importuje i przetwarza dane genomiczne oraz prywatne dane zdrowotne, a także biblioteka danych (Data Library) przechowująca dane. Informacje z fabryki danych mają własne identyfikatory FinnGen i są dostępne tylko dla operatorów wewnętrznych. Biblioteka danych zawiera zakodowane informacje, które są udostępniane badaczom w regularnych odstępach. „Musimy przyznać badaczom dostęp do danych potrzebnych im do analiz, a jednocześnie zadbać o to, żeby nie były one kopiowane ani pobierane. To prawdziwe wyzwanie” – zauważa Jarmo Harju. „Dlatego właśnie utworzyliśmy piaskownicę, za pomocą której dajemy naszym partnerom specjalny dostęp do danych”. Muszą oni użyć konta usługi na maszynie wirtualnej w odizolowanej sieci bez zewnętrznych adresów IP. Jest to dodatkowa warstwa między badaczem a danymi, która zapewnia bezpieczeństwo i ochronę prywatności. Biblioteka danych została już przeniesiona na platformę Google Cloud, a niebawem to samo stanie się z fabryką danych. „Wkrótce wszystkie dane będziemy przechowywać w Google Cloud i tam też będziemy realizować wszystkie obliczenia. Pozwoli to nam zwiększyć bezpieczeństwo i użyteczność z punktu widzenia użytkowników. Dane osobowe są przechowywane na terenie Unii Europejskiej, ale mamy nadzieję, że w przyszłości wszystkie znajdą się w Finlandii” – mówi Harju.

„Już wkrótce wszystkie dane będziemy przechowywać w Google Cloud i tam też będziemy realizować wszystkie obliczenia. Pozwoli to nam zwiększyć bezpieczeństwo i użyteczność z punktu widzenia użytkowników”.

Jarmo Harju, Kierownik ds. IT i zarządzania danymi, FinnGen

Możliwe przełomy w medycynie

Nowe zbiory danych będą udostępniane międzynarodowemu zespołowi badaczy FinnGen co 6 miesięcy. Usprawni to współpracę i umożliwi potencjalne odkrycia. „Mamy nadzieję, że w projekcie FinnGen uda się nam odkryć nowe mechanizmy biologiczne lub molekularne, które odpowiadają za wiele chorób” – mówi Mari Kaunisto. „Pomoże to stawiać dokładniejsze diagnozy i opracowywać lepsze plany leczenia, a nawet wymyślać sposoby na zapobieganie chorobom. Załóżmy na przykład, że pacjent dowie się o występującym u niego podwyższonym ryzyku zachorowania na chorobę sercowo-naczyniową. Czy uda się nam pomóc tej osobie w zmianie stylu życia i obniżeniu tego ryzyka?”. Firmy farmaceutyczne uczestniczące w programie FinnGen chcą wykorzystać te badania, aby zdecydować, które molekuły wybrać do przyszłych badań. Wykorzystanie badań genetycznych do wyboru celu działania leku może pozwolić na prowadzenie bardziej efektywnych badań klinicznych, a to z kolei zwiększy szanse na opracowanie skutecznych i bezpiecznych leków. W programie uczestniczy 500 tys. osób, co wiąże się z ogromną odpowiedzialnością. „Zaufanie uczestników jest dla nas bardzo ważne. Zapewniając im już dziś bezpieczeństwo danych i ochronę prywatności, możemy przygotować się na czerpanie długotrwałych korzyści z tych badań” – mówi Kaunisto.

Zarejestruj się tutaj, aby otrzymywać najnowsze informacje, statystyki, materiały i inne zasoby.