Profesor MIT mencabar had perkomputeran dengan kluster terbesar yang pernah dibina dalam awan awam

Menggunakan Google Compute Engine untuk mengurus Pangkalan Data Fungsi L dan Bentuk Modular (LMFDB), ahli teori nombor pengiraan dan Saintis Penyelidikan Utama, Andrew V. Sutherland dari MIT, memecahkan rekod pengiraan berprestasi tinggi beliau sendiri dengan mencapai 580,000 teras.

Jika anda memasuki kelas falsafah matematik, anda mungkin akan terdengar perbualan tentang "objek". Objek pada dasarnya ialah apa-apa sahaja yang boleh anda gunakan untuk membuat matematik, seperti nombor atau fungsi atau hasil pengiraan matematik, seperti lengkung. Pangkalan Data Fungsi L dan Bentuk Modular (LMFDB) merupakan atlas objek terperinci dan sambungan antara objek tersebut. LMFDB ialah usaha sama antara penyelidik antarabangsa dan dibimbing oleh pasukan antarabangsa yang berpangkalan di beberapa universiti di Eropah dan Amerika Utara, termasuk MIT.

Pandangan keseluruhan anda terhadap penyelidikan berubah apabila anda boleh bertanya soalan dan mendapat jawapan dalam masa beberapa jam dan bukan beberapa bulan.

Andrew V. Sutherland, Ahli Teori Nombor Pengiraan dan Saintis Penyelidikan Utama, MIT

Berkongsi data dengan semua penyelidik

LMFDB memajukan sains dengan menjadikannya lebih mudah bagi penyelidik untuk berkongsi data tentang objek dengan komuniti fizik, sains komputer dan matematik di seluruh dunia. Sesetengah pengiraan untuk menghasilkan objek ini adalah sangat rumit sehingga hanya beberapa orang di Bumi mengetahui cara untuk melaksanakan pengiraan ini. Pengiraan lain adalah sangat besar sehingga perlu dijalankan hanya sekali kerana pelaksanaan pengiraan ini mengambil masa yang sangat lama dan memerlukan kos yang sangat tinggi.

Pasukan yang menjalankan LMFDB memerlukan perkhidmatan awan yang boleh mengendalikan keperluan storan mereka yang semakin meningkat. Untuk melihat dari segi perspektif, hampir 1,000 tahun masa pengiraan diperlukan untuk menghasilkan objek dalam LMFDB. Selain masalah besar berkaitan storan, terdapat juga masalah tentang skala. LMFDB tersedia kepada sesiapa sahaja di lmfdb.org, bermakna projek perlu diskalakan untuk menyokong carian yang tidak terkira jumlahnya, yang dilaksanakan setiap hari. Akhirnya, oleh sebab LMFDB ialah projek usaha sama, pasukan tersebut memerlukan sistem yang mudah dikendalikan oleh pengguna di negara yang berlainan.

Memfokuskan pada penyelidikan bukan prasarana

Pasukan LMFDB meneliti beberapa penyelesaian awan dan memilih Google Cloud Platform (GCP) kerana prestasi tinggi, keupayaan untuk diskala secara automatik, kemudahan penggunaan dan keandalan penyelesaian ini.

Salah seorang penyelidik utama yang terlibat dalam LMFDB dan dalam proses membuat keputusan ialah Andrew V. Sutherland, seorang profesor matematik, ahli teori nombor pengkomputeran dan saintis penyelidik utama di MIT.

"Kami merupakan ahli matematik yang ingin memberi tumpuan pada penyelidikan kami dan tidak perlu risau tentang masalah kegagalan perkakasan atau isu skala dengan tapak web," ujar Sutherland.

Sutherland dan pasukan LMFDB memilih untuk menggunakan Google Compute Engine (GCE) dan Google Persistent Disk untuk mengehoskan pelayan web dan mencerminkan pangkalan data MongoDB untuk menyimpan setengah terabait data dalam talian dan tiga terabait data yang kurang kerap diakses. Penetapan ini membolehkan LMFDB mengikut skala seperti yang diperlukan dan menyampaikan keputusan pengiraan serta objek matematik dengan cepat apabila penyelidik memerlukan maklumat tersebut. LMFDB turut menggunakan pelbagai alatan GCP yang membolehkan penyelidik di beberapa tempat berasingan di dunia untuk mengurus pangkalan data tersebut secara usaha sama dengan lebih mudah. Alatan ini merangkumi Google Stackdriver, Google Cloud Console dan Google Cloud Load Balancing.

Sutherland mempunyai penjadualan sangat rumit yang perlu dilaksanakan dan disimpan di LMFDB. Penjadualan ini begitu besar sehingga memerlukan kuasa pengkomputeran di luar had yang pernah dilakukan sebelum ini di awan awam. Untuk berbuat demikian, beliau memilih GCE dan menjalankan 580,000 teras dengan VM boleh ganti — kluster komputer berprestasi tinggi terbesar yang diketahui, yang pernah dijalankan di awan awam.

Pengiraan tersebut menghasilkan 70,000 lengkung yang berlainan, setiap satu dengan masukan LMFDB masing-masing. Pencarian hanya satu daripada lengkung tersebut merupakan tugas yang sangat rumit, yang memerlukan bilangan kitaran pengkomputeran yang tinggi. "Proses ini seperti mencari jarum dalam jerami lima belas dimensi," kata Sutherland.

Sebelum beralih kepada GCE untuk melakukan pengiraan, Sutherland telah menjalankan tugas menggunakan komputer 64 teras milik beliau, yang mengambil masa terlalu lama. Satu-satunya alternatif beliau adalah untuk memperoleh masa pengiraan pada kluster MIT, yang mungkin sukar untuk diperoleh dan mengehadkan konfigurasi perisian yang boleh beliau gunakan. Dengan GCE, beliau boleh menggunakan bilangan teras mengikut keperluan beliau, memasang sistem pengendalian, pustaka dan aplikasi yang tepat, yang diperlukan dan mengemas kini persekitaran pada bila-bila masa yang beliau mahukan.

Ciri GCP boleh skala yang diberikan kepada LMFDB membolehkan semua orang daripada pelajar hingga para penyelidik yang berpengalaman mencari dan menavigasi kandungan LMFDB dengan mudah melalui antara muka web. Sebagai contoh, Sutherland mengajar kelas tentang lengkung elips dan pelajar menggunakan LMFDB untuk menyelesaikan kerja rumah mereka.

Menjimatkan wang semasa melakukan pengiraan yang besar

Memandangkan kekangan belanjawan yang dihadapi oleh ramai penyelidik dan institusi pendidikan, GCP membolehken mereka melaksanakan pengiraan besar pada kos yang berpatutan. VM boleh ganti GCE yang Sutherland gunakan membolehkan beliau mengurangkan kos yang besar semasa melaksanakan pengiraan yang sangat rumit. Tika berciri penuh ini mencapai pengurangan kos sehingga 80 peratus berbanding tika biasa yang setara kerana tika tersebut boleh diganggu oleh GCE. Gangguan pengiraan tidak menyebabkan kesan prestasi yang besar — secara purata, hanya dua hingga tiga peratus daripada tika beliau diganggu dalam setiap jam pengiraan dan skrip akan memulakan semula pengiraan secara automatik sehingga keseluruhan tugas beliau selesai. Oleh itu hanya sedikit masa akan hilang. Dengan membenarkan gangguan kecil ini, beliau boleh menjalankan pengiraan besar pada kos yang rendah dan hampir tidak mengalami sebarang kelengahan.

Kami melakukan pemetaan matematik abad ke-21

Andrew V. Sutherland, Ahli Teori Nombor Pengiraan dan Saintis Penyelidikan Utama, MIT

Terima kasih kerana mendaftar!

Beritahu kami lagi tentang minat anda.