Jump to content

'n MIT-professor span rekenaarvermoëns tot die uiterste in vir die grootste kluster wat nog ooit in die publieke wolk gebou is

Met gebruik van Google Compute Engine om die L-Funksies en Modulêre Vorms-databasis (LMFDB) te bestuur, het die berekeningsyferteoretikus en hoofnavorsingwetenskaplike, Andrew V. Sutherland van MIT, 580 000 kerne bereik en sy eie hoëverwerkingrekenaarrekord gebreek.

As jy in 'n wiskundefilosofieklas instap, sal jy moontlik hoor dat daar gepraat word oor "voorwerpe". Voorwerpe is in wese enigiets waarop jy wiskunde kan uitvoer, soos getalle of funksies, of die resultaat van 'n wiskundige berekening soos 'n kromme. Die L-Funksies en Modulêre Vorms-databasis (LMFDB) is 'n gedetailleerde atlas van voorwerpe en die verbindings tussen hulle. LMFDB is 'n samewerking tussen internasionale navorsers en word gelei deur 'n internasionale span wat gebaseer is by universiteite in Europa en Noord-Amerika, insluitend MIT.

Jou hele uitkyk op navorsing verander wanneer jy 'n vraag kan stel en 'n antwoord in ure eerder as maande kan kry.

Andrew V. Sutherland, Computational number theorist and Principal Research Scientist, MIT

Data word tussen navorsers gedeel

LMFDB bevorder wetenskap deur dit vir navorsers baie makliker te maak om data oor voorwerpe met die fisika-, rekenaarwetenskap- en wiskundegemeenskappe regoor die wêreld te deel. Sommige van die berekeninge om die voorwerpe te skep, is so kompleks dat slegs 'n paar mense op die aardbol weet hoe om hulle te verrig. Ander berekeninge is so groot dat dit beter is om hulle net een keer te laat loop weens die tydrowendheid en koste om dit uit te voer.

Die LMFDB-span het 'n wolkdiens benodig wat hul groeiende bergingbehoefte kon hanteer. Om dinge in perspektief te stel: dit het byna 1 000 jaar se rekenaartyd geneem om die voorwerpe in LMFDB te skep. Buiten die massiewe probleem van berging, was daar die kwessie van skaal. LMFDB is beskikbaar aan enigiemand by lmfdb.org, wat beteken dat die projek moet kan skaleer om die ontelbare hoeveelheid soektogte wat daagliks uitgevoer word, te kan hanteer. En laastens, omdat LMFDB 'n samewerkingprojek is, het die span 'n stelsel nodig gehad wat mense maklik uit verskillende lande kon administreer.

Fokus op navorsing, nie infrastruktuur nie

Die LMFDB-span het na verskeie wolkoplossings gekyk en Google Wolkplatform gekies as gevolg van die hoë werkverrigting, die vermoë om outomaties te skaal, gebruikervriendelikheid en betroubaarheid.

Een van die primêre navorsers betrokke by LMFDB en die besluitnemingsproses was Andrew V. Sutherland, 'n wiskundeprofessor, berekeningsyferteoretikus en hoofnavorsingwetenskaplike by MIT.

"Ons is wiskundiges wat op ons navorsing wil fokus, en ons nie wil bekommer oor hardewareprobleme of skaleerkwessies met die webwerf nie," sê Sutherland.

Sutherland en die res van die LMFDB-span het besluit om Google Compute Engine (GCE) en Google Persistent Disk te gebruik om die webbedieners te huisves, en het MongoDB-databasisse gespieël om 'n halwe teragreep aanlyn data, en drie teragrepe data waarby minder gereeld ingegaan word, te stoor. Met hierdie opstelling kan LMFDB skaleer soos nodig en berekeningresultate en wiskundige voorwerpe vinnig lewer wanneer navorsers dit versoek. LMFDB gebruik ook 'n verskeidenheid van Google Wolkplatform-nutsgoed wat dit vir navorsers van oor die hele wêreld makliker maak om saam te werk en die databasis saam te bestuur. Hierdie nutsgoed sluit Google Stackdriver, Google Cloud Console en Google Cloud Load Balancing in.

Sutherland het 'n besonder komplekse tabulasie gehad wat hy moes uitvoer en stoor in LMFDB. Dit was so massief dat dit meer berekeningkrag sou benodig as wat ooit voorheen in die openbare wolk gebruik is. Hy het Google Wolkplatform gekies en 580 000 kerne met voorspringbare VM'e laat loop – die grootste bekende hoëverwerkingrekenaarkluster wat nog ooit in die publieke wolk geloop het.

Die berekening het gelei tot 70 000 verskillende krommes, elk met sy eie LMFDB-inskrywing. Om net een van die krommes te vind is 'n uiters komplekse taak wat 'n groot aantal berekeningsiklusse vereis. "Dit is soos om 'n naald in 'n vyftiendimensionele hooimied te soek," sê Sutherland.

Sutherland het eers take op sy eie 64-kern-rekenaar laat loop, wat veels te lank geneem het, voordat hy Google Wolkplatform begin gebruik het vir die berekening. Sy enigste alternatief was om rekenaarwerktyd op MIT se klusters te kry, wat moeilik sou wees om te verkry en wat die sagtewareopstellings wat hy kon gebruik, beperk het. Met Google Wolkplatform kan hy soveel kerne soos hy nodig het gebruik, die spesifieke bedryfstelsel, biblioteke en programme wat hy benodig, installeer, en die omgewing opdateer net wanneer hy wil.

Te danke aan die skaalbaarheid wat Google Wolkplatform aan LMFDB gee, kan almal, van studente tot ervare navorsers, met gemak die inhoud via 'n webkoppelvlak deursoek en navigeer. Sutherland bied byvoorbeeld 'n kursus aan oor elliptiese krommes, en studente gebruik LMFDB vir hul huiswerk.

Massiewe berekeninge teen 'n laer koste

Baie navorsers en opvoedkundige instellings het beperkte begrotings, maar met Google Wolkplatform is dit vir hulle moontlik om massiewe berekeninge te doen teen 'n redelike koste. Met Google Wolkplatform se voorspringbare VM'e wat Sutherland gebruik, kan hy die koste drasties verminder en nog steeds geweldige komplekse berekeninge uitvoer. Hierdie ten volle funksionele gevalle kos tot 80 persent minder as hul gewone ekwivalente, want hulle kan deur Google Wolkplatform onderbreek word. Die onderbreking van berekeninge veroorsaak nie 'n groot werkverrigtingprobleem nie – gewoonlik word net 2 tot 3 persent van sy gevalle per uur van berekeninge onderbreek, en 'n skrip herbegin hulle outomaties totdat die volle taak uitgevoer is, dus word min tyd verloor. Deur hierdie kleiner onderbrekings toe te laat, kan hy reuseberekeninge uitvoer teen 'n lae koste en feitlik geen vertraging nie.

Ons karteer die wiskunde van die 21ste eeu

Andrew V. Sutherland, Computational number theorist and Principal Research Scientist, MIT

Sluit hier aan vir opdaterings, insigte, hulpbronne en meer.