1. Utangulizi
PUNCH4NFDI (Chembe, Ulimwengu, Nyuklia na Hadroni kwa Miundombinu ya Kitaifa ya Data ya Utafiti) ni ushirikiano mkubwa wa Ujerumani unaofadhiliwa na DFG (Deutsche Forschungsgemeinschaft). Unawakilisha takriban wanasayansi 9,000 kutoka jamii za fizikia ya chembe, nyota, chembe za nyota, hadroni, na nyuklia. Lengo kuu la ushirikiano huu ni kuanzisha jukwaa la data ya kisayansi la shirikishi, linalozingatia kanuni za FAIR (Inapatikana, Inafikiwa, Inaweza Kuingiliana, Inatumika Tena). Mchango huu unaelezea kwa kina dhana za usanifu—Compute4PUNCH na Storage4PUNCH—zilizoundwa ili kuunganisha ufikiaji wa rasilima mbalimbali sana za hesabu (HPC, HTC, Wingu) na hifadhi zinazotolewa na taasisi wanachama kote Ujerumani.
2. Miundombinu ya Shirikishi ya Hesabu ya Aina Mbalimbali – Compute4PUNCH
Dhana ya Compute4PUNCH inalenga changamoto ya kutoa ufikiaji wa laini kwenye mkusanyiko wa rasilimali mbalimbali za hesabu zilizopo bila kuwalazimisha watoa rasilimali kubadilisha mifumo yao ya uendeshaji.
2.1. Usanifu Mkuu na Teknolojia
Shirikisho hili limejengwa juu ya mfumo wa kundi wa HTCondor uliojengewa juu ya mifumo mingine. Ubunifu mkuu ni matumizi ya mpangaji rasilimali wa juu COBalD/TARDIS. TARDIS hufanya kazi kama wakala anayebadilika, akitafsiri maombi ya rasilimali ya kiwango cha juu kutoka kwenye kundi la HTCondor na kuyageuza kuwa vitendo halisi vya utoaji katika mifumo ya nyuma (k.m., kuzindua mashine za virtual kwenye OpenStack, kuwasilisha kazi kwenye Slurm). Hii huunda safu ya ujumuishaji unaobadilika na unaoonekana wazi. Miundombinu ya Uthibitishaji na Uidhinishaji (AAI) inayotumia token hutoa ufikiaji wa kiwango.
2.2. Ufikiaji na Kiolesura cha Mtumiaji
Watumiaji wanajihusisha na mfumo wa shirikishi hasa kupitia njia mbili za kuingilia:
- Nodi za Kuingia za Kawaida: Hutoa ufikiaji wa shell kwenye mazingira ya umoja.
- JupyterHub: Hutoa mazingira ya hesabu ya mtandaoni na ya kuingiliana, ikipunguza kwa kiasi kikubwa kikwazo cha kuanzia kwa uchambuzi wa data.
2.3. Usimamizi wa Mazingira ya Programu
Ili kushughulikia mahitaji mbalimbali ya programu kati ya jamii mbalimbali, mradi huu unatumia:
- Teknolojia za Kontena (k.m., Docker, Singularity/Apptainer): Kwa ajili ya kufunga mazingira ya programu.
- Mfumo wa Faili wa Mashine ya Virtual ya CERN (CVMFS): Mfumo wa faili usiosomeka tu, unaosambazwa ulimwenguni kote kwa ajili ya kutoa mkusanyiko wa programu na data ya majaribio kwa njia inayoweza kuongezeka. Hii hutenganisha usambazaji wa programu na miundombinu ya msingi.
3. Miundombinu ya Shirikishi ya Hifadhi – Storage4PUNCH
Storage4PUNCH inalenga kuunganisha mifumo ya hifadhi ya jamii, hasa inayotegemea teknolojia za dCache na XRootD, ambazo zimeimarika katika Fizikia ya Nishati ya Juu (HEP).
3.1. Mkakati wa Shirikisho la Hifadhi
Mkakati sio kuunda mfumo mmoja mkubwa wa hifadhi, bali kuunganisha yale yaliyopo. Lengo ni kutoa safu ya jina la umoja na itifaki ya ufikiaji inayoficha utofauti wa hifadhi ya msingi. Hii inaruhusu data kubaki mahali pake wakati inaruhusu ufikiaji wa kimataifa.
3.2. Mkusanyiko wa Teknolojia na Ujumuishaji
Shirikisho hili linatumia:
- dCache: Inatumiwa kama mfumo wa nyuma wa hifadhi na pia kwa uwezo wake wa shirikisho.
- XRootD: Inatumiwa kwa ajili ya itifaki zake bora za ufikiaji wa data na uwezo wa kuelekeza upya, muhimu kwa ajili ya kujenga shirikisho la data.
- Tathmini ya Teknolojia za Kihifadhi na Metadata: Mradi unatathmini kwa bidii teknolojia kama Rucio (kwa usimamizi wa data) na safu za kihifadhi ili kuboresha mifumo ya ufikiaji wa data na kuwezesha kuwekewa data kwa njia ya akili zaidi, kuelekea kwenye ujumuishaji wa kina zaidi kuliko shirikisho rahisi.
4. Maelezo ya Kiufundi na Mfumo wa Kihisabati
Mantiki kuu ya upangaji katika COBalD/TARDIS inaweza kuonyeshwa kama tatizo la uboreshaji. Acha $R = \{r_1, r_2, ..., r_n\}$ iwe seti ya maombi ya rasilimali kutoka kwenye kundi la HTCondor, na $B = \{b_1, b_2, ..., b_m\}$ iwe seti ya aina za rasilimali za nyuma zinazopatikana (k.m., nodi ya HPC, VM ya Wingu). Kila ombi $r_i$ lina mahitaji (cores, kumbukumbu, programu). Kila mfumo wa nyuma $b_j$ una kazi ya gharama $C_j(r_i)$ na muda wa utoaji $T_j(r_i)$.
Lengo la mpangaji rasilimali wa juu ni kupata uhusiano $M: R \rightarrow B$ unaopunguza kazi ya jumla ya gharama, mara nyingi jumla ya uzani wa gharama ya kifedha na muda wa kukamilika, kwa kuzingatia vikwazo kama nafasi za nyuma na upatikanaji wa programu:
$$\min_{M} \sum_{r_i \in R} \left[ \alpha \cdot C_{M(r_i)}(r_i) + \beta \cdot T_{M(r_i)}(r_i) \right]$$
ambapo $\alpha$ na $\beta$ ni vipengele vya uzani. Hii huweka ndani ya mfumo changamoto ya ujumuishaji "unaobadilika na unaoonekana wazi".
5. Matokeo ya Mfano wa Kwanza na Utendaji
Makala yaripoti juu ya uzoefu wa awali na programu za kisayansi zinazoendeshwa kwenye mifano ya kwanza inayopatikana. Ingawa viashiria maalum vya kiasi havijaelezewa kwa kina katika sehemu iliyotolewa, utekelezaji wenye mafanikio unaonyesha:
- Ujumuishaji wa Kazi: Mkusanyiko wa HTCondor/COBalD/TARDIS ulielekeza kazi kwa mifumo tofauti ya nyuma (HTC, HPC, Wingu) kwa mafanikio.
- Utoaji wa Programu: CVMFS na kontena zilitoa mazingira ya programu muhimu kwenye nodi mbalimbali za wafanyakazi kwa uaminifu.
- Ufikiaji wa Mtumiaji: JupyterHub na nodi za kuingia zilitumika kama njia bora za kuingilia kwa watafiti.
Mchoro wa Dhana: Usanifu wa mfumo unaweza kuonyeshwa kama mfano wa safu tatu:
- Safu ya Ufikiaji wa Mtumiaji: JupyterHub, Nodi za Kuingia, Token AAI.
- Safu ya Shirikisho na Upangaji: Kundi la HTCondor + Mpangaji Rasilimali wa Juu COBalD/TARDIS.
- Safu ya Rasilimali: Mifumo mbalimbali ya nyuma (vikundi vya HPC, mashamba ya HTC, VM za Wingu) na hifadhi ya shirikishi (dCache, mifano ya XRootD).
6. Mfumo wa Uchambuzi: Mfano wa Matumizi
Mfano: Mtafiti wa fizikia ya nyuklia anahitaji kuchakata kazi 10,000 za uigaji wa Monte Carlo, kila moja ikihitaji cores 4 za CPU, Kumbukumbu ya GB 16, na mkusanyiko maalum wa programu (Geant4, ROOT).
- Kuwasilisha: Mtafiti anaingia kwenye PUNCH JupyterHub, anaandika hati ya uchambuzi, na kisha kuwasilisha kazi 10,000 kwa mpangaji wa ndani wa HTCondor.
- Upangaji wa Juu: COBalD/TARDIS inafuatilia foleni ya HTCondor. Inatathmini mifumo ya nyuma inayopatikana: Shamba la HTC la Chuo Kikuu A (gharama ndogo, muda mrefu wa foleni), Kikundi cha HPC cha Taasisi B (gharama ya wastani, vifaa maalum), na wingu la kibiashara (gharama kubwa, upatikanaji wa haraka).
- Uamuzi na Utekelezaji: Kwa kutumia mfano wake wa gharama, TARDIS inaweza kuamua kuanzisha kazi 2,000 za haraka kwenye wingu ili kuanza upesi, wakati inaendelea kumaliza zile zilizobaki kwenye shamba la HTC lenye gharama ndogo. Inatumia token AAI kwa uthibitishaji katika mifumo yote.
- Programu na Data: Kila kazi, bila kujali mfumo wa nyuma, inavuta mazingira yake ya Geant4/ROOT kutoka kwa CVMFS. Data ya pembejeo inachukuliwa kutoka kwenye jina la umoja la hifadhi la Storage4PUNCH (k.m., kupitia XRootD), na matokeo yanaandikwa tena kwenye kituo maalum cha hifadhi.
- Ukamilifu: Mtafiti anafuatilia na kukusanya matokeo kutoka kwenye foleni moja ya kazi ya HTCondor, bila kujua utekelezaji wa msingi unaotumia miundombinu mingi.
7. Uchambuzi Muhimu na Mtazamo wa Mtaalamu
Uelewa Mkuu: PUNCH4NFDI haijengi wingu jingine; inabuni safu ya shirikishi yenye busara ya kisiasa na kiufundi isiyo ya kawaida. Ubunifu wake wa kweli upo kwenye mpangaji rasilimali wa juu COBalD/TARDIS, ambaye hufanya kazi kama "mtafsiri wa kidiplomasia" wa kushiriki rasilimali, sio muunganishi anayetawala. Hii inakubali utawala wa vikundi vya taasisi vilivyopo—ukweli usioweza kubadilishwa katika masomo ya juu ya Ujerumani—wakati bado inaunda rasilimali ya juu inayofanya kazi.
Mtiririko wa Mantiki: Mantiki hii ni kamili: anza na mtumiaji (JupyterHub/kiingilio), ficha fujo kupitia mpangaji aliyejaribiwa (HTCondor), kisha tumia wakala mwenye akili (TARDIS) kuweka maombi ya kiwango cha juu kwenye mifumo ya nyuma halisi, inayowezekana kwa kisiasa. Kutegemea CVMFS na kontena kwa programu ni hatua bora, ikitatua tatizo la "mashaka ya utegemezi" linalowakabili shirikisho nyingi. Mkakati wa hifadhi ni wa kihafidhina kwa busara, ukijenga juu ya teknolojia mbili zilizothibitishwa za dCache/XRootD kutoka HEP, na kuepuka jaribio la kulazimisha teknolojia mpya moja.
Nguvu na Udhaifu:
- Nguvu: Uvamizi mdogo ndio nguvu yake kuu. Hauhitaji watoa rasilimali kubadilisha sera zao za ndani. Matumizi ya zana zilizokomaa, zinazoendeshwa na jamii (HTCondor, CVMFS, dCache) hupunguza hatari kwa kiasi kikubwa na kuongeza uendelevu, tofauti na miradi inayojengwa kwenye mifumo maalum. Kuzingatia kanuni za FAIR kinalingana kikamilifu na masharti ya kisasa ya ufadhili.
- Udhaifu na Hatari: Njia ya mpangaji rasilimali wa juu inaleta hatua moja ya utata na hatari ya kushindwa. COBalD/TARDIS, ingawa inaahidi, haijajaribiwa sana kama sehemu zingine. "Tathmini" ya teknolojia ya kihifadhi/metadata (kama Rucio) inaonyesha sehemu ngumu zaidi iko mbele: usimamizi wa data wenye akili. Bila hii, hii ni shirikisho la hesabu lenye orodha ya hifadhi iliyounganishwa, sio jukwaa lenye umoja linalozingatia data. Pia kuna hatari ya kutotabirika kwa utendaji kwa watumiaji, kwani kazi zao zinabadilisha kati ya usanifu tofauti kabisa.
Uelewa Unaoweza Kutekelezwa:
- Kwa Wasanifu wa PUNCH: Jitahidi zaidi kufanya TARDIS iwe imara na inayoweza kufuatiliwa. Vipimo vyake na hati za maamuzi ni muhimu kwa uboreshaji na kujenga uaminifu. Kipaumbele cha kwanza ni ujumuishaji wa safu ya usimamizi wa data (kama Rucio) ijayo; hesabu bila data yenye akili ni suluhisho la nusu.
- Kwa Mashirika Mengine ya Ushirikiano: Hii ni mfano wa kufuata, hasa falsafa ya "ujumuishaji badala ya ubadilishaji". Hata hivyo, tathmini ikiwa jamii yako ina kitu sawa na CVMFS—kama hivyo, huo ndio uamuzi wako wa kwanza wa kujenga/kununua.
- Kwa Watoa Rasilimali: Mfano huu una hatari ndogo kwako. Jiunge nayo. AAI inayotumia token ni njia safi ya kutoa ufikiaji bila kukihatarisha usalama wa ndani. Ni faida wazi kwa kuonekana na matumizi.
8. Matumizi ya Baadaye na Mpango wa Maendeleo
Miundombinu ya PUNCH4NFDI inaweka msingi wa matumizi kadhaa ya hali ya juu na mwelekeo wa utafiti:
- Mtiririko wa Kazi Unaovuka Nyanja: Kuwezesha mifumo tata ya uchambuzi yenye hatua nyingi inayohama kwa urahisi kati ya uigaji (HPC), usindikaji wa matukio kwa wingi (HTC), na mafunzo ya mashine kujifunza (GPU za Wingu).
- Upangaji Unaozingatia Data: Kujumuishwa kwa shirikisho la hifadhi kwa kina zaidi na mpangaji wa hesabu. Matoleo ya baadaye ya COBald/TARDIS yanaweza kujumuisha mahali pa data (kupunguza uhamishaji wa WAN) na kuweka awali katika kazi yake ya gharama, kuelekea kwenye upangaji unaotambua data.
- Ujumuishaji na Hifadhi za Data za FAIR: Kufanya kazi kama uti wa mgongo wa hesabu wa hali ya juu kwa hifadhi za kitaifa za data za FAIR, kuruhusu watafiti kuchambua seti kubwa za data moja kwa moja mahali ambapo zimehifadhiwa, kufuata mfano wa "hesabu-kwa-data".
- AI/ML kama Huduma: Kiolesura cha JupyterHub na mfumo wa nyuma unaoweza kuongezeka unaweza kupanuliwa kwa mazingira yaliyopangwa kwa mifumo maalum ya AI/ML (PyTorch, TensorFlow) na ufikiaji wa rasilimali za GPU, na hivyo kuleta usawa wa AI kwa sayansi ya asili.
- Kupanuliwa kwa Rasilimali za Kimataifa: Mfano wa shirikisho unaweza kupanuliwa kujumuisha rasilimali kutoka kwa miradi ya Kuropa kama Wingu la Kuropa la Sayansi Wazi (EOSC) au tovuti za gridi ya hesabu ya LHC (WLCG), na kuunda miundombinu ya utafiti ya Kuropa kwa kweli.
Mpango wa maendeleo unaweza kujumuisha kuimarisha mfano wa kwanza wa sasa, kuongeza idadi ya rasilimali zilizojumuishwa, kutekeleza suluhisho za metadata/kihifadhi zilizotathminiwa, na kuendeleza mifumo ya kisasa zaidi ya sera na uhasibu kwa matumizi ya haki ya rasilimali kwenye ushirikiano.
9. Marejeo
- Shirikisho la PUNCH4NFDI. (2024). Waraka Nyeupe wa PUNCH4NFDI. [Hati ya Ndani ya Shirikisho].
- Thain, D., Tannenbaum, T., & Livny, M. (2005). Hesabu zilizosambazwa kwa vitendo: uzoefu wa Condor. Uhesabuji wa pamoja: mazoezi na uzoefu, 17(2-4), 323-356.
- Blomer, J., et al. (2011). Mfumo wa faili wa CernVM. Gazeti la Fizikia: Mfululizo wa Mkutano, 331(5), 052004.
- Nyaraka za COBalD/TARDIS. (n.d.). Imepatikana kutoka https://tardis.readthedocs.io/
- Ushirikiano wa dCache. (n.d.). dCache: Mfumo wa hifadhi uliosambazwa. https://www.dcache.org/
- Ushirikiano wa XRootD. (n.d.). XRootD: Ufikiaji wa data wenye utendaji wa juu, unaoweza kuongezeka na wenye kustahimili hitilafu. http://xrootd.org/
- Wilkinson, M. D., et al. (2016). Kanuni za Mwongozo za FAIR kwa usimamizi wa data ya kisayansi na utunzaji. Data ya kisayansi, 3(1), 1-9.
- Wingu la Kuropa la Sayansi Wazi (EOSC). (n.d.). https://eosc-portal.eu/
- Gridi ya Hesabu ya LHC Ulimwenguni (WLCG). (n.d.). https://wlcg.web.cern.ch/