2019
biológia
A komplexom nagyteljesítményű szimulációi
Témavezető:
Dr. Csikász- Nagy Attila, Dr. Reguly István
Dr. Csikász- Nagy Attila, Dr. Reguly István
Összefoglaló
Az elmúlt évtizedekben a új nagy-áteresztőképességű technikáknak köszönhetően, mint például a tömeg spektrometria, nagy mennyiségű protein-protein interakciós és domén-domén interakciós adat áll rendelkezésünkre. Ez megnyitotta a lehetőséget szimuláció alapú módszerek előtt a fehérje komplexek predikciójában.
Célunk egy SiComPre-n alapuló új program készítése, amely képes szimulációs módszerekkel fehérje komplexek predikciójára, ehhez az úgynevezett Gillespie's Multiparticle algoritmust használja. Ez a módszer kombinálja a klasszikus Gillespie algoritmust a diffúzióval, azzal hogy a szimulált teret kisebb terekre (sub-volumes vagy SVs) osztja, amelyek elég kicsik, hogy feltételezhetjük a reagensek képesek egymással interakcióba lépni, valamint képesek diffúziónálni a sub-volume-ok között.
Az SiComPre-nek vannak korlátai; a szimulált sejt modellje csak két dimenziós, valamint teljesítménybeli limitációk miatt nem volt képes valós fehérjeszámokkal szimulálni. Célunk, hogy az implementációnk teljesítménye lehetővé tegye nagy skálájú realisztikus modellek szimulációját. Programunk képes három dimenziós sejtmodelt kezelni, ezáltal a diffúzió is kevésbé lesz limitálva. A komplexeket közvetlenebb módon tárolom, amely rugalmasabb kódot eredményez a későbbi új funkciókhoz, mint például specifikusabb belső kötések a komplexekben, fehérje szintű konformációs változások, valamint komplexekre jellemző diffúziós tulajdonságok.
Egy további kihívás, hogy nem áll rendelkésre a teljes proteomra kiterjedő diffúziós együthatóról szóló adatbázis. Összegyűjtöttem és módosítottam módszereket, amelyekkel meg lehet becsülni ezeket a konstansokat az ismert moláris tömegeket és a Stokes-Einstein egyenletet felhasználva. Valamint találtam egy eljárást, amivel meg lehet becsülni a reakciós koefficiensek arányát az egyensúlyi koncentrációkból.
Befejeztem a szimuláció magjának az implementálását, amely már képes fehérje komplexek predikciójára, 3D sejtmodellben. Párhuzamosítottam a programot CPU-ra, ehhez OpenMP-t használtam. A program számítási teljesítménye már CPU-n is felülmúlta az elvárásainkat, a futási idő percekben mérhető, ezért a közeljövőben nem lesz szükség GPU használatára.
Összehasonlítottam a 2D-s és a 3D-s modell predikciós teljesítményét, különböző szimulációs idők mellett. Ebben az utóbbi felülmúlta a 2D-s modellt minden vizsgált szempontból. Probléma még a természetellenesen nagy komplexek kialakulása a szimuláció során, ennek megoldására számos megoldást javasoltam.
Célunk egy SiComPre-n alapuló új program készítése, amely képes szimulációs módszerekkel fehérje komplexek predikciójára, ehhez az úgynevezett Gillespie's Multiparticle algoritmust használja. Ez a módszer kombinálja a klasszikus Gillespie algoritmust a diffúzióval, azzal hogy a szimulált teret kisebb terekre (sub-volumes vagy SVs) osztja, amelyek elég kicsik, hogy feltételezhetjük a reagensek képesek egymással interakcióba lépni, valamint képesek diffúziónálni a sub-volume-ok között.
Az SiComPre-nek vannak korlátai; a szimulált sejt modellje csak két dimenziós, valamint teljesítménybeli limitációk miatt nem volt képes valós fehérjeszámokkal szimulálni. Célunk, hogy az implementációnk teljesítménye lehetővé tegye nagy skálájú realisztikus modellek szimulációját. Programunk képes három dimenziós sejtmodelt kezelni, ezáltal a diffúzió is kevésbé lesz limitálva. A komplexeket közvetlenebb módon tárolom, amely rugalmasabb kódot eredményez a későbbi új funkciókhoz, mint például specifikusabb belső kötések a komplexekben, fehérje szintű konformációs változások, valamint komplexekre jellemző diffúziós tulajdonságok.
Egy további kihívás, hogy nem áll rendelkésre a teljes proteomra kiterjedő diffúziós együthatóról szóló adatbázis. Összegyűjtöttem és módosítottam módszereket, amelyekkel meg lehet becsülni ezeket a konstansokat az ismert moláris tömegeket és a Stokes-Einstein egyenletet felhasználva. Valamint találtam egy eljárást, amivel meg lehet becsülni a reakciós koefficiensek arányát az egyensúlyi koncentrációkból.
Befejeztem a szimuláció magjának az implementálását, amely már képes fehérje komplexek predikciójára, 3D sejtmodellben. Párhuzamosítottam a programot CPU-ra, ehhez OpenMP-t használtam. A program számítási teljesítménye már CPU-n is felülmúlta az elvárásainkat, a futási idő percekben mérhető, ezért a közeljövőben nem lesz szükség GPU használatára.
Összehasonlítottam a 2D-s és a 3D-s modell predikciós teljesítményét, különböző szimulációs idők mellett. Ebben az utóbbi felülmúlta a 2D-s modellt minden vizsgált szempontból. Probléma még a természetellenesen nagy komplexek kialakulása a szimuláció során, ennek megoldására számos megoldást javasoltam.
Dr. Csikász- Nagy Attila
Dr. Reguly István