Protein Data Bank
Főnév
Protein Data Bank (tsz. Protein Data Banks)
- (informatika) A Protein Data Bank (PDB) egy nyilvánosan hozzáférhető, nemzetközi tudományos adatbázis, amely makromolekulák – elsősorban fehérjék és nukleinsavak – háromdimenziós szerkezetét tárolja. Az adatbázis a strukturális biológia egyik legfontosabb információforrása, és kulcsszerepet játszik az orvosbiológiai kutatásokban, gyógyszerfejlesztésben, bioinformatikában és molekuláris biológiában.
Története
A PDB-t 1971-ben hozták létre, és azóta az egyik legnagyobb és leggyorsabban növekvő tudományos adatbázissá vált. Az elsőként feltöltött szerkezetek közé tartozott például a miohemoglobin, a lizozim és a tripszin inhibitor. Kezdetben mindössze néhány tucat struktúrát tartalmazott, mára azonban már több százezer szerkezetet tartalmaz, és hetente újakat is hozzáadnak.
Az adatbázis eredetileg az Egyesült Államokban jött létre, de ma már a Worldwide Protein Data Bank (wwPDB) konzorcium kezeli, amelyben négy nagy partner vesz részt:
- RCSB PDB (USA)
- PDBe (Európa)
- PDBj (Japán)
- BMRB (USA – nukleáris mágneses rezonanciás adatok)
Célja és jelentősége
A Protein Data Bank célja, hogy szabadon hozzáférhető és megbízható információforrást biztosítson a makromolekulák térszerkezetéről. Ez az információ kritikus fontosságú a következő területeken:
- Gyógyszerfejlesztés: a célfehérjék szerkezetének ismerete segíti az új gyógyszerek tervezését (strukturális alapú gyógyszertervezés).
- Funkcionális elemzés: a szerkezet alapján következtetni lehet a fehérje működésére.
- Evolúciós vizsgálatok: a szerkezeti hasonlóságok segítségével rokonsági kapcsolatokat lehet felfedezni.
- Fehérje-mérnökség: új enzimek, receptorok vagy antitestek tervezése.
Feltöltés és adatformátum
A kutatók kötelesek a szerkezeti adatokat feltölteni a PDB-be, ha azokat publikálják – ez a feltétele a legtöbb tudományos folyóiratban való megjelenésnek. Az adatfeltöltés során a következő adatok kerülnek az adatbázisba:
- Atomkoordináták
- Rácsparaméterek
- Kísérleti módszerek adatai (például röntgendiffrakció, NMR, krioelektron-mikroszkópia)
- Biológiai relevanciájú információk (pl. ligandumok, mutációk, funkció)
Az adatok PDB vagy mmCIF formátumban kerülnek tárolásra. A mmCIF (Macromolecular Crystallographic Information File) formátum részletesebb és gépi feldolgozásra is alkalmasabb.
A PDB szerkezeti adatai
Fehérjék
A fehérjék az adatbázis fő tartalmát adják. A legtöbb struktúrát röntgendiffrakcióval határozták meg, de az NMR és a krio-EM módszerek is egyre gyakoribbak.
DNS és RNS
A nukleinsavak, különösen a riboszómális RNS-ek és különféle aptamerek is megtalálhatók az adatbázisban.
Ligandumok és ko-faktorok
Sok struktúra tartalmaz gyógyszermolekulát, fémiont, vagy egyéb kis molekulát, amelyek fontosak a fehérje működésében.
Komplexek és szupramolekuláris rendszerek
Az utóbbi években egyre több teljes fehérjekomplex és nagy makromolekulás szerkezet került be az adatbázisba (pl. riboszóma, vírusburok, ioncsatornák).
Példák fontos PDB-szerkezetekre
- 1CRN – krambin, egy kis növényi fehérje, gyakran oktatásra használják.
- 1A4Y – HIV-1 proteáz inhibitora, a gyógyszerkutatás kiemelt szerkezete.
- 4HHB – hemoglobin, az egyik legismertebb fehérjeszerkezet.
- 6VXX – SARS-CoV-2 spike protein szerkezete, kulcsfontosságú a COVID-19 kutatásában.
PDB ID és keresés
Minden struktúra egy 4 karakterből álló azonosítóval rendelkezik, például: 1A2C. A keresés többféleképpen történhet:
- Molekula neve (pl. „hemoglobin”)
- Organizmus neve (pl. „Homo sapiens”)
- Ligandum neve (pl. „ATP”)
- Szerkezeti hasonlóság alapján
A keresés az rcsb.org oldalon érhető el, ahol vizuális megjelenítés, letöltés és analízis is lehetséges.
Vizualizáció és elemzés
A PDB-szerkezetek 3D-ben megtekinthetők különféle szoftverekkel, például:
- PyMOL
- Chimera
- Jmol
- Mol* (webes megjelenítő)
- VMD (Visual Molecular Dynamics)
Ezek az eszközök lehetővé teszik a fehérjeláncok, oldalláncok, másodlagos szerkezeti elemek, ligandumkötések és kölcsönhatások részletes vizsgálatát.
Bioinformatikai eszközök és integrációk
A PDB nemcsak adatbázis, hanem platform is:
- PDBsum – részletes szerkezeti összegzések, kölcsönhatások.
- SCOP / CATH – szerkezeti osztályozások.
- PDBe-KB – kiegészítő biológiai tudásbázis.
- UniProt – szekvenciaadatbázis integráció.
- AlphaFold struktúrák is kereshetők PDB-azonosítóval vagy UniProt ID alapján.
Tudományos és oktatási jelentőség
A PDB-t széles körben használják:
- Egyetemi képzésben: biokémia, molekuláris biológia, gyógyszerészet.
- Tudományos kutatásban: szerkezet-alapú hipotézisek, molekuláris mechanizmusok vizsgálata.
- Ipari szférában: gyógyszertervezés, fehérjemérnökség, biotechnológia.
Etikai és adatminőségi szempontok
A PDB strukturált ellenőrzési folyamaton megy keresztül, hogy biztosítsa a:
- Adatminőséget (felbontás, validálás)
- Hitelességet (peer-review kapcsolódás)
- Transzparenciát (publikációk, szerzők, kísérleti módszerek)
A struktúrákhoz kapcsolódó validációs riportok elérhetők, és tartalmazzák például az R-értékeket, Ramachandran-plotokat, B-faktorokat stb.
A jövő kihívásai és lehetőségei
A PDB továbbra is fejlődik az új technológiák és nagy léptékű adatelemzések hatására:
- AI-alapú predikciók (AlphaFold, RoseTTAFold) kiegészítik a kísérleti adatokat.
- Big data és gépi tanulás segítségével új összefüggéseket tárhatnak fel.
- Integratív szerkezeti biológia – több technikát kombinálva még komplexebb rendszerek modellezése.
Összegzés
A Protein Data Bank (PDB) a molekuláris biológia és a bioinformatika egyik legfontosabb alapintézménye. Lehetővé teszi a kutatók és fejlesztők számára, hogy világszerte hozzáférjenek a makromolekulák megbízható és részletes szerkezeti adataihoz. Jelentősége a tudományos kutatásban, az orvoslásban és az oktatásban egyaránt kiemelkedő.
- Protein Data Bank - Szótár.net (en-hu)
- Protein Data Bank - Sztaki (en-hu)
- Protein Data Bank - Merriam–Webster
- Protein Data Bank - Cambridge
- Protein Data Bank - WordNet
- Protein Data Bank - Яндекс (en-ru)
- Protein Data Bank - Google (en-hu)
- Protein Data Bank - Wikidata
- Protein Data Bank - Wikipédia (angol)