protein function prediction
Megjelenés
Főnév
protein function prediction (tsz. protein function predictions)
- (informatika) Protein function prediction – magyarul: fehérjefunkció-előrejelzés – egy bioinformatikai és mesterséges intelligenciával támogatott tudományos terület, amely célja:
megjósolni, hogy egy adott fehérje milyen biológiai szerepet tölt be, pusztán a szekvenciájából, szerkezetéből vagy kapcsolódási hálózataiból kiindulva.
Ez kulcsfontosságú például a gyógyszerkutatásban, genomértelmezésben, vagy új betegségek mechanizmusainak feltárásában.
🧬 1. Miért fontos a fehérjefunkció előrejelzése?
- Az újonnan felfedezett gének és fehérjék gyorsabban jelennek meg, mint ahogy laboratóriumban jellemezni tudnánk.
- A kísérletes módszerek (pl. knock-out, expresszió, kristályosítás) idő- és költségigényesek.
- In silico előrejelzés (számítógépes módszerek) segíti a biológusokat a prioritások meghatározásában.
🧪 2. Mit nevezünk fehérjefunkciónak?
A fehérje funkciója többszintű lehet:
| Szint | Példa |
|---|---|
| Molekuláris funkció | pl. enzimaktivitás, kötődés (ATP-ase) |
| Biológiai folyamat | pl. sejtosztódás, metabolizmus |
| Sejtkomponens | pl. mitokondrium, sejtmag, membránhoz kötött |
➡️ Ezek gyakran Gene Ontology (GO) terminusokkal írhatók le.
🧩 3. Adatok, amelyeken alapulhat a predikció
- Aminosav-szekvencia (pl. FASTA) – leggyakrabban használt, mivel könnyen elérhető
- Fehérjeszerkezet (3D konformáció) – például AlphaFold2 predikciók
- Homológia – hasonlóság ismert fehérjékhez
- Interakciós hálózatok – fehérje-fehérje kapcsolatok
- Génexpressziós mintázatok
- Evolúciós és domén-adatok
🧠 4. Módszerek
A. Homológiaalapú módszerek
- Hasonló szekvencia → hasonló funkció
- Eszközök: BLAST, PSI-BLAST
- ✅ Gyors, egyszerű
- ❌ Új funkciójú fehérjéknél pontatlan
B. Gépi tanulás
- Klasszifikációs modellek, például:
- Random Forest
- SVM
- Neural Network / Deep Learning
- Jellemzők: aminosav-összetétel, doménminták, hálózati jellemzők
C. Graph-based módszerek
- Fehérjéket és kölcsönhatásaikat gráfként modellezik (pl. PPI hálózat)
- GNN (Graph Neural Networks) egyre népszerűbb
D. Language model alapú módszerek
- ProteinBERT, ProtTrans, ESM → fehérjeszekvenciákat „nyelvként” értelmeznek
- Nagy előnye: sok annotálatlan adatból tanul
📦 5. Népszerű eszközök és adatbázisok
| Eszköz / adatbázis | Leírás |
|---|---|
| InterProScan | Domének, motívumok felismerése |
| BLAST | Hasonló fehérjék keresése |
| AlphaFold DB | Prediktált 3D szerkezetek |
| GO (Gene Ontology) | Funkciók standard terminológiája |
| DeepGO | Mélytanulás-alapú GO predikció |
| UniProt | Szekvencia + annotációs adatbázis |
🧪 6. Példa (Python + Biopython + BLAST)
from Bio.Blast import NCBIWWW
from Bio.Blast import NCBIXML
sequence = "MKWVTFISLLFLFSSAYSRGVFRRDTHKSEIAHRFKDLGE"
result_handle = NCBIWWW.qblast("blastp", "nr", sequence)
blast_record = NCBIXML.read(result_handle)
for alignment in blast_record.alignments[:3]:
print(alignment.title)
Ez a kód hasonló ismert fehérjéket keres, amelyekből funkcióra következtethetünk.
🧾 7. Összefoglalás
A protein function prediction:
- Egy kritikus fontosságú bioinformatikai feladat, amely segít értelmezni a fehérjék szerepét a biológiában
- Többféle módszert kombinál: szekvencia-elemzés, gépi tanulás, gráfalapú modellek, struktúraalapú predikció
- Kulcsfontosságú eszköz a gyógyszerkutatásban, funkcionális genomikában, betegségek kutatásában
- protein function prediction - Szótár.net (en-hu)
- protein function prediction - Sztaki (en-hu)
- protein function prediction - Merriam–Webster
- protein function prediction - Cambridge
- protein function prediction - WordNet
- protein function prediction - Яндекс (en-ru)
- protein function prediction - Google (en-hu)
- protein function prediction - Wikidata
- protein function prediction - Wikipédia (angol)