machine learning
Megjelenés
| part of a series on |
| machine learning and data mining |
|---|
| part of a series on |
| artificial intelligence (ai) |
|---|
Főnév
machine learning (tsz. machine learnings)
A gépi tanulás (machine learning, ML) a mesterséges intelligencia egy ága, amelynek célja, hogy a számítógépek képesek legyenek tanulni tapasztalatból (adatokból) anélkül, hogy explicit módon programoznánk őket minden esetre.
Az algoritmusok minták alapján általánosítanak, és képesek előrejelzést, döntést vagy osztályozást végezni új, ismeretlen bemenetekre is.
📦 A gépi tanulás alaptípusai
| Típus | Jelentés |
|---|---|
| Supervised Learning (felügyelt tanulás) | Van bemenet + kimenet, a modell ez alapján tanul |
| Unsupervised Learning (felügyelet nélküli tanulás) | Csak bemenetek vannak, nincs címke |
| Semi-supervised Learning (félig felügyelt) | Kevés címkézett + sok címkézetlen adat |
| Reinforcement Learning (megerősítéses tanulás) | A modell próbálgatással tanul jutalom alapján |
🧩 Alapfogalmak
| Fogalom | Magyarázat |
|---|---|
| Adatpont (sample) | Egy megfigyelés (pl. egy kép, szöveg vagy számok sora) |
| Jellemző (feature) | Egy adat leíró tulajdonsága (pl. kor, méret, ár) |
| Címke (label) | A tanításhoz tartozó helyes válasz |
| Modell | A tanulás során képzett algoritmus |
| Tanítás (training) | Az a folyamat, ahol az algoritmus megtanulja az adatok közti összefüggést |
| Predikció | Előrejelzés új adatra a tanult modell alapján |
🎯 Miért használjuk?
- Automatizált döntéshozatal – pl. hitelbírálat
- Adatból tanuló rendszerek – pl. ajánlórendszerek
- Mintafelismerés – pl. képek, hang, szöveg feldolgozása
- Nagy adathalmazok kiértékelése, ahol emberi analízis nem lehetséges
🛠️ Példák és algoritmusok
📘 Supervised Learning
| Feladat | Példa | Algoritmusok |
|---|---|---|
| Osztályozás | E-mail SPAM vagy nem | KNN, SVM, Naive Bayes, döntési fa |
| Regresszió | Ház árának becslése | Lineáris regresszió, SVR, neurális háló |
📘 Unsupervised Learning
| Feladat | Példa | Algoritmusok |
|---|---|---|
| Klaszterezés | Vásárlók szegmentálása | K-means, DBSCAN |
| Dimenziócsökkentés | Vizualizáció, zajcsökkentés | PCA, t-SNE, UMAP |
| Anomáliadetektálás | Csalásfelderítés | LOF, Isolation Forest |
📘 Reinforcement Learning
| Alkalmazás | Példa |
|---|---|
| Játékok | AlphaGo, sakk |
| Robotika | Mozgástanulás jutalom alapján |
| Önvezetés | Kormányzás és gáz optimalizálása környezeti visszajelzés alapján |
🔍 Gépi tanulási folyamat lépései
- Adatgyűjtés
- Adattisztítás, előfeldolgozás
- Feature engineering – jellemzők kiválasztása
- Tanítókészlet és tesztkészlet szétválasztása
- Modell kiválasztása és tanítása
- Kiértékelés (accuracy, F1-score, RMSE stb.)
- Predikció új adatokra
- Finomhangolás, újratanítás ha kell
🧪 Népszerű eszközök
| Könyvtár / platform | Használat |
|---|---|
| scikit-learn | Klasszikus ML (Python) |
| TensorFlow / Keras | Mélytanulás |
| PyTorch | Haladó neurális hálók |
| XGBoost / LightGBM | Boosting alapú modellek |
| Google Colab | Ingyenes notebook környezet GPU-val |
📈 Kiértékelési metrikák
| Feladat | Metrika |
|---|---|
| Osztályozás | Accuracy, precision, recall, F1-score, ROC-AUC |
| Regresszió | MAE, MSE, RMSE, R² |
| Klaszterezés | Silhouette-score, Davies–Bouldin-index |
| RL | Kumulatív jutalom, tanulási görbe |
✅ Előnyök
- 📊 Adatból tanul, nem szükséges minden szabályt előre megadni
- 🧠 Komplex mintázatokat is felismer
- 🔁 Automatikusan frissíthető új adatokkal
- 🛠️ Sokféle feladatra testre szabható
⚠️ Hátrányok
| Kihívás | Magyarázat |
|---|---|
| Adatéhség | Sok, jó minőségű adat kell a tanításhoz |
| Túltanulás (overfitting) | A modell a tanítókészletet „bemagolja” |
| Átláthatatlanság | „Fekete doboz” hatás – nem mindig tudjuk, mit miért dönt a modell |
| Etikai kockázatok | Elfogultság, diszkrimináció, adatvédelmi kérdések |
🛠️ Egyszerű Python példa: logisztikus regresszió
from sklearn.datasets import load_iris
from sklearn.linear_model import LogisticRegression
from sklearn.model_selection import train_test_split
X, y = load_iris(return_X_y=True)
X_train, X_test, y_train, y_test = train_test_split(X, y)
model = LogisticRegression(max_iter=200)
model.fit(X_train, y_train)
print("Pontosság:", model.score(X_test, y_test))
🧾 Összefoglalás
| Tulajdonság | Részletek |
|---|---|
| Definíció | Algoritmusok, amelyek adatokból tanulnak szabályokat |
| Alaptípusok | Felügyelt, felügyelet nélküli, megerősítéses |
| Felhasználás | Szöveg, kép, hang, pénzügy, orvostudomány, játékok |
| Módszerek | Regresszió, klaszterezés, osztályozás, optimalizáció |
| Előnyök | Automatizál, skálázható, mintafelismerő |
| Kihívások | Adatigény, etika, komplexitás |
Ha szeretnéd, mutatok példát mélytanulási modellekre (pl. képfelismerés CNN-nel), vagy elkészíthetünk egy teljes machine learning pipeline-t Pythonban adattisztítástól kiértékelésig.
- machine learning - Szótár.net (en-hu)
- machine learning - Sztaki (en-hu)
- machine learning - Merriam–Webster
- machine learning - Cambridge
- machine learning - WordNet
- machine learning - Яндекс (en-ru)
- machine learning - Google (en-hu)
- machine learning - Wikidata
- machine learning - Wikipédia (angol)
