feature engineering
Megjelenés
Főnév
feature engineering (tsz. feature engineerings)
- (informatika) Feature engineering (jellemzőtervezés) a gépi tanulás egyik kulcsfontosságú lépése, amely során a nyers adatból olyan jellemzőket (feature-öket) hozunk létre, amelyek hasznosak a modell számára a tanuláshoz.
🧠 Mi az a feature?
A feature olyan inputváltozó, amelyet egy gépi tanulási modell felhasznál a predikcióhoz. Például:
| Probléma típusa | Feature példák |
|---|---|
| Házárak becslése | négyzetméter, szobaszám, elhelyezkedés |
| E-mail spam felismerése | szavak száma, bizonyos kulcsszavak jelenléte |
| Képosztályozás | pixelértékek, élek száma, színek aránya |
🧰 Feature engineering lépései
1. Adattisztítás
- Hiányzó adatok kezelése (pl. imputálás, elhagyás)
- Outlierek (kilógó értékek) kezelése
2. Átalakítás
- Kategóriák számszerűsítése (pl. one-hot encoding)
- Szöveges adatok tokenizálása
- Időbélyegek bontása (óra, nap, hónap stb.)
3. Létrehozás
- Új jellemzők kiszámítása meglévőkből: pl. sebesség = távolság / idő
- Kombinációs jellemzők: pl. szoba/nm arány
4. Skálázás és normalizálás
- Egységes tartományba hozás (pl. min-max skálázás, Z-score)
5. Dimenziócsökkentés
- PCA, LDA vagy autoencoder használata irreleváns feature-ök kiszűrésére
🏗️ Példák feature engineeringre
✉️ Szöveges adatnál:
- Szótövek száma
- Kiejthető szavak száma
- Kulcsszavak előfordulása
🧮 Numerikus adatnál:
- Logaritmus, négyzetgyök alkalmazása
- Normalizálás
🗓️ Időalapú adatnál:
- Hétvége-e vagy sem
- Munkaidőn belüli-e
🤖 Automatikus feature engineering
Vannak eszközök, amik ezt automatikusan segítik:
- Featuretools
- AutoML rendszerek (pl. Google AutoML, H2O, AutoKeras)
⚠️ Tipikus hibák
- Túl sok irreleváns feature ➝ túlilleszkedés
- “Data leakage” ➝ olyan jellemző kerül be, ami jövőbeli információt tartalmaz
💬 TL;DR
Feature engineering = művészet és tudomány az adatok megfelelő formába öntésére, hogy egy gépi tanulási modell hatékonyan és pontosan tudjon tanulni.
- feature engineering - Szótár.net (en-hu)
- feature engineering - Sztaki (en-hu)
- feature engineering - Merriam–Webster
- feature engineering - Cambridge
- feature engineering - WordNet
- feature engineering - Яндекс (en-ru)
- feature engineering - Google (en-hu)
- feature engineering - Wikidata
- feature engineering - Wikipédia (angol)