Ugrás a tartalomhoz

feature engineering

A Wikiszótárból, a nyitott szótárból


Főnév

feature engineering (tsz. feature engineerings)

  1. (informatika) Feature engineering (jellemzőtervezés) a gépi tanulás egyik kulcsfontosságú lépése, amely során a nyers adatból olyan jellemzőket (feature-öket) hozunk létre, amelyek hasznosak a modell számára a tanuláshoz.



🧠 Mi az a feature?

A feature olyan inputváltozó, amelyet egy gépi tanulási modell felhasznál a predikcióhoz. Például:

Probléma típusa Feature példák
Házárak becslése négyzetméter, szobaszám, elhelyezkedés
E-mail spam felismerése szavak száma, bizonyos kulcsszavak jelenléte
Képosztályozás pixelértékek, élek száma, színek aránya



🧰 Feature engineering lépései

1. Adattisztítás

  • Hiányzó adatok kezelése (pl. imputálás, elhagyás)
  • Outlierek (kilógó értékek) kezelése

2. Átalakítás

  • Kategóriák számszerűsítése (pl. one-hot encoding)
  • Szöveges adatok tokenizálása
  • Időbélyegek bontása (óra, nap, hónap stb.)

3. Létrehozás

  • Új jellemzők kiszámítása meglévőkből: pl. sebesség = távolság / idő
  • Kombinációs jellemzők: pl. szoba/nm arány

4. Skálázás és normalizálás

  • Egységes tartományba hozás (pl. min-max skálázás, Z-score)

5. Dimenziócsökkentés

  • PCA, LDA vagy autoencoder használata irreleváns feature-ök kiszűrésére



🏗️ Példák feature engineeringre

✉️ Szöveges adatnál:

  • Szótövek száma
  • Kiejthető szavak száma
  • Kulcsszavak előfordulása

🧮 Numerikus adatnál:

  • Logaritmus, négyzetgyök alkalmazása
  • Normalizálás

🗓️ Időalapú adatnál:

  • Hétvége-e vagy sem
  • Munkaidőn belüli-e



🤖 Automatikus feature engineering

Vannak eszközök, amik ezt automatikusan segítik:

  • Featuretools
  • AutoML rendszerek (pl. Google AutoML, H2O, AutoKeras)



⚠️ Tipikus hibák

  • Túl sok irreleváns feature ➝ túlilleszkedés
  • “Data leakage” ➝ olyan jellemző kerül be, ami jövőbeli információt tartalmaz



💬 TL;DR

Feature engineering = művészet és tudomány az adatok megfelelő formába öntésére, hogy egy gépi tanulási modell hatékonyan és pontosan tudjon tanulni.