felügyelt tanulás
Kiejtés
- IPA: [ ˈfɛlyɟɛltɒnulaːʃ]
Főnév
- (informatika, mesterséges intelligencia, gépi tanulás) A felügyelt tanulás (angolul supervised learning) egy olyan gépi tanulási megközelítés, ahol az algoritmus megtanulja egy adott adatkészlet mintáinak összefüggéseit úgy, hogy minden bemeneti adatpárhoz ismert címkét (kimenetet) rendelünk. A tanulási folyamat során a modell a bemeneti adatok és a hozzájuk tartozó címkék alapján tanul, hogy új, ismeretlen bemenetekre megfelelő kimenetet tudjon előállítani.
Főbb jellemzők
- Címkézett adatok: A felügyelt tanulás során a modell egy címkézett adatkészlettel dolgozik, ahol minden egyes adatpont (bemenet) tartalmaz egy megfigyelt eredményt vagy címkét (kimenetet). Ez lehet például egy osztályozás (pl. „kutya” vagy „macska”) vagy egy folytonos érték (pl. lakás árának előrejelzése).
- Tanulási cél: A cél az, hogy a modell megtanulja a bemenetek és a címkék közötti kapcsolatot, hogy új adatokra képes legyen helyesen előrejelezni a kimeneteket.
- Alapvető feladatok:
- Osztályozás (classification): Az osztályozási feladatok során a modell diszkrét kimeneti címkék megtanulására törekszik. Például egy e-mail lehet „spam” vagy „nem spam”.
- Regresszió: A regressziós feladatok során a modell folytonos kimeneti változókat próbál előrejelezni. Például egy gépi tanulási modell előrejelezheti egy ingatlan árát az ingatlan jellemzői alapján.
Hogyan működik a felügyelt tanulás?
A felügyelt tanulás két alapvető szakaszból áll:
- Tanulási (tréning) fázis: A modell a tanulási fázisban megkapja az adatok és a hozzájuk tartozó címkék egy részét, az úgynevezett tréning adatokat. Az algoritmus megtanulja, hogyan kapcsolódnak egymáshoz a bemeneti adatok (pl. jellemzők, mint a képpontok, szavak, érzékelési értékek) és a kimeneti címkék. Ennek során a modell optimalizálja a paramétereit, hogy minimalizálja az előrejelzési hibát.
- Tesztelési fázis: Miután a modell megtanulta a bemenet-kimenet összefüggéseket, ismeretlen adatokat adunk a modellnek, hogy megnézzük, mennyire képes jól előrejelezni a kimeneteket. Ezt a folyamatot a tesztelési adatokon végezzük, amelyek nincsenek jelen a tanulási fázisban. Az algoritmus sikerességét a teszt adatokon elért pontosság vagy hibaarány mutatja meg.
Példák a felügyelt tanulási algoritmusokra
- Lineáris regresszió A lineáris regresszió egy egyszerű felügyelt tanulási algoritmus, amely arra törekszik, hogy a bemeneti jellemzők és egy folytonos kimeneti változó közötti kapcsolatot egyenes vonallal modellezze. Például egy modell megtanulhatja, hogy a házak mérete hogyan befolyásolja azok árát.
- Logisztikus regresszió A logisztikus regresszió egy osztályozási algoritmus, amely a valószínűségi modellek segítségével kategorizálja a bemeneti adatokat két vagy több diszkrét osztályba. Például e-mailek kategorizálása „spam” vagy „nem spam” kategóriába.
- Döntési fák A döntési fák olyan osztályozási és regressziós algoritmusok, amelyek fa-struktúrát használnak a döntéshozatalhoz. A modell felosztja az adatokat különböző jellemzők alapján, hogy a végén egy végső osztályozási döntéshez vagy előrejelzéshez jusson. Például egy döntési fa megjósolhatja egy személy hitelképességét különböző pénzügyi mutatók alapján.
- Támogatóvektor-gépek (SVM) A támogatóvektor-gépek olyan osztályozási algoritmusok, amelyek arra törekednek, hogy az adatpontokat különböző kategóriák szerint elválasztó határvonalakat (hipersíkokat) találjanak meg. Az SVM-k rendkívül hatékonyak kétosztályos osztályozási feladatoknál, például betegségek diagnosztizálásánál.
- K-n legközelebbi szomszéd (K-nearest neighbors, KNN) A KNN egy egyszerű osztályozási algoritmus, amely úgy működik, hogy a bemeneti adatpont osztályát az alapján határozza meg, hogy a legközelebbi adatpontok milyen osztályba tartoznak. Például egy új virágfajta osztályozásakor a KNN algoritmus megvizsgálja a legközelebbi ismert virágfajtákat, és azok alapján kategorizál.
- Neurális hálózatok A neurális hálózatok több rétegből álló, összekapcsolt egységek, amelyek képesek összetett mintázatok megtanulására az adatokból. A mély neurális hálózatok (deep learning) különösen hatékonyak olyan feladatokban, mint a képfelismerés vagy a beszédfelismerés.
Felügyelet tanulás lépései
- Adatgyűjtés: Először egy adatkészletet kell gyűjteni, amely tartalmazza a bemeneti adatokat és a hozzájuk tartozó kimeneti címkéket. Ez lehet például egy képekből álló adatkészlet, ahol minden képhez egy címke tartozik (pl. macska vagy kutya).
- Adatfeldolgozás és előkészítés: Az adatok gyakran zajosak vagy hiányosak lehetnek, ezért azokat tisztítani és előkészíteni kell. Ez magában foglalhatja a hiányzó adatok pótlását, a kategóriák kódolását vagy az adatok normalizálását.
- Modell kiválasztása: A következő lépés a felügyelt tanulási algoritmus kiválasztása, amely a legjobban illeszkedik az adott feladathoz. Például egyszerű feladatokhoz használhatunk lineáris regressziót, míg összetettebb feladatokhoz neurális hálózatokat.
- Modelltanítás (tréning): A modellt a tréning adatain tanítjuk, ahol a cél a kimeneti címkékhez kapcsolódó kapcsolat felismerése. Az algoritmus optimalizálja a paramétereit, hogy minimalizálja az előrejelzési hibákat.
- Tesztelés és kiértékelés: A modellt a teszt adatokon értékeljük, hogy megnézzük, mennyire képes általánosítani új, nem látott adatokon. Ehhez különböző mérőszámokat használhatunk, például pontosságot, hibaarányt vagy F-értéket.
- Finomhangolás: Ha szükséges, a modell paramétereit finomhangolhatjuk, hogy javítsuk a teljesítményt. Ez magában foglalhatja a modell komplexitásának növelését vagy csökkentését, a tanulási sebesség módosítását, vagy más hiperparaméterek finomítását.
Felügyelet tanulás alkalmazási területei
- Képfelismerés: A felügyelt tanulás az egyik legfontosabb módszer képfelismerési feladatokban. Ilyen például az arcfelismerés, ahol a modell képes megtanulni, hogy egy adott kép egy adott személyt ábrázol-e.
- Természetes nyelv feldolgozása (NLP): A felügyelt tanulást gyakran használják szövegek osztályozására és feldol
gozására, például e-mailek spamként való azonosítására, vagy érzelmi elemzésre, ahol a modell megtanulja, hogy egy szöveg pozitív vagy negatív hangvételű-e.
Orvosi diagnosztika: Az orvosi területen felügyelt tanulási algoritmusokat használnak különböző betegségek előrejelzésére vagy diagnosztizálására, például MRI-képek elemzése során.
Pénzügyi előrejelzések: A felügyelt tanulás segíthet pénzügyi piaci trendek előrejelzésében, hitelkockázat elemzésben, vagy csalások felismerésében.
Hangfelismerés: A beszédfelismerő rendszerek felügyelt tanulást használnak a hangminták címkézett adatok alapján történő felismerésére és osztályozására, például digitális asszisztensekben, mint a Siri vagy Alexa.
Előnyök és kihívások
Előnyök:
- Magas pontosság: A felügyelt tanulás általában nagyon pontos, mivel a modell explicit bemeneti és kimeneti párokkal tanul.
- Könnyebb értelmezhetőség: A címkézett adatok révén a modell által megtanult kapcsolatokat könnyebb értelmezni és ellenőrizni, mint a felügyelet nélküli tanulásnál.
- Széleskörű alkalmazhatóság: A felügyelt tanulás számos területen alkalmazható, beleértve a képfelismerést, szövegelemzést, és a pénzügyi előrejelzést.
Kihívások:
- Címkézés nehézségei: Az adatok címkézése idő- és erőforrás-igényes lehet, különösen nagy adatkészletek esetén.
- Túlillesztés: A túlillesztés akkor fordul elő, ha a modell túl jól megtanulja a tréning adatokat, de rosszul teljesít új adatokon. Ezt a problémát gyakran nehéz kezelni, különösen, ha az adatok komplexek vagy zajosak.
- Nagy adatigény: A felügyelt tanulás esetén nagy mennyiségű címkézett adatra van szükség a modell hatékony tanításához, ami egyes területeken nehézséget okozhat.
Összegzés
A felügyelt tanulás egy erőteljes gépi tanulási megközelítés, amely címkézett adatokkal dolgozik, hogy előrejelzéseket készítsen vagy adatokat osztályozzon. Ez a módszer rendkívül széles körben alkalmazható számos iparágban, és kulcsfontosságú technológia a modern mesterséges intelligencia rendszerekben.
Fordítások
- felügyelt tanulás - Értelmező szótár (MEK)
- felügyelt tanulás - Etimológiai szótár (UMIL)
- felügyelt tanulás - Szótár.net (hu-hu)
- felügyelt tanulás - DeepL (hu-de)
- felügyelt tanulás - Яндекс (hu-ru)
- felügyelt tanulás - Google (hu-en)
- felügyelt tanulás - Helyesírási szótár (MTA)
- felügyelt tanulás - Wikidata
- felügyelt tanulás - Wikipédia (magyar)