penalty method
Megjelenés
Főnév
penalty method (tsz. penalty methods)
- (informatika) A penalty method egy numerikus optimalizálási technika, amit egyenlőségi vagy egyenlőtlenségi feltételekkel korlátozott optimalizálási feladatok megoldására használnak. A módszer lényege, hogy a feltételeket be nem tartó megoldásokat megbüntetjük egy kiegészítő taggal az optimalizálandó célfüggvényben.
🧩 Alapprobléma
Általános formájú korlátozott optimalizálási feladat:
- : célfüggvény
- : egyenlőtlenségi feltételek
- : egyenlőségi feltételek
🎯 Penalty módszer célja
A korlátozott problémát egy korlátozás nélküli problémává alakítja át az alábbi formában:
ahol:
- : büntető paraméter,
- : büntetőfüggvény, amely nagy lesz, ha megszegi a feltételeket.
📐 Tipikus büntetőfüggvények
Négyzetes büntetőtag (quadratic penalty):
- Egyenlőség: megszegése négyzetesen büntetve.
- Egyenlőtlenség: ha , akkor sérti a feltételt.
🔁 Algoritmus vázlat
Válassz kezdőértéket és büntetőparamétert .
Oldd meg az:
feladatot.
Növeld (pl. ).
Ismételd, amíg a feltételek elég jól teljesülnek.
📊 Előnyök
- Átalakítja a nehéz korlátozott problémát könnyebben kezelhető, korlátozás nélküli formára.
- Használható meglévő numerikus optimalizálókkal.
⚠️ Hátrányok
- Nagy → numerikus instabilitás.
- Lassú konvergencia lehet.
- A megoldás minősége érzékeny a büntetőtag formájára és skálájára.
🧠 Kapcsolódó módszerek
| Módszer | Jellemző |
|---|---|
| Penalty method | Feltételek megsértéséért büntetést adunk a célfüggvényhez. |
| Barrier method | Feltételek megsértését lehetetlenné tesszük (pl. log-gátfüggvények). |
| Augmented Lagrangian | Kombinálja a penalty és Lagrange-módszert, jobb numerikus stabilitás. |
🧪 Egyszerű példa
Minimalizáljuk:
Penalty függvény:
- Ha , nincs büntetés.
- Ha , a célfüggvény nő a szabályszegés miatt.
- penalty method - Szótár.net (en-hu)
- penalty method - Sztaki (en-hu)
- penalty method - Merriam–Webster
- penalty method - Cambridge
- penalty method - WordNet
- penalty method - Яндекс (en-ru)
- penalty method - Google (en-hu)
- penalty method - Wikidata
- penalty method - Wikipédia (angol)