Ugrás a tartalomhoz

penalty method

A Wikiszótárból, a nyitott szótárból


Főnév

penalty method (tsz. penalty methods)

  1. (informatika) A penalty method egy numerikus optimalizálási technika, amit egyenlőségi vagy egyenlőtlenségi feltételekkel korlátozott optimalizálási feladatok megoldására használnak. A módszer lényege, hogy a feltételeket be nem tartó megoldásokat megbüntetjük egy kiegészítő taggal az optimalizálandó célfüggvényben.



🧩 Alapprobléma

Általános formájú korlátozott optimalizálási feladat:

  • : célfüggvény
  • : egyenlőtlenségi feltételek
  • : egyenlőségi feltételek



🎯 Penalty módszer célja

A korlátozott problémát egy korlátozás nélküli problémává alakítja át az alábbi formában:

ahol:

  • : büntető paraméter,
  • : büntetőfüggvény, amely nagy lesz, ha megszegi a feltételeket.



📐 Tipikus büntetőfüggvények

Négyzetes büntetőtag (quadratic penalty):

  • Egyenlőség: megszegése négyzetesen büntetve.
  • Egyenlőtlenség: ha , akkor sérti a feltételt.



🔁 Algoritmus vázlat

  1. Válassz kezdőértéket és büntetőparamétert .

  2. Oldd meg az:

    feladatot.

  3. Növeld (pl. ).

  4. Ismételd, amíg a feltételek elég jól teljesülnek.



📊 Előnyök

  • Átalakítja a nehéz korlátozott problémát könnyebben kezelhető, korlátozás nélküli formára.
  • Használható meglévő numerikus optimalizálókkal.

⚠️ Hátrányok

  • Nagy numerikus instabilitás.
  • Lassú konvergencia lehet.
  • A megoldás minősége érzékeny a büntetőtag formájára és skálájára.



🧠 Kapcsolódó módszerek

Módszer Jellemző
Penalty method Feltételek megsértéséért büntetést adunk a célfüggvényhez.
Barrier method Feltételek megsértését lehetetlenné tesszük (pl. log-gátfüggvények).
Augmented Lagrangian Kombinálja a penalty és Lagrange-módszert, jobb numerikus stabilitás.



🧪 Egyszerű példa

Minimalizáljuk:

Penalty függvény:

  • Ha , nincs büntetés.
  • Ha , a célfüggvény nő a szabályszegés miatt.