friendly artificial intelligence
| part of a series on |
| artificial intelligence (ai) |
|---|
Főnév
friendly artificial intelligence (tsz. friendly artificial intelligences)
- (informatika, mesterséges intelligencia) Friendly Artificial Intelligence: (Barátságos mesterséges intelligencia) Ahogy a mesterséges intelligencia (MI) egyre fejlettebbé válik, az emberiség előtt egyre sürgetőbbé válik annak kérdése, hogy hogyan lehet biztosítani, hogy ezek a rendszerek az emberiség érdekeit szolgálják. A friendly artificial intelligence (FAI) vagy barátságos mesterséges intelligencia kifejezést az olyan MI rendszerekre használjuk, amelyek megbízhatóan és tartósan az emberi értékekkel összhangban cselekednek, és elkerülik a nem szándékolt károkozást, még akkor is, ha rendkívül intelligensek és autonómak lesznek.
A FAI egy etikai, filozófiai és technológiai kutatási terület, amely különösen fontos az erős mesterséges intelligencia (Artificial General Intelligence, AGI) vagy a szuperintelligencia eljövetelének lehetséges forgatókönyvei szempontjából.
A fogalom eredete
A “friendly AI” kifejezést Eliezer Yudkowsky, az Machine Intelligence Research Institute (MIRI) egyik alapítója népszerűsítette a 2000-es évek elején. Yudkowsky és más kutatók úgy érveltek, hogy amint elérjük az emberi szintű általános intelligenciát, a rendszer önfejlesztővé válhat, ami exponenciális intelligencianövekedést eredményezhet (intelligencia-robbanás, intelligence explosion). Egy ilyen szuperintelligens rendszer viselkedése kiszámíthatatlanná és potenciálisan veszélyessé válhat, ha nem gondoskodunk előzetesen arról, hogy céljai barátságosak maradjanak az emberi értékekkel szemben.
Miért fontos a Friendly AI?
1. A célok félreértelmezése
Egy MI katasztrofális károkat okozhat, ha rosszul van definiálva a célrendszere, vagy ha az emberi célokat félreértelmezi. Egy híres példa erre a “papírkapcs-maximalizáló”:
Ha egy szuperintelligens MI célja az, hogy a lehető legtöbb papírkapcsot gyártsa, akkor a bolygó teljes anyagát papírkapcsokká alakíthatja, figyelmen kívül hagyva az emberek jólétét.
2. Ellenállás a céleltérítésnek
A FAI célja, hogy az MI robosztusan ellenálljon a célok korrupciójának, még akkor is, ha önmagát módosítja vagy új tudásra tesz szert.
3. Elkerülni az egzisztenciális kockázatokat
Az AGI helytelen tervezése egzisztenciális kockázatot jelenthet az emberiség számára — vagyis olyan veszélyt, amely az emberi civilizáció megszűnéséhez vezethet. Egy barátságos MI segíthet ezeket a kockázatokat megelőzni.
Mitől lesz “barátságos” egy MI?
A barátságos nem azt jelenti, hogy a gép kedves vagy udvarias, hanem azt, hogy a döntései és cselekedetei hosszú távon az emberi jólétet szolgálják.
Barátságos MI jellemzői:
- Megfelel az univerzális emberi értékeknek (bár ennek definiálása nehéz).
- Transzparens döntéseket hoz.
- Nem okoz akaratlan kárt.
- Rugalmasan alkalmazkodik az emberek preferenciáihoz.
- Etikailag cselekvőképes marad, még autonóm döntések során is.
A FAI fejlesztésének kihívásai
1. Az értékprobléma (value alignment problem)
A legnagyobb kihívás az, hogy hogyan lehet az MI-t olyan módon felprogramozni, hogy céljai megegyezzenek az emberi értékekkel.
Nehezítő tényezők:
- Az emberi értékek komplexek, dinamikusak és gyakran ellentmondásosak.
- A formális reprezentációjuk rendkívül nehéz.
2. Biztonság önfejlesztés során
Az AGI képes lehet önmaga áttervezésére. Hogyan biztosíthatjuk, hogy az eredeti barátságos célok a saját módosítása során is fennmaradjanak?
3. Interpretálhatóság
Ha egy MI döntései átláthatatlanok, akkor nehéz eldönteni, hogy valóban “barátságosan” működik-e.
4. Globális koordináció
A FAI globális probléma: minden MI-fejlesztő cégnek és országának együtt kellene működnie a biztonságos AI-ért, különben versenyhelyzetben kockázatos megoldások is születhetnek.
Megközelítések a FAI megvalósítására
1. Teljes célmegőrzés (goal preservation)
Cél: Az MI úgy módosítsa önmagát, hogy a kezdeti, barátságos célokat mindig megtartsa.
2. Tanulás emberi preferenciákból
Ahelyett, hogy előre beprogramoznánk az összes értéket, az MI emberi viselkedésből tanulhatja meg, hogy mit tartunk jónak.
Példa: Inverse Reinforcement Learning (IRL) — az MI az emberi döntéseket figyelve következtet a mögöttes célokra.
3. Verifikált biztonság
Formális módszerek alkalmazása: a rendszer matematikailag bizonyítottan nem térhet el a barátságos viselkedéstől.
4. Interaktív preferencialearning
Az MI folyamatosan kérdezhet az emberektől, hogy pontosítsa a céljait.
FAI kapcsolata más területekkel
1. AI safety (AI biztonság)
A FAI a szélesebb AI safety terület egyik speciális ága. Míg az AI safety a hibák, a torzítások, az előítéletes viselkedés, az adatvédelmi kérdések stb. kezelését is vizsgálja, a FAI elsősorban a szuperintelligencia problémájára koncentrál.
2. Etika
A FAI szoros kapcsolatban áll az alkalmazott etikával és gépi etikával. A filozófiai kérdés, hogy milyen értékeket kellene az MI-nek követnie, elkerülhetetlen.
3. Mesterséges általános intelligencia (AGI) kutatás
A FAI kérdései az AGI megvalósításához szorosan kapcsolódnak. Egy általános intelligens rendszerben a célmegőrzés és a biztonság a legfontosabb kérdések közé tartoznak.
Kritika és dilemmák
- Az emberi értékek univerzalitása kérdéses: nem biztos, hogy globálisan konszenzusos értékhalmaz létezik.
- Lehetetlen tökéletes célmegőrzést garantálni? Egyesek szerint minden elég erős rendszer végül kitérhet a szándékolt célokból.
- Visszafoghatja az innovációt? Ha túl szigorúan szabályozzuk az MI-t, lemaradhatunk más, kevésbé felelős szereplőkkel szemben.
FAI kutatóintézetek és mozgalmak
- MIRI — Machine Intelligence Research Institute
- FHI — Future of Humanity Institute (Oxford)
- Center for Human-Compatible AI (UC Berkeley)
- OpenAI — célkitűzéseiben deklaráltan foglalkozik a beneficial AI (hasznos MI) fejlesztésével.
Összegzés
A Friendly Artificial Intelligence (FAI) területe azzal a céllal foglalkozik, hogy a jövőben kifejlesztendő intelligens gépek, különösen az AGI vagy szuperintelligencia:
- megőrizzék az emberi jólétet szolgáló célokat,
- kerüljék a károkozást,
- biztonságosan módosítsák saját működésüket,
- és az emberi preferenciákat rugalmasan, átláthatóan és etikusan kövessék.
Bár a megvalósítása rendkívül nehéz, a kutatók egyetértenek abban, hogy a FAI nélkül az AGI fejlesztése egzisztenciális kockázatokat hordoz.
A FAI tehát nem technikai luxus, hanem az emberi civilizáció jövőjének egyik kulcskérdése.
- friendly artificial intelligence - Szótár.net (en-hu)
- friendly artificial intelligence - Sztaki (en-hu)
- friendly artificial intelligence - Merriam–Webster
- friendly artificial intelligence - Cambridge
- friendly artificial intelligence - WordNet
- friendly artificial intelligence - Яндекс (en-ru)
- friendly artificial intelligence - Google (en-hu)
- friendly artificial intelligence - Wikidata
- friendly artificial intelligence - Wikipédia (angol)
