Chebyshev's inequality
Főnév
Chebyshev's inequality (tsz. Chebyshev's inequalities)
- (informatika) A Chebyshev-egyenlőtlenség egy valószínűségszámításban és statisztikában alkalmazott, általános érvényű eredmény, amely megadja, hogy egy valószínűségi változó értékei milyen arányban térhetnek el az átlaguktól. Fontossága abban rejlik, hogy nagyon kevés feltételt követel meg a valószínűségi változóra nézve – mindössze azt, hogy a szórás (vagy variancia) véges legyen.
1. Alapfogalmak
Mielőtt rátérnénk az egyenlőtlenségre, tisztázzuk a szükséges fogalmakat:
- Valószínűségi változó (X): Olyan függvény, amely a valószínűségi tér minden eleméhez egy valós számot rendel.
- Várható érték (E[X] vagy μ): A valószínűségi változó súlyozott átlaga.
- Szórásnégyzet (Var(X) vagy σ²): A valószínűségi változó várható értéktől való eltérésének négyzetének átlaga.
- Szórás (σ): A szórásnégyzet négyzetgyöke, a változékonyság mértéke.
2. Az egyenlőtlenség állítása
A Chebyshev-egyenlőtlenség általános alakja:
Ha valószínűségi változó várható értéke , szórása , akkor bármely esetén:
Ekvivalensen:
3. Mit jelent ez intuitívan?
Az egyenlőtlenség azt mondja ki, hogy egy valószínűségi változó értékei jórészt az átlag körül helyezkednek el, ha a szórás véges. Például:
- Legalább a minta 75%-a az átlagtól legfeljebb 2 szórásnyira lesz (k = 2).
- Legalább 88,9%-a az átlagtól legfeljebb 3 szórásnyira lesz (k = 3).
- Legalább 96%-a az átlagtól legfeljebb 5 szórásnyira lesz (k = 5).
4. Alkalmazhatóság
A Chebyshev-egyenlőtlenség univerzális: nem igényli, hogy az eloszlás normális, szimmetrikus vagy bármilyen speciális alakú legyen. Használható például:
- Kis minták esetén, ahol nem ismert az eloszlás.
- Adatok megbízhatóságának durva becslésére.
- Konfidenciaintervallumok alsó korlátainak becslésére.
- Elméleti levezetések során az elméleti garanciák biztosítására.
5. Bizonyítás vázlata
A bizonyítás a Markov-egyenlőtlenség felhasználásával történik:
A Markov-egyenlőtlenség szerint ha , akkor:
A Chebyshev-egyenlőtlenség esetén , ami mindig nemnegatív, és . Ekkor:
6. Példa
Tegyük fel, hogy egy dolgozat átlaga 60 pont, szórása 10 pont. Ekkor:
- Legalább 75% a tanulók közül 40 és 80 pont között van (k = 2).
- Legalább 89% 30 és 90 pont között van (k = 3).
Ez még akkor is igaz, ha a pontszámok nem normális eloszlást követnek!
7. Korlátai
- Laza korlát: A valóságban sok eloszlás (pl. normális) esetén sokkal szigorúbb arányok adódnak.
- Nem szimmetrikus eloszlásoknál kevésbé informatív.
- Csak szórásra alapoz: Ha a szórás nagy, az intervallum túl széles lehet.
8. Kapcsolódó egyenlőtlenségek
- Markov-egyenlőtlenség: Általánosabb, de még lazább.
- Chernoff-egyenlőtlenség, Hoeffding-egyenlőtlenség: Szűkebb korlátokat adnak specifikus feltételek mellett.
- Normális eloszlás esetén az ún. 68-95-99.7 szabály pontosabb arányokat ad (pl. 2σ-n belül 95%).
9. Történeti háttér
Az egyenlőtlenséget Pafnuty Lvovich Chebyshev (1821–1894), orosz matematikus bizonyította. A valószínűségszámítás egyik alapkövének számít, és később a gyenge törvény és a nagy számok törvénye is épült rá.
10. Összegzés
A Chebyshev-egyenlőtlenség:
- Egyszerű, általános, feltételekben szegény.
- Biztosítja, hogy a szórás alapján megbecsülhetjük, mennyire „szóródnak szét” az adatok.
- Akkor különösen hasznos, ha nem tudjuk az eloszlás alakját.
- Hátránya, hogy gyakran túlságosan konzervatív becslést ad.
TL;DR
A Chebyshev-egyenlőtlenség garantálja, hogy egy valószínűségi változó értékeinek többsége az átlagtól egy adott számú szórásnyi távolságon belül van. Bármilyen eloszlás esetén alkalmazható, ha a szórás véges, de általában laza korlátokat ad.
- Chebyshev's inequality - Szótár.net (en-hu)
- Chebyshev's inequality - Sztaki (en-hu)
- Chebyshev's inequality - Merriam–Webster
- Chebyshev's inequality - Cambridge
- Chebyshev's inequality - WordNet
- Chebyshev's inequality - Яндекс (en-ru)
- Chebyshev's inequality - Google (en-hu)
- Chebyshev's inequality - Wikidata
- Chebyshev's inequality - Wikipédia (angol)