Ugrás a tartalomhoz

standard error

A Wikiszótárból, a nyitott szótárból


Főnév

standard error (tsz. standard errors)

  1. (informatika) A standard error (magyarul: standard hiba vagy mintavételi hiba) egy statisztikai mérőszám, amely azt fejezi ki, hogy mekkora a véletlen ingadozás mértéke, amikor egy populációból vett minták alapján becslünk valamilyen jellemzőt – például az átlagot vagy arányt.

Míg a szórás azt mutatja meg, hogy az adatok mennyire szóródnak egy adott minta körül, a standard error azt jelzi, hogy a mintákból számolt statisztika (pl. mintaátlag) mennyire változik mintáról mintára.



1. Mit jelent pontosan a standard error?

A standard error annak a valószínűségi eloszlásnak a szórása, amit a mintastatisztika követ – tehát nem az adatok szórásáról van szó, hanem a becsült mennyiség bizonytalanságáról.

Például:

  • Ha egy populációból 100 mintát veszünk, és mindegyiknek kiszámoljuk az átlagát, akkor ezek az átlagok nem lesznek egyformák.
  • Ezek az átlagok egy eloszlást alkotnak.
  • Ennek az eloszlásnak a szórását nevezzük standard error-nak.



2. A standard error képlete

a) Mintaátlag standard hibája (standard error of the mean):

ahol:

  • : minta szórása
  • : minta elemszáma
  • : mintaátlag

Minél nagyobb a minta, annál kisebb a standard hiba → pontosabb becslés.



3. Példa számítással

Tegyük fel, hogy egy tanulócsoportból veszünk egy mintát:

  • Minta elemszáma:
  • Minta szórása:

A standard error:

Ez azt jelenti, hogy a mintaátlag várhatóan ±2 egységgel térhet el a valódi populációátlagtól.



4. Különbség a szórás és a standard error között

Fogalom Jelentés
Szórás (σ, s) Az egyes értékek átlagtól való átlagos eltérése
Standard error (SE) A statisztika (pl. átlag) ingadozása különböző minták között



5. Miért fontos?

a) Konfidenciaintervallumok számításához

Pl. 95%-os konfidenciaintervallum mintaátlagra:

Ez ad egy tartományt, ahol valószínűleg (95% eséllyel) ott van a valódi populációátlag.

b) Hipotézisvizsgálatban

Tesztek (pl. t-teszt, z-teszt) alapja a SE, mivel a szignifikancia és p-érték kiszámítása is rajta alapszik.



6. További típusok

A standard error nemcsak az átlagra vonatkozhat. Vannak más változatai is:

Becsült mennyiség Standard error képlete
Átlag (mean)
Arány (proportion)
Két átlag különbsége
Regressziós együttható SE a regressziós modellből számítódik ki



7. Standard error és mintavétel

A standard error alapvetően a mintavételi ingadozás mértéke.

Például: ha egy ország átlagjövedelmét akarjuk becsülni, és több mintát veszünk, ezek eltérnek, de minél nagyobb a mintánk, annál kisebb a SE → tehát egyre pontosabb lesz a becslésünk.



8. C++ példa standard error számítására

#include <iostream>
#include <vector>
#include <cmath>

double mean(const std::vector<double>& data) {
    double sum = 0;
    for (auto x : data)
        sum += x;
    return sum / data.size();
}

double standardDeviation(const std::vector<double>& data) {
    double m = mean(data);
    double sumSq = 0;
    for (auto x : data)
        sumSq += (x - m) * (x - m);
    return std::sqrt(sumSq / (data.size() - 1));
}

double standardError(const std::vector<double>& data) {
    return standardDeviation(data) / std::sqrt(data.size());
}

int main() {
    std::vector<double> minta = {12.5, 13.2, 11.9, 14.0, 13.7};

    std::cout << "Standard error: " << standardError(minta) << std::endl;
    return 0;
}

9. Gyakorlati tanácsok

  • Minél nagyobb a mintaméret, annál pontosabb a becslés (kisebb SE)
  • Ne keverjük össze a szórással – az SE a becslés pontosságát jelzi, nem az adatok szóródását
  • A standard error nem hiba, hanem egy statisztikai mutató – gyakran “hibaoszlopként” szerepel grafikonokon



10. Összefoglalás

A standard error (SE) a mintákból számított statisztikák megbízhatóságát, stabilitását méri. Kulcsszerepet játszik:

  • Statisztikai becslések értelmezésében
  • Konfidenciaintervallumok számításában
  • Hipotézisvizsgálatokban
  • Kísérleti eredmények értékelésében

A gyakorlatban: ha kicsi a SE, akkor a mintastatisztika jó becslés a populációra.