Ugrás a tartalomhoz

factor analysis

A Wikiszótárból, a nyitott szótárból


Főnév

factor analysis (tsz. factor analysises)

  1. (informatika) Factor analysis – magyarul: faktorelemzés – egy statisztikai dimenziócsökkentő technika, amelyet arra használnak, hogy nagy számú megfigyelt változót (pl. kérdőírtételek, mérési értékek) kevesebb számú, rejtett (nem megfigyelhető) változóval, azaz faktorokkal magyarázzanak. A cél az, hogy a változók közötti korrelációkat néhány közös tényezőre (faktorra) vezessük vissza.



🧠 1. Alapötlet

A faktorelemzés feltételezi, hogy az adathalmaz mögött rejtett szerkezet van: a megfigyelt változók nem függetlenek, hanem néhány közös, nem megfigyelhető tényező hat rájuk.


🧮 2. Matematikai modell

Legyen:

Ahol:

  • : megfigyelt változók vektora (pl. kérdések válaszai)
  • : változók átlaga
  • : faktorterhelési mátrix – azt mutatja meg, melyik változó milyen mértékben függ az adott faktortól
  • : faktorok vektora – rejtett (latent) változók
  • : hiba vagy egyedi variancia



📊 3. Cél

A cél az, hogy:

  • Csökkentsük a dimenziót (sok változó → kevés faktor)
  • Feltárjuk az adatszerkezetet
  • Jobban értelmezhető összefüggéseket találjunk



🧩 4. Faktor típusok

  • Közös faktorok (common factors) – több változóra is hatnak
  • Egyedi faktorok (unique factors) – csak egy változóra hatnak (pl. mérési hiba)



📈 5. Különbség más technikáktól

Módszer Cél Latens változók Variancia magyarázata
PCA Variancia megőrzése Teljes varianciát nézi
FA Közös szerkezet feltárása Csak a közös varianciát nézi
NMF Alkotórészek keresése Nemnegatív komponensek



📊 6. Alkalmazási területek

  • 🧪 Pszichológia: kérdőívek mögötti dimenziók (pl. intelligenciafaktorok)
  • 🏥 Egészségügy: tünetek közötti mintázatok
  • 📈 Marketing: fogyasztói preferenciák feltárása
  • 📚 Társadalomtudományok: attitűdök, vélemények csoportosítása



⚙️ 7. Fő lépések faktorelemzéskor

  1. Kovariancia / korrelációs mátrix számítása
  2. Faktorok számának meghatározása
    • Scree-plot
    • Eigenvalue > 1
  3. Faktorok becslése (pl. Maximum likelihood, Principal axis factoring)
  4. Faktorterhelések vizsgálata
  5. Faktorforgatás – az értelmezhetőség növelésére (pl. Varimax, Oblimin)
  6. Eredmények értelmezése – mely változók mely faktorhoz tartoznak



🐍 8. Python példa (factor_analyzer könyvtárral)

from factor_analyzer import FactorAnalyzer
import pandas as pd

df = pd.read_csv("adat.csv")

fa = FactorAnalyzer(n_factors=3, rotation="varimax")
fa.fit(df)

loadings = fa.loadings_
print(loadings)

📊 9. Scree plot – faktorok számának meghatározása

from factor_analyzer.factor_analyzer import calculate_bartlett_sphericity, calculate_kmo

# Scree plot
from matplotlib import pyplot as plt
ev, v = fa.get_eigenvalues()
plt.plot(range(1, len(ev)+1), ev, marker='o')
plt.xlabel('Faktorok száma')
plt.ylabel('Sajátérték')
plt.title('Scree plot')
plt.grid()
plt.show()

🧾 10. Összefoglalás

A faktorelemzés (Factor Analysis):

  • Egy felügyelet nélküli statisztikai módszer
  • Célja, hogy sok megfigyelt változót kevesebb, rejtett faktorral magyarázzon
  • Hasznos dimenziócsökkentésre, mintázatkeresésre, kérdőívelemzésre
  • Különbözik PCA-tól: csak a közös varianciát veszi figyelembe