factor analysis
Megjelenés
Főnév
factor analysis (tsz. factor analysises)
- (informatika) Factor analysis – magyarul: faktorelemzés – egy statisztikai dimenziócsökkentő technika, amelyet arra használnak, hogy nagy számú megfigyelt változót (pl. kérdőírtételek, mérési értékek) kevesebb számú, rejtett (nem megfigyelhető) változóval, azaz faktorokkal magyarázzanak. A cél az, hogy a változók közötti korrelációkat néhány közös tényezőre (faktorra) vezessük vissza.
🧠 1. Alapötlet
A faktorelemzés feltételezi, hogy az adathalmaz mögött rejtett szerkezet van: a megfigyelt változók nem függetlenek, hanem néhány közös, nem megfigyelhető tényező hat rájuk.
🧮 2. Matematikai modell
Legyen:
Ahol:
- : megfigyelt változók vektora (pl. kérdések válaszai)
- : változók átlaga
- : faktorterhelési mátrix – azt mutatja meg, melyik változó milyen mértékben függ az adott faktortól
- : faktorok vektora – rejtett (latent) változók
- : hiba vagy egyedi variancia
📊 3. Cél
A cél az, hogy:
- Csökkentsük a dimenziót (sok változó → kevés faktor)
- Feltárjuk az adatszerkezetet
- Jobban értelmezhető összefüggéseket találjunk
🧩 4. Faktor típusok
- Közös faktorok (common factors) – több változóra is hatnak
- Egyedi faktorok (unique factors) – csak egy változóra hatnak (pl. mérési hiba)
📈 5. Különbség más technikáktól
| Módszer | Cél | Latens változók | Variancia magyarázata |
|---|---|---|---|
| PCA | Variancia megőrzése | ❌ | Teljes varianciát nézi |
| FA | Közös szerkezet feltárása | ✅ | Csak a közös varianciát nézi |
| NMF | Alkotórészek keresése | ✅ | Nemnegatív komponensek |
📊 6. Alkalmazási területek
- 🧪 Pszichológia: kérdőívek mögötti dimenziók (pl. intelligenciafaktorok)
- 🏥 Egészségügy: tünetek közötti mintázatok
- 📈 Marketing: fogyasztói preferenciák feltárása
- 📚 Társadalomtudományok: attitűdök, vélemények csoportosítása
⚙️ 7. Fő lépések faktorelemzéskor
- Kovariancia / korrelációs mátrix számítása
- Faktorok számának meghatározása
- Scree-plot
- Eigenvalue > 1
- Faktorok becslése (pl. Maximum likelihood, Principal axis factoring)
- Faktorterhelések vizsgálata
- Faktorforgatás – az értelmezhetőség növelésére (pl. Varimax, Oblimin)
- Eredmények értelmezése – mely változók mely faktorhoz tartoznak
🐍 8. Python példa (factor_analyzer könyvtárral)
from factor_analyzer import FactorAnalyzer
import pandas as pd
df = pd.read_csv("adat.csv")
fa = FactorAnalyzer(n_factors=3, rotation="varimax")
fa.fit(df)
loadings = fa.loadings_
print(loadings)
📊 9. Scree plot – faktorok számának meghatározása
from factor_analyzer.factor_analyzer import calculate_bartlett_sphericity, calculate_kmo
# Scree plot
from matplotlib import pyplot as plt
ev, v = fa.get_eigenvalues()
plt.plot(range(1, len(ev)+1), ev, marker='o')
plt.xlabel('Faktorok száma')
plt.ylabel('Sajátérték')
plt.title('Scree plot')
plt.grid()
plt.show()
🧾 10. Összefoglalás
A faktorelemzés (Factor Analysis):
- Egy felügyelet nélküli statisztikai módszer
- Célja, hogy sok megfigyelt változót kevesebb, rejtett faktorral magyarázzon
- Hasznos dimenziócsökkentésre, mintázatkeresésre, kérdőívelemzésre
- Különbözik PCA-tól: csak a közös varianciát veszi figyelembe
- factor analysis - Szótár.net (en-hu)
- factor analysis - Sztaki (en-hu)
- factor analysis - Merriam–Webster
- factor analysis - Cambridge
- factor analysis - WordNet
- factor analysis - Яндекс (en-ru)
- factor analysis - Google (en-hu)
- factor analysis - Wikidata
- factor analysis - Wikipédia (angol)