Principalkomponentanalys
Wikipedia
PCA står för principal component analysis och strävar efter att hitta strukturer i data. PCA är ett verktyg för att hitta lågdimensionella samband i högdimensionella rum.
Låt x vara en n-dimensionell vektor med attribut, till exempel från ett bildigenkänningsproblem. x skulle kunna bestå av tre färgvärden för en pixel. Samla N > n exempel på x, till exempel från alla pixlar i en given bild.
Beräkna medelvärdet μ = E(x). Utför korrelationsanalys, dvs beräkna R så att cov(X) = R.
PCA är nu att undersöka vilken struktur R har, dvs i vilka riktningar data varierar mest. De riktningarna kallas principial axis.
Den ursprungliga datan projiceras nu på dessa axlar, och värdet kallas principalkomponenter(?).
PCA kan beräknas med hjälp av singulärvärdesdekomposition av R (snabbt) eller på de medelvärdesjusterade data direkt (mindre snabbt).