Rozklad na singulární hodnoty
Každou matici složenou z reálných dat lze rozdělit na součin tří matic speciálních vlastností. Tento postup se nazývá rozklad na singulární hodnoty (SVD, singular value decomposition). Datovou matice lze rozdělit podle vztahu:
pro .
|
Matice U a V jsou ortogonální a normované (ortonormální). To znamená, že když matici U nebo V vynásobíme danou transponovanou maticí, získáme matici jednotkovou. Dále matice U je složena z vlastních (charakteristických) vektorů čtvercové matice DDT a matice V z vlastních vektorů matice DTD.
(18)
|
Matice je typu k x k a její diagonála je tvořena singulárními hodnotami, které jsou na hlavní diagonále uspořádány podle klesající velikosti.
(19)
|
Singulární hodnoty nesou informaci o významnosti jednotlivých sloupců matice U (skórů – scores) a odpovídajících sloupců matice V (zátěží – loadings). Singulární hodnoty matice jsou rovny odmocninám vlastních čísel matice DDT tedy DTD.
Provedeme-li rozklad na singulární hodnoty na transponované matici D (tj. DT), dostaneme výsledné matice V, U a příliš velké a obsahující velké množství nesmyslných čísel nebo nul. Proto se doporučuje původní matici orientovat tak, jak je uvedeno ve vztahu (17).