Slovník | Vyhledávání | Mapa webu
 
Analýza a hodnocení biologických datVícerozměrné metody pro analýzu a klasifikaci dat Pokročilejší metody extrakce proměnných Analýza nezávislých komponent (ICA) Výpočetní strategie analýzy nezávislých komponent

Logo Matematická biologie

Koeficient špičatosti

Koeficient špičatosti (angl. kurtosis) je klasickou mírou statistické nenormality a jako kumulant 4. řádu je pro náhodnou veličinu s, za předpokladu nulové střední hodnoty, definován vztahem

(6)

Protože druhý člen na pravé straně výrazu reprezentuje rozptyl náhodné veličiny , zjednodušuje se definiční výraz pro data standardizovaná vůči směrodatné odchylce na

(7)

To znamená, že koeficient špičatosti je v podstatě dán čtvrtým momentem náhodné veličiny. Pro náhodné veličiny s normálním rozdělením je koeficient špičatosti roven nule. Pro většinu negaussovských náhodných veličin (ale bohužel ne pro všechny, což může být považováno za nevýhodu, protože tato rozdělení jsou algoritmem analýzy formálně vyloučena) je různý od nuly. Může být kladný i záporný, proto se za typickou míru statistické nenormality používá jeho absolutní hodnota, resp. jeho druhá mocnina.

Výhodou použití koeficientu špičatosti pro odhad zdrojových komponent je jeho relativně jednoduchý a tím i rychlý výpočet, teoretické zázemí jeho použití je rovněž příjemně jednoduché díky jeho linearitě. Platí totiž, že

(8)

a

(9)

kde je konstanta.

Odhad skryté zdrojové veličiny pak probíhá tak, že hledáme takové koeficienty transformačního vektoru wi, pro které má koeficient špičatosti veličiny maximální hodnotu. Způsob hledání extrému závisí na použitém kritériu a tím i na vlastnostech a tvaru kriteriální funkce. V  případě koeficientu špičatosti lze vystačit s gradientní či Newtonovou metodou.

Nevýhodou použití koeficientu špičatosti je, kromě již zmíněné diskriminace několika málo nenormálních rozdělení s nulovým koeficientem špičatosti, poměrně malá robustnost vůči odlehlým hodnotám pozorovaných veličin. To znamená, pokud měření obsahují hodnoty výrazně se odlišující od běžných, potom i zdrojové veličiny budou pravděpodobně odhadnuty chybně.

 
vytvořil Institut biostatistiky a analýz Lékařské fakulty Masarykovy univerzity