Slovník | Vyhledávání | Mapa webu
 
Analýza a hodnocení biologických datVícerozměrné metody pro analýzu a klasifikaci dat Podobnosti a vzdálenosti ve vícerozměrném prostoru Metriky pro určení vzdálenosti a podobnosti mezi dvěma vektory Metriky pro určení podobnosti mezi dvěma obrazy s kvalitativní-mi hodnotami souřadnic

Logo Matematická biologie

Metriky pro určení podobnosti mezi dvěma obrazy s kvalitativní-mi hodnotami souřadnic

V praxi se pro vektory s kvantitativními hodnotami (spojitými i diskrétními) používají především následující míry podobnosti.

Skalární součin je pro dva sloupcové vektory x1 a x2 definován v euklidovském prostoru vztahem

.

(29)

Ve většině případů je skalární součin jako míra podobnosti použit pro vektory x1 a x2 o stejné délce (modulu), např. a. V těch případech jsou horní, resp. dolní mez skalárního součinu , resp.  a jeho hodnoty v tom případě závisí výhradně na úhlu, který oba vektory svírají. Hodnoty skalární součin nabývá, pokud oba vektory svírají nulový úhel, hodnoty , pokud je mezi nimi úhel 180° a nulové hodnoty, pokud jsou oba vektory na sebe kolmé. Z dosud uvedeného plyne, že skalární součin je invariantní vůči rotaci (jejich absolutní orientace není podstatná, důležitý je pouze úhel mezi nimi), nikoliv však vůči lineární transformaci (závisí na délce vektorů).

Ze skalárního součinu vektorů o délce a je možné odvodit i metriku vzdálenosti podle vztahu

.

(30)

Na výpočtu skalárního součinu je založena i metrika kosinové podobnosti, která předpokládá, že oba vektory jsou normovány, tedy mají jednotkovou délku. Platí

,

(31)

kde  je norma (délka) vektoru xi, určená podle vztahu (17). To znamená, že platí vše výše uvedené pro skalární součin s tím, že délka obou vektorů je jednotková, tj. a = 1. Hodnoty podobnosti  jsou pak rovny kosinu úhlu mezi oběma vektory .

Pearsonův korelační koeficient, známá statistická míra definovaná výrazem

,

(32)

kde představují j-tou souřadnici vektoru  je střední hodnota určená ze souřadnic vektoru . Vektory  se obvykle nazývají diferenční vektory. Podobně jako v případě kosinové podobnosti, nabývá Pearsonův korelační koeficient hodnot z intervalu , rozdíl vůči kosinové míře podobnosti je ten, že určuje vztah nikoliv vektorů x1 a x2, nýbrž jejich diferenčních variant.

I z hodnot Pearsonova korelačního koeficientu lze určit vzdálenost obou vektorů pomocí metriky

,

(33)

jejíž hodnoty se, díky dělení dvěma, vyskytují v intervalu . Tato metrika se používá např. při analýze dat genové exprese.

Tanimotova metrika podobnosti je další, celkem běžně používaná metrika podobnosti. Pro sloupcové vektory x1 a x2 je definovaná vztahem

.

(34)

Přičteme-li a odečteme-li ve jmenovateli výraz x1Tx2 a podělíme-li čitatele i jmenovatele zlomku toutéž hodnotou, dostaneme

.

(35)

Tanimotova podobnost vektorů x1 a x2 je tak nepřímo úměrná kvadrátu Euklidovy vzdálenosti vektorů x1 a x2 vztažené k jejich skalárnímu součinu. Pokud skalární součin považujeme za míru korelace obou vektorů, můžeme formulovat výše uvedené konstatování tak, že hodnota podobnosti sT(x1, x2) je nepřímo úměrná kvadrátu Euklidovy vzdálenosti podělenému velikostí jejich korelace, což znamená, že je korelaci, jako míře podobnosti přímo úměrná.

Konečně poslední z prakticky užitečných metrik podobnosti je metrika definovaná vztahem

.

(36)

Maximální hodnota podobnosti podle metriky  je rovna jedné, když x1 = x2 a svého minima, tj. , když .

Příklad 4.1

Dokažte uvedené vlastnosti metriky podle vztahu (36) ve dvourozměrném prostoru.

Řešení:

Je uvedeno, že maximální hodnoty podobnosti nabývá metrika v případě, kdy x1 = x2, tj. ve dvourozměrném prostoru, když se rovnají obě souřadnice obou vektorů je x11 = x21 = x1 a x12 = x22 = x2. Tehdy je s využitím vztahů (12) a (17).

Vzhledem k nulovému čitateli ve zlomku je výsledná hodnota podobnosti  rovna jedné, právě jak bylo konstatováno. V případě, že x1 = -x2, předpokládáme značení x11 = x1 a x21 = -x1. Podobně x12 = x2 a x22 = -x2. Za těchto formálních podmínek je podobnost

tak, jak bylo uvedeno.

 
vytvořil Institut biostatistiky a analýz Masarykovy univerzity | | zpětné odkazy | validní XHTML 1.0 Strict