Slovník | Vyhledávání | Mapa webu
 
Analýza a hodnocení biologických datVícerozměrné metody pro analýzu a klasifikaci dat Podobnosti a vzdálenosti ve vícerozměrném prostoru Základní vymezení pojmů

Logo Matematická biologie

Základní vymezení pojmů

Vzdálenost i podobnost jsou konkrétní hodnoty vyjadřující vztah dvou bodů v prostoru (vektorů, objektů), které stanovíme pomocí určitého specifického předpisu (algoritmu, funkce), tzv. metriky. Vzdálenost můžeme považovat za míru nepodobnosti. Čím je vzdálenost mezi dvěma body větší, tím méně jsou si podobny. Podobnost je tedy duální mírou ke vzdálenosti – čím je podobnost dvou objektů větší, tím bližší si tyto objekty jsou.

Vysvětlení pojmu 2.1

Metrikou D na  nazýváme takovou funkci D: , kde je n-rozměrný prostor a R je množina reálných čísel, splňující následující předpoklady:
(1)
a má následující vlastnosti
 (symetrie);
D(x,y) = D0 když a jen když x = y (totožnost).                                                       (2)
 Pokud navíc platí i trojúhelníková nerovnost
                                                               (3)
nazýváme metriku pravou metrikou. Prostor , ve kterém je metrika D definována, označujeme jako metrický prostor. Vzdálenost je pak hodnota určená podle metriky.

Konstanta D0 je tomto případě definována velice obecně. V praktických případech je rovna nule, což znamená, že vzdálenost nabývá nezáporných hodnot s tím, že pokud jsou oba vektory totožné, je vzdálenost nulová (viz vztah (2)).

Vysvětlení pojmu 2.2

Metrikou podobnosti S na je taková funkce S: , kde je opět n-rozměrný prostor a R je množina reálných čísel, splňující následující předpoklady:

(4)
a má stejně jako v předešlém případě následující vlastnosti

 (symetrie)

a

S(x,y) = S0 když a jen když x = y (totožnost).

(5)

V případě trojúhelníkové nerovnosti je situace poněkud složitější. Vztahy primárně vycházejí ze vztahu pro trojúhelníkovou nerovnost definovanou pro metriku vzdálenosti a její konkrétní tvar pro metriku podobnosti souvisí se základním vztahem mezi podobností a vzdáleností. Tento, jak bylo dříve uvedeno, duální vztah může být vyjádřen např. pomocí následujících formulí:

;

(6)

,

(7)

nebo

S = c - D, když .

(8)

Pokud se hodnoty vzdáleností pohybují v intervalu , pak v případě vztahu (6) se hodnoty podobnosti nacházejí také v tomto intervalu a výraz pro trojúhelníkovou nerovnost (3) se transformuje do tvaru

(9)

Řídí-li se relace mezi vzdáleností a podobností vztahem (7), pak se hodnoty podobnosti vyskytují v intervalu a trojúhelníková nerovnost má tvar

(10)

Konečně, v případě formule (8) spadají hodnoty podobnosti do intervalu  a trojúhelníková nerovnost se změní na

(11)
 
vytvořil Institut biostatistiky a analýz Lékařské fakulty Masarykovy univerzity