Analýza a hodnocení biologických datUmělá inteligence Neuronové sítě - Perceptrony Vícevrstvý perceptron Klasifikační možnosti vícevrstvého perceptronu - Kolmogorova věta

Umělá inteligence |

Úvod |

Výstupy z výukové jednotky | Umělá inteligence |

Co je to umělá inteligence, definice | Inteligentní stroje | Slabá a silná UI |

Posouzení inteligence strojového algoritmu |

Turingův test | Čínský pokoj | Uplatnění UI |

Literatura |

Expertní systémy |

Výstupy z výukové jednotky | Expertní systém (ES) | Komponenty expertních systémů | Pravidlové expertní systémy |

Reprezentace znalostí | Inference, dopředné a zpětné řetězení | Výhody a nevýhody pravidlových ES |

Nepravidlové expertní systémy |

Sémantické sítě | Rámce a objekty |

Neurčitost v ES |

Podmíněná pravděpodobnost | Damsterova-Shaferova teorie | Fuzzy množiny |

Literatura |

Prohledávání stavového prostoru |

Výstupy z výukové jednotky | Úvod | Definice stavového prostoru |

Reprezentace stavového prostoru | Úloha ve stavovém prostoru |

Metody prohledávání |

Hodnocení metod | Neinformované prohledávání |

Informované heuristické prohledávání |

Hladový algoritmus | Metoda A* |

Lokální metody prohledávání |

Literatura |

Neuronové sítě - jednotlivý neuron |

Výstupy z výukové jednotky | Úvod do neuronových sítí |

Biologická analogie | Historie NN | Koncept umělé neuronové sítě |

Jednotlivý neuron |

Matematický model a aktivní dynamika neuronu |

Adaptační dynamika neuronu |

Klasifikační schopnosti jednotlivého neuronu |

Realizace logické funkce AND | Realizace logických funkcí OR a NOT | Realizace logické funkce XOR | Souhrn klasifikačních schopností jednotlivého neuronu |

Literatura |

Neuronové sítě - Perceptrony |

Výstupy z výukové jednotky | Dopředné neuronové sítě |

Úvod | Dynamika neuronové sítě | Historický Rosenblattův perceptron |

Jednovrstvý perceptron |

Klasifikační možnosti | Organizační, aktivní a adaptační dynamika |

Vícevrstvý perceptron |

Organizační a aktivní dynamika | Ilustrace klasifikačních možnosti vícevrstvého perceptronu | Klasifikační možnosti vícevrstvého perceptronu - Kolmogorova věta | Adaptační dynamika | Algoritmus zpětného šíření chyby (BP algoritmus) | Minimalizace chybové funkce adaptačním algoritmem | Vícevrstvý perceptron a syndrom přeučení |

Literatura |

Sítě se vzájemnými vazbami |

Výstupy z výukové jednotky | Obecná charakteristika umělých neuronových sítí se vzájemnými vazbami | Hopfieldova síť |

Organizační dynamika |

Stav Hopfieldovy sítě |

Aktivní dynamika Hopfieldovy sítě |

Energetická funkce | Stavová mapa přechodů |

Adaptační dynamika |

Hebbovo pravidlo pro Hopfieldovu síť | Nastavení nerovnostmi |

Boltzmannův stroj |

Organizační dynamika | Aktivní dynamika |

Obousměrná asociativní paměť |

Organizační dynamika | Adaptační dynamika | Aktivní dynamika |

Literatura |

Soutěživé sítě |

Výstupy z výukové jednotky | Jednoduchá soutěživá síť MAXNET |

Organizační dynamika | Adaptační dynamika | Aktivní dynamika |

Hammingova síť |

Adaptační dynamika | Aktivní dynamika |

Samoorganizující se mapy |

Kohonenova samoorganizační mapa –učení s učitelem | Jednoduchá samoorganizační mapa | Adaptační dynamika jednoduché samoorganizační mapy | Kohonenova samoorganizační mapa | Kohonenova samoorganizační mapa – adaptační dynamika |

Literatura |

Úvod do genetických algoritmů (GA) |

Výstupy z výukové jednotky | Základní pojmy genetických algoritmů |

Mutace | Základní pojmy | Operátor selekce |

Křížení |

Úlohy GA |

GA souhrn | Souvislost GA a NN |

Literatura |

Podklady pro výuku |

Klasifikační možnosti vícevrstvého perceptronu - Kolmogorova věta

Při vyjádření klasifikačních schopností a výpočetní síly vícevrstvých perceptronů můžeme vyjít z Kolmogorovy věty, která říká:

„Každou vícerozměrnou reálnou spojitou funkci -proměnných lze přesně vyjádřit jako lineární kombinaci konečného počtu spojitých nelineárních funkcí jedné proměnné.“

(4)

kde jsou nelineární funkce jedné proměnné.

Pokud budeme uvedenou větu vnímat v oblasti realizace umělých neuronových sítí a budeme hledat analogii, zjistíme, že vícevrstvý perceptron poskytuje pro realizaci uvedené věty dostatek prostředků. Jednotlivé nelineární funkce požadované Kolmogorovou větou mohou být realizovány pomocí nelineárních, například sigmoidálních funkcí jednotlivých neuronů. Lineární kombinace a tedy sumační vztahy Kolmogorovy věty pak odpovídají výpočtu aktivační funkce jednotlivých neuronů skrytých vrstev.

Uvedený vztah tedy vlastně odpovídá výpočtu, který realizuje vícevrstvý perceptron s vstupními neurony, neurony první skryté vrstvy s funkcemi neurony druhé skryté vrstvy s funkcemi a jedním neuronem výstupním. Podmínkou je použití neuronů se spojitými, monotónně rostoucími aktivačními funkcemi ve skrytých vrstvách.

Kolmogorovu větu lze formulovat ještě obecněji, dle [1].

(5)

kde tedy došlo ke zmírnění požadavků na obecně různé aktivační přenosové funkce neuronů v jednotlivých vrstvách a nahrazení obecně různých funkcí v různých vrstvách pouze funkcí a jejím násobením koeficientem

Obr. 14. Kolmogorova věta pro vícevrstvý perceptron

Poněkud problematická může být dle [1] volba funkcí a neboť pro přesnou aproximaci funkce mohou mít tyto hledané funkce vlastnosti, které neumožňují jejich použití jako přechodové výstupní funkce neuronu, protože funkce nejsou obecně hladké.

I přes relativizaci platnosti výše uvedeného závěru Kolmogorovy věty pro vícevrstvý perceptron (nepoužitelnost obecných funkcí jako přenosových funkcí neuronu), bylo dokázáno [3], že zmnožením počtu neuronů ve skrytých vrstvách je možné dosáhnut univerzální aproximační schopnosti vícevrstvého perceptronu, pokud se spokojíme pouze s libovolně přesnou aproximací funkce nikoli jejím naprosto přesným vyjádřením.

Důsledek Kolmogorovy věty pro vícevrstvý perceptron můžeme shrnout tak, že vícevrstvý perceptron se dvěma skrytými vrstvami, dostatečným počtem neuronů se spojitými monotónně rostoucími aktivačními funkcemi může být univerzálním aproximátorem libovolné funkce N proměnných. To představuje značnou výpočetní sílu. Dokonce tak velkou, že pro řadu reálných problémů při jejich přibližném řešení vystačíme s klasifikací do lineárně separabilních množin.

V případě perceptronu dvouvrstvého, tedy perceptronu s jednou skrytou vrstvou, pak můžeme vyjít z výsledků Hornika a Leshna, publikovaných v [1].

Z jejich závěrů plyne, že vícevrstvý perceptron s jednou skrytou vrstvou, dostatečným počtem neuronů (zdá se ) a nepolynomiálními (sigmoidálními) aktivačními funkcemi neuronů skryté vrstvy je univerzálním aproximátorem libovolné funkce proměnných.

vytvořil Institut biostatistiky a analýz Lékařské fakulty Masarykovy univerzity