Zasady uczenia sięPoprzez uczenie sieci rozumiemy działanie, które ma doprowadzić do określonej reakcji na sygnały wejściowe. Uczenie to proces jednorazowy lub składający się z wielu etapów.
Co najważniejsze, uczenie sieci może przebiegać zarówno z nauczycielem, jak i bez nauczyciela.
W przypadku uczenia z nauczycielem znana jest odpowiedź prawidłowa na zadane sieci pytanie, możemy ją więc wykorzystać do skorygowania błędnej decyzji sieci. Przykładem tego typu problemu jest uczenie sieci klasyfikacji danych np. określania czy klient banku o podanej charakterystyce spłaci kredyt.
Podstawowa zasada tej metody uczenia polega na tym, iż dla zadanych danych wejściowych, znana jest pożądana odpowiedź sieci. Wykonanie porównania z odpowiedzią udzieloną przez sieć pozwala ustalić błąd. Jego wielkość może zostać wykorzystana do korekty działania sieci. Nazwa metody oddaje jej charakter - kluczowym założeniem jest możliwość skorzystania z gotowych, poprawnych odpowiedzi - a więc wiedzy "nauczyciela".
- Ciekawym rodzajem uczenia jest uczenie bez nauczyciela. W takim przypadku nie znamy prawidłowej odpowiedzi, a zadaniem sieci jest jej ustalenie. Przykładem może być ustalanie granic pomiędzy różnymi klasami obrazów. W tym przypadku sieć musi posiadać mechanizm autoadaptacyjny.
Taka metoda uczenia jest również nieobca człowiekowi. Każda próba samodzielnej analizy nowych zjawisk i ustalenia reguł nimi rządzących to uczenie bez nauczyciela - czyli bez znanych rozwiązań.
Prosty, a jednocześnie ważny przykład uczenia z nauczycielem to uczenie dla problemu klasyfikacji danych chorobowych:
- niech zbiór danych na temat 250 pacjentów zawiera dane potrzebne do postawienia diagnozy i prawidłową diagnozę
- wtedy ucząc sieć stawiania diagnozy możemy postępować następująco:
- sprawdzamy diagnozę wyliczoną przez sieć
- porównujemy ją ze znaną prawidłową diagnozą
- wyznaczony błąd diagnozy wykorzystujemy do skorygowania działania sieci i kontynuujemy uczenie dla kolejnych danych
[ Początek strony ] [ MiNIWyklady ]
Wszystkie prawa zastrzeżone © 2000 Wydział Matematyki i Nauk Informacyjnych Politechniki Warszawskiej